其他分享
首页 > 其他分享> > 蓝鲸6.03部署[部署方案优化]

蓝鲸6.03部署[部署方案优化]

作者:互联网

系统版本IP配置主机名
CentOS Linux release 7.4.1708192.168.1.664核4g40G磁盘node1
CentOS Linux release 7.4.1708192.168.1.1604核4g40G磁盘node2
CentOS Linux release 7.4.1708192.168.1.2024核4g40G磁盘node3

优化:

# 1. 腾讯云yum源
#rm -f /etc/yum.repos.d/*
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.cloud.tencent.com/repo/centos7_base.repo
wget -O /etc/yum.repos.d/epel.repo http://mirrors.cloud.tencent.com/repo/epel-7.repo

# 2.selinux关闭
sed -i 's/enforcing/disabled/' /etc/selinux/config
chattr -i /etc/resolv.conf
setenforce 0

# 3.swap关闭/启动【资源不足请开启swap】
#swapoff -a
#echo "swapoff -a" >>/etc/profile
#sed -ri 's/.*swap.*/#&/' /etc/fstab
#source /etc/profile
开启swap:
#启动10G的swap:
dd if=/dev/zero of=/swapfile bs=1M count=10240
mkswap /swapfile
swapon /swapfile
echo 80 > /proc/sys/vm/swappiness
free -m


# 4. 文件描述符
cat << EOF >> /etc/security/limits.conf
root soft nofile 102400
root hard nofile 102400
EOF

#/etc/profile 新增:
echo 'ulimit -SHn 65536' >>/etc/profile
source /etc/profile
命令行: source /etc/profile

# 5. 关闭防火墙
systemctl stop firewalld    # 停止 firewalld
systemctl disable firewalld # 禁用 firewall 开机启动

# 6. 添加nameserver
sed -i '1inameserver 127.0.0.1' /etc/resolv.conf


# 7. 优化时间
#时间同步
yum install -y ntpdate
ntpdate -d cn.pool.ntp.org

# 8. 安装rsync
yum -y install rsync

软件包:

##准备安装包 放在目录中[/data]:
bcs_ce-6.0.9.tgz
bkce_co_package-6.0.3.tgz
bk_sops_co_package-6.0.3.dat
bkce_basic_suite-6.0.3.tgz
ssl_certificates.tar.gz [证书]

#解包 bkce_basic_suite-6.0.3.tgz
mkdir -p /data/
tar xf bkce_basic_suite-6.0.3.tgz -C /data


#解包:
cd /data/src/; for f in *gz;do tar xf $f; done


#1. 修改安装时的内存分配问题:
 在中控机上修改脚本:/data/install/bin/install_es.sh 
 JVM_MEM=$(awk '/MemAvailable/{print int($2/1024/1024/2)}' /proc/meminfo) 给定一个较小值
 如:JVM_MEM=2 建议
 
#2. 修改saas模板的线程数 
 在中控机上修改模板文件:/data/src/paas_agent/paas_agent/etc/templates/docker/uwsgi.ini
将"workers = 16" 改成"workers = 8"

#3. 修改超时时间
在中控机上修改模板文件:
/data/src/open_paas/support-files/templates/paas#conf#settings_production.py.tp
任意位置添加:  EVENT_STATE_EXPIRE_SECONDS = 3600
/data/src/paas_agent/support-files/templates/#etc#paas_agent_config.yaml.tpl
EXECUTE_TIME_LIMIT: 300 改为 EXECUTE_TIME_LIMIT: 30000(考虑到咱们机器慢,可以加大这个时间)


#部署配置文件建议:
10.0.0.1 iam,ssm,usermgr,gse,license,redis,consul,mysql
10.0.0.2 nginx,consul,mongodb,rabbitmq,appo
10.0.0.3 paas,cmdb,job,zk(config),appt,consul,nodeman(nodeman)


1. 首先安装监控,中控机第一台,列表为所有服务器,安装包:/data/bkmonitorv3_package-3.3.1731.tgz
[bkmonitorv3]
10.0.0.3 kafka(config),monitorv3(transfer)
10.0.0.2 influxdb(bkmonitorv3),monitorv3(influxdb-proxy),monitorv3(grafana)
10.0.0.1 es7,monitorv3(monitor)

2. [bklog] 监控安装到第二台,列表只有第二台
[bklog]
10.0.0.2 log(api),log(grafana)

3. [fta] 故障治愈安装到第二台,列表只有第二台
10.0.0.2 fta,beanstalk



#获取证书,解压证书:
#准备要用的服务器mac [安装gse的服务器mac]
#服务器 cat /sys/class/net/eth0/address 获取mac地址
#进入: https://bk.tencent.com/download_ssl/ 粘贴mac,下载所需的mac地址
#ssl_certificates.tar.gz 上传到到 /data 目录

install -d -m 755 /data/src/cert
tar xf /data/ssl_certificates.tar.gz -C /data/src/cert/
chmod 644 /data/src/cert/*


#拷贝 rpm 包文件夹到 /opt/ 目录 
cp -a /data/src/yum /opt

准备配置文件

#准备 install.config 文件

cat << EOF >/data/install/install.config
10.0.6.21 iam,ssm,usermgr,gse,license,redis,consul,mysql
10.0.6.22 nginx,consul,mongodb,rabbitmq,appo
10.0.6.23 paas,cmdb,job,zk(config),appt,consul,nodeman(nodeman)
EOF

自定义域名和登录密码

cd /data/install
./configure -d wh02.com

cat > /data/install/bin/03-userdef/usermgr.env << EOF
BK_PAAS_ADMIN_PASSWORD=admin
EOF

初始化并检查环境

#免密:
cd /data/install
bash /data/install/configure_ssh_without_pass


##修改超时时间 https://bk.tencent.com/s-mart/community/question/1405

#1. 中控机
vim /data/src/open_paas/support-files/templates/paas#conf#settings_production.py.tpl
尾部加入:
EVENT_STATE_EXPIRE_SECONDS = 50000

vim /data/src/paas_agent/support-files/templates/#etc#paas_agent_config.yaml.tpl
修改参数:
EXECUTE_TIME_LIMIT: 50000


#2. nodeman服务器
vim /data/bkce/paas_agent/paas_agent/etc/paas_agent_config.yaml
修改为:
EXECUTE_TIME_LIMIT: 30000

vim /data/bkce/open_paas/paas/conf/settings_production.py 尾部加入:
EXECUTE_TIME_LIMIT=6000



# 初始化环境
./bk_install common


# 校验环境和部署的配置
./health_check/check_bk_controller.sh

部署 PaaS 平台

# 安装 PaaS 平台及其依赖服务
./bk_install paas

# 部署 SaaS 运行环境,正式环境及测试环境
./bk_install app_mgr

# 权限中心
./bk_install saas-o bk_iam

# 用户管理
./bk_install saas-o bk_user_manage


# 安装配置平台及其依赖服务
./bk_install cmdb

# 安装作业平台后台模块及其依赖组件
./bk_install job

部署平台

1. 进入节点管理,部署好对应节点agent

2. 导入流程

标准运维中导入项目流程

部署监控平台 [bkmonitorv3]

#修改超时时间
https://bk.tencent.com/s-mart/community/question/1405

开始部署监控平台作业:

选择 [ce][deploy][bkmonitorv3] 流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。

填写信息包括:

部署日志平台

日志平台
选择 [ce][deploy][bklog] 流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。

填写信息包括:

ctrl_ip:基础环境的中控机 IP
whole_pkg_path:部署日志平台安装包的绝对路径 /data/bklog_package-4.2.580.tgz
deply_iplist:新增的机器 IP(如果基础环境的资源有富余,可以复用)
bklog_template

该部署流程主要相关操作:

将日志平台安装包放至指定目录
生成日志平台 install.config 配置
初始化新增节点机器
授权日志平台所需的 MySQL 访问权限
安装日志平台相关依赖、日志平台后台、日志平台 SaaS

部署故障之余

故障自愈
选择 [ce][deploy][fta] 流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。

该部署流程主要相关操作:

ctrl_ip:基础环境的中控机 IP
whole_pkg_path:部署故障自愈安装包的绝对路径 /data/fta_package-5.2.14-ce.tgz
deply_iplist:新增的机器 IP(如果基础环境的资源有富余,可以复用)

部署完成后结果:

标签:paas,10.0,部署,6.03,蓝鲸,bk,etc,install,data
来源: https://blog.51cto.com/90xpy/2831767