蓝鲸6.03部署[部署方案优化]
作者:互联网
系统版本 | IP | 配置 | 主机名 |
---|---|---|---|
CentOS Linux release 7.4.1708 | 192.168.1.66 | 4核4g40G磁盘 | node1 |
CentOS Linux release 7.4.1708 | 192.168.1.160 | 4核4g40G磁盘 | node2 |
CentOS Linux release 7.4.1708 | 192.168.1.202 | 4核4g40G磁盘 | node3 |
优化:
# 1. 腾讯云yum源 #rm -f /etc/yum.repos.d/* wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.cloud.tencent.com/repo/centos7_base.repo wget -O /etc/yum.repos.d/epel.repo http://mirrors.cloud.tencent.com/repo/epel-7.repo # 2.selinux关闭 sed -i 's/enforcing/disabled/' /etc/selinux/config chattr -i /etc/resolv.conf setenforce 0 # 3.swap关闭/启动【资源不足请开启swap】 #swapoff -a #echo "swapoff -a" >>/etc/profile #sed -ri 's/.*swap.*/#&/' /etc/fstab #source /etc/profile 开启swap: #启动10G的swap: dd if=/dev/zero of=/swapfile bs=1M count=10240 mkswap /swapfile swapon /swapfile echo 80 > /proc/sys/vm/swappiness free -m # 4. 文件描述符 cat << EOF >> /etc/security/limits.conf root soft nofile 102400 root hard nofile 102400 EOF #/etc/profile 新增: echo 'ulimit -SHn 65536' >>/etc/profile source /etc/profile 命令行: source /etc/profile # 5. 关闭防火墙 systemctl stop firewalld # 停止 firewalld systemctl disable firewalld # 禁用 firewall 开机启动 # 6. 添加nameserver sed -i '1inameserver 127.0.0.1' /etc/resolv.conf # 7. 优化时间 #时间同步 yum install -y ntpdate ntpdate -d cn.pool.ntp.org # 8. 安装rsync yum -y install rsync
软件包:
##准备安装包 放在目录中[/data]: bcs_ce-6.0.9.tgz bkce_co_package-6.0.3.tgz bk_sops_co_package-6.0.3.dat bkce_basic_suite-6.0.3.tgz ssl_certificates.tar.gz [证书] #解包 bkce_basic_suite-6.0.3.tgz mkdir -p /data/ tar xf bkce_basic_suite-6.0.3.tgz -C /data #解包: cd /data/src/; for f in *gz;do tar xf $f; done #1. 修改安装时的内存分配问题: 在中控机上修改脚本:/data/install/bin/install_es.sh JVM_MEM=$(awk '/MemAvailable/{print int($2/1024/1024/2)}' /proc/meminfo) 给定一个较小值 如:JVM_MEM=2 建议 #2. 修改saas模板的线程数 在中控机上修改模板文件:/data/src/paas_agent/paas_agent/etc/templates/docker/uwsgi.ini 将"workers = 16" 改成"workers = 8" #3. 修改超时时间 在中控机上修改模板文件: /data/src/open_paas/support-files/templates/paas#conf#settings_production.py.tp 任意位置添加: EVENT_STATE_EXPIRE_SECONDS = 3600 /data/src/paas_agent/support-files/templates/#etc#paas_agent_config.yaml.tpl EXECUTE_TIME_LIMIT: 300 改为 EXECUTE_TIME_LIMIT: 30000(考虑到咱们机器慢,可以加大这个时间) #部署配置文件建议: 10.0.0.1 iam,ssm,usermgr,gse,license,redis,consul,mysql 10.0.0.2 nginx,consul,mongodb,rabbitmq,appo 10.0.0.3 paas,cmdb,job,zk(config),appt,consul,nodeman(nodeman) 1. 首先安装监控,中控机第一台,列表为所有服务器,安装包:/data/bkmonitorv3_package-3.3.1731.tgz [bkmonitorv3] 10.0.0.3 kafka(config),monitorv3(transfer) 10.0.0.2 influxdb(bkmonitorv3),monitorv3(influxdb-proxy),monitorv3(grafana) 10.0.0.1 es7,monitorv3(monitor) 2. [bklog] 监控安装到第二台,列表只有第二台 [bklog] 10.0.0.2 log(api),log(grafana) 3. [fta] 故障治愈安装到第二台,列表只有第二台 10.0.0.2 fta,beanstalk #获取证书,解压证书: #准备要用的服务器mac [安装gse的服务器mac] #服务器 cat /sys/class/net/eth0/address 获取mac地址 #进入: https://bk.tencent.com/download_ssl/ 粘贴mac,下载所需的mac地址 #ssl_certificates.tar.gz 上传到到 /data 目录 install -d -m 755 /data/src/cert tar xf /data/ssl_certificates.tar.gz -C /data/src/cert/ chmod 644 /data/src/cert/* #拷贝 rpm 包文件夹到 /opt/ 目录 cp -a /data/src/yum /opt
准备配置文件
#准备 install.config 文件 cat << EOF >/data/install/install.config 10.0.6.21 iam,ssm,usermgr,gse,license,redis,consul,mysql 10.0.6.22 nginx,consul,mongodb,rabbitmq,appo 10.0.6.23 paas,cmdb,job,zk(config),appt,consul,nodeman(nodeman) EOF
自定义域名和登录密码
cd /data/install ./configure -d wh02.com cat > /data/install/bin/03-userdef/usermgr.env << EOF BK_PAAS_ADMIN_PASSWORD=admin EOF
初始化并检查环境
#免密: cd /data/install bash /data/install/configure_ssh_without_pass ##修改超时时间 https://bk.tencent.com/s-mart/community/question/1405 #1. 中控机 vim /data/src/open_paas/support-files/templates/paas#conf#settings_production.py.tpl 尾部加入: EVENT_STATE_EXPIRE_SECONDS = 50000 vim /data/src/paas_agent/support-files/templates/#etc#paas_agent_config.yaml.tpl 修改参数: EXECUTE_TIME_LIMIT: 50000 #2. nodeman服务器 vim /data/bkce/paas_agent/paas_agent/etc/paas_agent_config.yaml 修改为: EXECUTE_TIME_LIMIT: 30000 vim /data/bkce/open_paas/paas/conf/settings_production.py 尾部加入: EXECUTE_TIME_LIMIT=6000 # 初始化环境 ./bk_install common # 校验环境和部署的配置 ./health_check/check_bk_controller.sh
部署 PaaS 平台
# 安装 PaaS 平台及其依赖服务 ./bk_install paas # 部署 SaaS 运行环境,正式环境及测试环境 ./bk_install app_mgr # 权限中心 ./bk_install saas-o bk_iam # 用户管理 ./bk_install saas-o bk_user_manage # 安装配置平台及其依赖服务 ./bk_install cmdb # 安装作业平台后台模块及其依赖组件 ./bk_install job
部署平台
1. 进入节点管理,部署好对应节点agent
2. 导入流程
标准运维中导入项目流程
部署监控平台 [bkmonitorv3]
#修改超时时间 https://bk.tencent.com/s-mart/community/question/1405
开始部署监控平台作业:
选择 [ce][deploy][bkmonitorv3]
流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。
填写信息包括:
ctrl_ip
:基础环境的中控机 IPwhole_pkg_path
:部署监控平台安装包的绝对路径/data/bkmonitorv3_package-3.3.1731.tgz
deply_iplist
:新增的机器 IP(如果基础环境的资源有富余,可以复用)
部署日志平台
日志平台
选择 [ce][deploy][bklog] 流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。
填写信息包括:
ctrl_ip:基础环境的中控机 IP
whole_pkg_path:部署日志平台安装包的绝对路径 /data/bklog_package-4.2.580.tgz
deply_iplist:新增的机器 IP(如果基础环境的资源有富余,可以复用)
bklog_template
该部署流程主要相关操作:
将日志平台安装包放至指定目录
生成日志平台 install.config 配置
初始化新增节点机器
授权日志平台所需的 MySQL 访问权限
安装日志平台相关依赖、日志平台后台、日志平台 SaaS
部署故障之余
故障自愈
选择 [ce][deploy][fta] 流程模版进行新建任务,根据提示填写相关信息。确认填写信息无误后,开始执行任务。
该部署流程主要相关操作:
ctrl_ip:基础环境的中控机 IP
whole_pkg_path:部署故障自愈安装包的绝对路径 /data/fta_package-5.2.14-ce.tgz
deply_iplist:新增的机器 IP(如果基础环境的资源有富余,可以复用)
部署完成后结果:
标签:paas,10.0,部署,6.03,蓝鲸,bk,etc,install,data 来源: https://blog.51cto.com/90xpy/2831767