其他分享
首页 > 其他分享> > 一种大数据物理机集群的自动化运维管理办法

一种大数据物理机集群的自动化运维管理办法

作者:互联网

大数据集群的物理机部署形态,相对于公有云/混合云的云主机部署形态,在自动化发放集群、弹性伸缩等云化场景方面处于劣势,但物理机部署形态的大数据集群能够更加充分高效的利用服务器资源,不存在云化/虚拟化的开销,同时服务器的异构能力更强。

早期交付的很多大数据集群均是物理机部署形态,如浙江移动大数据集群、广东移动大数据集群、工行大数据集群、招行大数据集群等。

针对这些存量大数据集群,以下介绍一种自动化运维管理办法,来提升运维效率、集群资源利用率,降低集群的资源消耗。

该自动化运维管理办法包含以下4个方面的功能:

1、根据组件特点选择最适合服务器类型来部署、扩容或更换:

2、组件参数根据作业负载情况自适应重设:根据实际作业运行的特点情况,自动化、最优化的设置组件/软件参数,这些参数和硬件服务器无关,但和实际作业运行的需求有关,其目的是把服务器资源最大化利用,以保证组件的高性能。

3、组件单节点性能及组件所在服务器的资源占用率的监控:

4、集群服务器自适应负载进行弹性伸缩管理:

本文由华为云发布。

标签:运维,集群,IO,自动化,组件,服务器,占用率,资源
来源: https://www.cnblogs.com/huaweicloud/p/16055535.html