前言
今天和大家分享一通过自己团队的能力,不依赖外部技术支持和厂商支持,完成O系数据库集群水平横向扩展的典型案例。望能给各位小伙伴对于存量数据库性能提升带来一点思路。
O系ERP系统是集团公司使用的核心业务系统之一,该系统承载着在核心业务和财务总账等重要任务。随着业务的飞速发展数据量已到达15T,每日均请求13000次,活跃用户6000人,系统初期上线时就考虑到核心ERP系统非常重要,因此对O系数据库采用RAC双机集群模式,结合一体机的全闪存储,infiniband高带宽网络结构,极大的保证了系统性能,但是随着数据量不断的增长,系统也逐步出现了月结期间压力升高导致运行性能缓慢的问题。应该说这是一种数据库系统随着数据量增大,必然会面临的问题。那么怎么能较好地处理此类问题呢?
一种简单的方案,就是全面替换现有数据库硬件环境,全面提升性能,但是这种方案动静大,投入大,简单粗暴,其实,O系数据库集群本来就具备横向能力扩展的功能,因此,横向扩展数据库集群,不失为一种数据库性能提升的优化方案,投入小,见效快,在一定范围内,能有效帮助用户提升因数据库性能瓶颈带来的系统性能问题。
由于中美关系恶化等原因O系公司所有产品目前在到期后无法获得任何原厂维保服务,所以我们运维团队针对该问题进行了深入的分析,从控制投入成本角度,在没有任何软硬件原厂支持情况下,通过团队的技术能力,出色的完成了数据库优化扩展工作。经月结测试,最终获得满意效果,硬件资源使用率下降,系统整体性能和用户使用体验得到提升。
统御运维部主要服务如下:
桌面、应用、系统、主机、虚拟化、存储、数据库、网络、安全等等各种运维项目。
硬件升级、系统集成、云服务、网络、数据库、安全等等各种实施项目。
对内以合适的价格为客户定制、提供合理可靠的方案、提供精湛的技术支撑、让用户放心省心。欢迎各分子公司共同探讨、合作。一起为国控IT发展出一份力。
下面就对本次O系数据库横向扩展做一个简单的分享,希望给各位小伙伴们一点启发。
现状问题
在今年初用户就一直反映系统使用卡顿尤其在月结期间。数据库是O系数据库采用RAC双机集群模式,硬件是跑在一套曙光一体机上,只要卡顿时数据库服务器的CPU间歇性满负荷运行(CPU平均使用率大于70%)如下图:
随着用户数和数据量的增加,ERP系统日请求峰值从2017年一体机上线的6000多至今13000多,form也从1500多至今5000。如下图:
2019年至2023年期间,数据量从8T一直增长至15T。如下图:
解决方案
针对当前ERP系统软件层面无法优化的条件,判断硬件方案可行性决定增加一个RAC集群节点。首先对当前一体机进行摸底,在没有任何原厂支持的黑盒情况下搞清楚架构和技术细节,再通过对应配置清单找到相关横向扩展的匹配硬件规格。
接下分成以下下几步来实施:
- 主机上架,检测硬件,硬件跳线
- 操作系统安装,固件升级
- Infiniband交换机调试
- 操作系统依赖包,用户目录创建
- 用户等效性设置,数据库软件安装
- 存储映射主机
- 添加节点,跑脚本升级
在预定的时间内完成项目,如下图:
最终将原来的2节点扩充到3节点RAC集群,水平扩展使得计算节点增加,提供更多的CPU和内存资源,使系统能同时处理更多的ERP请求。项目实施后的ERP系统架构,如下图:
实施成果
增加Rac节点后CPU使用率从原来的高峰时间70%下降到40%。如下图:
小结
最后感谢运维团队每一个同事,是他们的专业才让本次性能扩展顺利完成,同时也感谢各级领导信任和支持。随着集团公司数字化转型的加速推进,不管部门和公司如何变化还是那句话:运维部门是本着服务于内部客户,依靠过硬的技术,脚踏实地做事,有凝聚力的团队。欢迎大家多来技术讨论