OpenInfra峰会首日 浪潮联合英特尔发布大规模部署技术白皮书


源:浪潮服务器官方微信

11月4-6日,开放基础设施开源峰会在上海举行。在峰会的第一天,Wave和英特尔发布了《基于500节点大规模单一集群行业云部署和性能优化白皮书》(以下简称《白皮书》),为社区成员和用户构建更大的单个OpenStack集群提供了详细的指导方针。

作为今年OpenStack领域最具影响力的事件之一,双方基于云海中的InCloud OpenStack 5.6(Rocky)完成的单个集群中500个节点的大规模测试引起了社区的关注。 在大会主旨会议上,OpenStack基金会独立个人董事王庆介绍了大规模测试的概况,并将测试评估为OpenStack发展中的一个重要里程碑事件,这将为OpenStack登陆大规模甚至超大规模云构建场景提供参考。

OpenStack基金会独立董事王庆介绍“大规模、开放、敏捷成为行业云的新特征”主旨的大规模测试概述

目前,云计算在电信、交通、能源、金融等行业的规模不断提高,大规模和超大规模行业对云部署的需求更加迫切。周期性强的业务系统,如在线金融产品和城市轨道交通系统,对高性能、高可用性,尤其是云平台的高并发性有着更高的要求。 在这些业务场景的驱动下,行业用户对单一集群规模提出了更高的要求,希望通过部署更多的虚拟机、容器和其他资源来支持更多的工作负载,从而进一步提高信息技术资源的利用率,降低操作和维护管理的复杂性。 以移动云为例,作为中国移动政府企业市场产品和服务的统一入口,三年内节点规模超过20w,需要与5G网络整合。云平台大规模满足云网络集成、按需定制、安全性和稳定性的要求。

《白皮书》指出,单个集群规模增加的好处显而易见,可以实现更高和更灵活的工作负载,提高云平台的可扩展性,并显着降低管理复杂性 然而,构建基于开源技术的大规模行业云仍然面临许多挑战。

首先,开源应用的快速增长带来了工作量的增加,而日益丰富的开源技术堆栈进一步拉大了云平台性能上限和下限之间的差距,优化结果的质量直接关系到性能。

其次,敏捷基础设施已经成为一个重要趋势。大规模行业云将使单个节点的成本增加1,000倍。因此,不断优化性能和加强成本控制非常重要。有必要在软件定义级别轻松分配性能、服务质量和总拥有成本。

最后,在日益活跃的开源技术的全球趋势下,基础设施的开放性至关重要。 研究表明,在中国,86.7%的企业应用了开源技术,10.6%的企业计划应用开源技术。开源技术已经被企业广泛接受,更重要的是将更多的开源技术集成到一个统一的云平台中。

浪潮云海实现了全球最大的单个集群压力测试。

目前,基于社区本地版本的云平台通常规模较小,500个节点超过了峰值负载。在500个节点上成功部署OpenStack的尝试必须经过大量复杂的测试和优化 今年9月,浪潮云海ICOS 5.6成功完成了500个节点的单个集群的测试,这是目前基于OpenStack Rocky版本的单个集群最大的全球实践。

测试结果显示,在高密度和高并发环境测试中,在系统已经加载了20,000个虚拟机的情况下,在60%负载环境下成功创建了1,000个并发虚拟机,在空负载环境下创建了2,000个并发虚拟机 同时,测试验证了大规模集群在极端情况下的高可用性,例如所有节点数据库的灾难恢复和所有控制节点的电源故障,从而最大限度地减少业务中断。

在高性能方面,浪潮从硬件层、操作系统层、网络协议栈、虚拟机管理程序层、开放堆栈应用编程接口服务、数据库、消息队列、分布式存储、访客服务等方面进行了全堆栈优化。系统性能能够满足大规模工业云应用的负载要求

此外,浪潮云海ICOS 5.6还实现了云平台的高效软环境部署和交付,10小时内部署了500个服务器节点系统,5小时内部署了323个OpenStack节点,3小时内部署了77个分布式存储节点,1小时内扩展和重新配置了100个计算节点,一天内交付了500多个节点

目前,浪潮云海ICOS有能力设计一个拥有1000多个节点的单一集群,并在广播电视等客户中成功部署了一个拥有1000多个节点的大型行业云。

此外,在本次峰会上,InCloud OpenStack团队与百度智能云和无锡地铁信息管理部门一起入围超级用户评选。