浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

发布：来源：浪潮信息发布时间：2023-02-21 09:22
第一对焦：浪潮信息

【ZiDongHua之方案应用场：浪潮信息、智算产业、生成式AI 、自然语言AI 、AI大模型训练、 AI服务器、淮海智算中心】针对AI大模型训练的计算特点，浪潮信息AI团队对淮海智算中心算力系统进行了专业设计，对集群架构、高速互联、算力调度等方面进行全面优化，在系统架构上，采用单节点集成8颗加速器的AI服务器，节点内加速器间实现超高速P2P通信，节点间建立极低延迟、超高带宽的Infiniband通信网络。在大模型训练技术层面，成功运用了中文巨量AI模型"源1.0"的训练优化经验，对分布式训练策略进行了针对性优化，通过合理设计张量并行、流水并行和数据并行，精准调整模型结构和训练过程的超参数，最终实现了千亿参数规模AI大模型的训练算力效率达到53.5%。

浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

近日，淮海智算中心携手浪潮信息进行了超大规模参数AI大模型训练性能测试，实测数据表明，千亿参数规模的自然语言AI单体大模型在淮海智算中心计算平台上的训练算力效率达53.5%，刷新了业内AI大模型训练算力效率新高。这意味着淮海智算中心将可为国内生成式AI创新团队提供高性能、高效率的AI大模型训练算力服务。

生成式AI需要基于海量的自然语言或多模态数据集，对拥有巨大参数的超大规模AI模型进行训练，其训练所需AI算力当量非常高，如以PD(Petaflops-Day)为单位来衡量，OpenAI的GPT-3大模型训练的算力当量为3640PD，而浪潮"源1.0"大模型的算力当量则为4095PD。

超大规模AI大模型的训练一般必须在拥有成百上千加速卡的AI服务器集群上进行，如何在AI计算集群上获得更高的训练算力效率则会直接影响到模型训练时长以及算力消耗成本，这对于提升生成式AI研发创新效率有着非常重要的影响。据公开资料表明，GPT-3大模型在其V100 GPU集群上的训练算力效率为21.3%，而浪潮"源1.0"的训练算力效率则达到了44.8%。

针对AI大模型训练的计算特点，浪潮信息AI团队对淮海智算中心算力系统进行了专业设计，对集群架构、高速互联、算力调度等方面进行全面优化，在系统架构上，采用单节点集成8颗加速器的AI服务器，节点内加速器间实现超高速P2P通信，节点间建立极低延迟、超高带宽的Infiniband通信网络。在大模型训练技术层面，成功运用了中文巨量AI模型"源1.0"的训练优化经验，对分布式训练策略进行了针对性优化，通过合理设计张量并行、流水并行和数据并行，精准调整模型结构和训练过程的超参数，最终实现了千亿参数规模AI大模型的训练算力效率达到53.5%。

千亿参数AI模型结构及其实际性能表现

千亿参数AI模型结构及其实际性能表现

淮海智算中心由安徽省宿州市与浪潮共同推进建设，目标是建成技术先进、架构开放、应用丰富、生态完善的国内领先智算枢纽。淮海智算中心将依靠领先的算力、算法基础设施，开放的技术架构，成熟丰富的生态应用，面向全国提供智能算力、数据和算法服务，打造良好的智算产业生态。

资料图：2022年7月29日，安徽省宿州市与浪潮签署战略合作协议，共同推进淮海智算中心建设。淮海智算中心总体投资10亿元，全面建成后智能算力性能可达30亿亿次/秒，将成为技术先进、架构开放、应用丰富、生态完善的国内领先的智算枢纽。来源：智东西。

自动对焦：智算产业生成式AI 自然语言AI AI大模型训练 AI服务器淮海智算中心 MEITONG

咨询详情：如需咨询文中涉及的相关产品或解决方案详情，请加微信：ZiDongHuaX 。

微信联盟：智算产业微信群、生成式AI微信群、自然语言AI微信群、AI大模型训练微信群、AI服务器微信群、淮海智算中心微信群、MEITONG微信群，各细分行业微信群：点击这里进入。

鸿达安视：水文水利在线监测仪器、智慧农业在线监测仪器　　　　　　金叶仪器：气体/颗粒物/烟尘在线监测解决方案

西凯昂：SMC气动元件、力士乐液压元件、倍加福光电产品等　　　　　山东诺方：颗粒物传感器、粉尘浓度传感器

深圳金瑞铭：RFID射频识别、智能传感器等物联网解决方案　　　　　　北京英诺艾智：容错服务器、边缘计算解决方案

推动停车设施发展缓解城市“停车难” 湖北新增14.9万个公共停车位

青藏高原首个大型云计算数据中心再扩容

南钢：数字化赋能钢铁“智”造

中国首条规模化民用航空轮胎生产线建成投产

教育部高等教育司关于公布第二批“人工智能+高等教育”应用场景典型案例的通知

13家中国企业入选！这些“灯塔工厂”智造未来

3D视觉传感器，AGV自动导引车辆的“安全守护者”

上汽通用五菱绿色精益智造体系入选全国数字化绿色化协同转型发展优秀案例

桐乡“智慧大道”，通车！

不断迭代迈动互联“智元AI中枢”升级

科远智慧NT6000 DCS助力浙能六横二期2×1000MW二次再热发电机组顺利投运！

中控技术受邀参加第三届数据治理年会，并成功入选“数据管理百项优秀案例”

神经形态计算器件和阵列测试解决方案

远景全球最大容量构网型储能实证平台全场景测试圆满成功

软件工程智能化 | “企业行”系列之矿山人工智能研究院数据科学与大模型研究所

农业虫情监测系统——建起防虫“数字防火墙”

2024中国5G+工业互联网大会典型案例发布

2024中国5G+工业互联网大会丨《2024年5G工厂名录》发布 400家工厂入选

准确避障，安全无忧：超声波传感器，为清洁机器人护航

贵州“油茶之乡”全产业链发展促振兴

浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

推动停车设施发展 缓解城市“停车难” 湖北新增14.9万个公共停车位

青藏高原首个大型云计算数据中心再扩容

南钢：数字化赋能钢铁“智”造

中国首条规模化民用航空轮胎生产线建成投产

教育部高等教育司关于公布第二批“人工智能+高等教育”应用场景典型案例的通知

13家中国企业入选！这些“灯塔工厂”智造未来

3D视觉传感器，AGV自动导引车辆的“安全守护者”

上汽通用五菱绿色精益智造体系入选全国数字化绿色化协同转型发展优秀案例

桐乡“智慧大道”，通车！

不断迭代 迈动互联“智元AI中枢”升级

科远智慧NT6000 DCS助力浙能六横二期2×1000MW二次再热发电机组顺利投运！

中控技术受邀参加第三届数据治理年会，并成功入选“数据管理百项优秀案例”

神经形态计算器件和阵列测试解决方案

远景全球最大容量构网型储能实证平台全场景测试圆满成功

软件工程智能化 | “企业行”系列之矿山人工智能研究院数据科学与大模型研究所

农业虫情监测系统——建起防虫“数字防火墙”

2024中国5G+工业互联网大会典型案例发布

2024中国5G+工业互联网大会丨《2024年5G工厂名录》发布 400家工厂入选

准确避障，安全无忧：超声波传感器，为清洁机器人护航

贵州“油茶之乡”全产业链发展促振兴

推动停车设施发展缓解城市“停车难” 湖北新增14.9万个公共停车位

不断迭代迈动互联“智元AI中枢”升级