浪潮信息发布源2.0基础大模型，千亿参数全面开源

发布：来源：浪潮信息发布时间：2023-11-27 21:59
第一对焦：浪潮信息

11月27日，浪潮信息发布"源2.0"基础大模型，并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。

当前，大模型技术正在推动生成式人工智能产业迅猛发展，而基础大模型的关键能力则是大模型在行业和应用落地能力表现的核心支撑，但基础大模型的发展也面临着在算法、数据和算力等方面的诸多挑战。源2.0基础大模型则针对性地提出了新的改进方法并获得了能力的提升。

算法方面，源2.0提出并采用了一种新型的注意力算法结构：局部注意力过滤增强机制(LFA：Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性，然后再计算全局关联性的方法，能够更好地学习到自然语言的局部和全局的语言特征，对于自然语言的关联语义理解更准确、更人性，提升了模型的自然语言表达能力，进而提升了模型精度。

数据方面，源2.0通过使用中英文书籍、百科、论文等高质量中英文资料，降低了互联网语料内容占比，结合高效的数据清洗流程，为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据，我们清洗了从2018年至今约12PB的互联网数据，但仅获取到了约10GB的数学数据，投入巨大，收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集，源2.0采用了基于大模型的数据生产及过滤方法，在保证数据的多样性的同时也在每一个类别上提升数据质量，获取了一批高质量的数学与代码预训练数据。

算力方面，源2.0采用了非均匀流水并行的方法，综合运用流水线并行+优化器参数并行+数据并行的策略，让模型在流水并行各阶段的显存占用量分布更均衡，避免出现显存瓶颈导致的训练效率降低的问题，该方法显著降低了大模型对芯片间P2P带宽的需求，为硬件差异较大训练环境提供了一种高性能的训练方法。

源2.0作为千亿级基础大模型，在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试，测试结果显示，源2.0在多项模型评测中，展示出了较为先进的能力表现。

源2.0采用全面开源策略，全系列模型参数和代码均可免费下载使用。

代码开源链接

https://github.com/IEIT-Yuan/Yuan-2.0

论文链接

https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf

自动对焦：生成式人工智能人工智能 MEITONG

咨询详情：如需咨询文中涉及的相关产品或解决方案详情，请加微信：ZiDongHuaX 。

微信联盟：生成式人工智能微信群、人工智能微信群、MEITONG微信群，各细分行业微信群：点击这里进入。

鸿达安视：水文水利在线监测仪器、智慧农业在线监测仪器　　　　　　金叶仪器：气体/颗粒物/烟尘在线监测解决方案

西凯昂：SMC气动元件、力士乐液压元件、倍加福光电产品等　　　　　山东诺方：颗粒物传感器、粉尘浓度传感器

深圳金瑞铭：RFID射频识别、智能传感器等物联网解决方案　　　　　　北京英诺艾智：容错服务器、边缘计算解决方案

“芯”行万里，驰骋“芯”动力｜德州仪器 DLP® 技术，用创新点亮未来

涡轮流量计的安装和维护保养

科技透视镜 | 国创中心家电变频特色算法：自适应变频控制算法

欧镭学园 | 真假功能安全激光雷达

智慧空压站为什么比传统空压站要好

判断涡街流量计性能好坏的几个重要指标

光储充一体化和微电网的区别是什么？建设光储充站需要注意什么？

智慧水利与智慧水务的区别

智慧农业发展的底层逻辑与现实约束

下一代 HMI 的三个关键考虑因素

高度集成的嵌入式处理器如何推动工业机器人的发展

什么是“惯导三目及激光雷达总成”？

你准备好迎接新兴汽车雷达卫星架构了吗？

思特威物联网专题-快速启动技术，低功耗IoT设备进阶必备

深入了解光电传感器的工作原理

人形机器人爆发“元年”？王旭光博士登凤凰卫视谈3D视觉感知技术如何赋能产业发展

2024 年工程师不可错过的 AI 主要发展趋势

工信部发布首批50门中小企业人才培训“名师优课”优质课程

数字化转型三阶段：信息化-数字化-数智化

数字孪生城市产业图谱：我国数字孪生城市产业五大关联产业板块（1）

浪潮信息发布源2.0基础大模型，千亿参数全面开源

“芯”行万里，驰骋“芯”动力｜德州仪器 DLP® 技术，用创新点亮未来

涡轮流量计的安装和维护保养

科技透视镜 | 国创中心家电变频特色算法：自适应变频控制算法

欧镭学园 | 真假功能安全激光雷达

智慧空压站为什么比传统空压站要好

判断涡街流量计性能好坏的几个重要指标

光储充一体化和微电网的区别是什么？建设光储充站需要注意什么？

智慧水利与智慧水务的区别

智慧农业发展的底层逻辑与现实约束

下一代 HMI 的三个关键考虑因素

高度集成的嵌入式处理器如何推动工业机器人的发展

什么是“惯导三目及激光雷达总成”？

你准备好迎接新兴汽车雷达卫星架构了吗？

思特威物联网专题-快速启动技术，低功耗IoT设备进阶必备

深入了解光电传感器的工作原理

人形机器人爆发“元年”？王旭光博士登凤凰卫视 谈3D视觉感知技术如何赋能产业发展

2024 年工程师不可错过的 AI 主要发展趋势

工信部发布首批50门中小企业人才培训“名师优课”优质课程

数字化转型三阶段：信息化-数字化-数智化

数字孪生城市产业图谱：我国数字孪生城市产业五大关联产业板块（1）

人形机器人爆发“元年”？王旭光博士登凤凰卫视谈3D视觉感知技术如何赋能产业发展