源2.0大模型适配LLaMA-Factory框架微调训练快捷高效

发布：来源：LLaMA-Factory 发布时间：2024-01-18 22:39
第一对焦：人工智能

近日，源2.0开源大模型与LLaMA-Factory框架完成全面适配，用户通过LLaMA-Factory，即可快捷、高效地对不同参数规模的源2.0基础模型进行全量微调及高效微调，轻松实现专属大模型。

LLM（大语言模型）微调，是指在大模型的基础上，针对特定任务或领域进行调整和优化，以提升模型的性能和表现，有效的微调方案与工具也正是解决基础大模型落地私有领域的一大利器。基于开源大模型的微调，不仅可以提升LLM对于指令的遵循能力，也能通过行业知识的引入，来提升LLM在专业领域的知识和能力。

当前，业界已经基于LLM开发及实践出了众多的微调方法，如指令微调、基于人类反馈的强化学习（RLHF，Reinforcement Learning from Human Feedback）、直接偏好优化（DPO，Direct Preference Optimization）等。以高效微调（PEFT，Parameter-Efficient Fine-Tuning）方案为例，可有效解决内存和计算资源的制约，通过LoRA、QLoRA等高效微调技术，在单张GPU上完成千亿参数的微调训练。因此，一个能够实现上述功能的简洁、高效且易用的微调框架正是开展LLM微调工作的最佳抓手。

LLaMA-Factory是零隙智能（SeamLessAI）开源的低代码大模型训练框架，旨在为开发者提供可视化训练、推理平台及一键配置模型训练。基于LLaMA-Factory, 用户可轻松选择业界最全面的微调方法和优化技术，通过使用私域数据，或是LLaMA-Factory内置的中文数据集（GPT-4优化后的alpaca中文数据集、ShareGPT数据集和llama-factory提供的模型认知数据集），对源2.0进行轻松微调，基于有限算力完成领域大模型的定制开发。实测数据显示，在一台搭载8颗GPU的主流AI服务器NF5468M7，7小时内即可实现千亿模型（Yuan2.0- 102B）的高效指令微调，10分钟即可完成Yuan2.0-2B参数的指令微调，轻松实现即调即用。

Step by Step

单机即可实现千亿参数模型微调

Step 1: 容器化环境部署，数条指令即可轻松完成
Step 2: 开源可商用Yuan2.0 Huggingface模型获取
Step 3: 一键"启动"web UI服务
Step 4: 构建LLM助手-可视化界面配置完成Yuan2.0微调
Step 5: 搭建我们的私有LLM助手

GitHub项目地址：

https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2_llama-factory.md

自动对焦：大语言模型 LLM MEITONG

咨询详情：如需咨询文中涉及的相关产品或解决方案详情，请加微信：ZiDongHuaX 。

微信联盟：大语言模型微信群、LLM微信群、MEITONG微信群，各细分行业微信群：点击这里进入。

鸿达安视：水文水利在线监测仪器、智慧农业在线监测仪器　　　　　　金叶仪器：气体/颗粒物/烟尘在线监测解决方案

西凯昂：SMC气动元件、力士乐液压元件、倍加福光电产品等　　　　　山东诺方：颗粒物传感器、粉尘浓度传感器

深圳金瑞铭：RFID射频识别、智能传感器等物联网解决方案　　　　　　北京英诺艾智：容错服务器、边缘计算解决方案

“芯”行万里，驰骋“芯”动力｜德州仪器 DLP® 技术，用创新点亮未来

涡轮流量计的安装和维护保养

科技透视镜 | 国创中心家电变频特色算法：自适应变频控制算法

欧镭学园 | 真假功能安全激光雷达

智慧空压站为什么比传统空压站要好

判断涡街流量计性能好坏的几个重要指标

光储充一体化和微电网的区别是什么？建设光储充站需要注意什么？

智慧水利与智慧水务的区别

智慧农业发展的底层逻辑与现实约束

下一代 HMI 的三个关键考虑因素

高度集成的嵌入式处理器如何推动工业机器人的发展

什么是“惯导三目及激光雷达总成”？

你准备好迎接新兴汽车雷达卫星架构了吗？

思特威物联网专题-快速启动技术，低功耗IoT设备进阶必备

深入了解光电传感器的工作原理

人形机器人爆发“元年”？王旭光博士登凤凰卫视谈3D视觉感知技术如何赋能产业发展

2024 年工程师不可错过的 AI 主要发展趋势

工信部发布首批50门中小企业人才培训“名师优课”优质课程

数字化转型三阶段：信息化-数字化-数智化

数字孪生城市产业图谱：我国数字孪生城市产业五大关联产业板块（1）

源2.0大模型适配LLaMA-Factory框架 微调训练快捷高效

“芯”行万里，驰骋“芯”动力｜德州仪器 DLP® 技术，用创新点亮未来

涡轮流量计的安装和维护保养

科技透视镜 | 国创中心家电变频特色算法：自适应变频控制算法

欧镭学园 | 真假功能安全激光雷达

智慧空压站为什么比传统空压站要好

判断涡街流量计性能好坏的几个重要指标

光储充一体化和微电网的区别是什么？建设光储充站需要注意什么？

智慧水利与智慧水务的区别

智慧农业发展的底层逻辑与现实约束

下一代 HMI 的三个关键考虑因素

高度集成的嵌入式处理器如何推动工业机器人的发展

什么是“惯导三目及激光雷达总成”？

你准备好迎接新兴汽车雷达卫星架构了吗？

思特威物联网专题-快速启动技术，低功耗IoT设备进阶必备

深入了解光电传感器的工作原理

人形机器人爆发“元年”？王旭光博士登凤凰卫视 谈3D视觉感知技术如何赋能产业发展

2024 年工程师不可错过的 AI 主要发展趋势

工信部发布首批50门中小企业人才培训“名师优课”优质课程

数字化转型三阶段：信息化-数字化-数智化

数字孪生城市产业图谱：我国数字孪生城市产业五大关联产业板块（1）

源2.0大模型适配LLaMA-Factory框架微调训练快捷高效

人形机器人爆发“元年”？王旭光博士登凤凰卫视谈3D视觉感知技术如何赋能产业发展