第五届CSIG图像图形技术挑战赛季军团队介绍

发布：tgy 来源：中国图象图形学学会CSIG 发布时间：2025-01-06 15:54
第一对焦：图像图形

　　【ZiDongHua之会展赛培坛收录关键词：图像图形人工智能大模型】

　　【竞赛】第五届CSIG图像图形技术挑战赛季军团队介绍

　　获得本届CSIG图像图形技术挑战赛总决赛季军的团队是“中文文本智能校对大赛”赛道冠军苏州大学“黑模型·乐改”团队。

　　赛道介绍

　　随着人工智能技术的迅猛发展，其在各行各业的应用不断深化，对经济社会的影响日益显著。如何打通产学研体系，深入行业应用的技术难题，为人工智能产业输入源源不断的人才，是行业关注焦点。通过大赛聚焦关键问题、探索解决方案，成为行业趋势。

　　尤其在校对领域，人工智能对中文校对应用的能力升级方面扮演了关键角色，特别是在提升校对效率、准确性和个性化服务上有着突出的增强作用。

　　在中国图象图形学学会主办的CSIG图像图形技术挑战赛系列赛事中，金山办公承办了中文文本智能校对大赛。根据赛制，个人或者团队参赛者可以构建一个完整的AI算法参与挑战赛。主办方使用ChERRANT评估校对算法效果，通过对比预测编辑和标准编辑，计算预测结果的精确度、召回度、F值指标，评估纠错模型的性能，并使用字级别的F0.5指标作为最终评判结果。

　　为提高赛事的挑战性，金山办公发布了贴近真实使用场景的比赛数据，以反映用户在日常生活中常见的错误类型。金山办公希望通过赛事让高校开发者能够学以致用，以工程思维践行产学研融合，实现从技术研究到应用实践的跨越。

　　此次比赛共吸引67所高校、338支队伍，累计548人参赛。最终，四支参赛队伍获得大赛的一二三等奖以及丰厚的现金奖励。其中，本队伍（苏州大学“黑模型·乐改”团队）凭借一种全新的无需训练的拼写纠错方法获得大赛冠军。

　　图1金山办公为冠军团队颁奖

　　参赛方案

　　本队伍提交方案可分别三大模块：字词错误纠正、句法错误纠正、结果合并与后处理。

　　1.字词错误纠正：本模块中我们尝试同时建模拼写和多字少字这些字词错误。其中无训练大模型建模是我们提出的全新方案，效果非常好，通过对大模型解码过程的控制，可以使大模型在不经过任何训练的情况下，就拥有出色的字词错误修改能力。该方案单个模型在主办方提供的LabelData数据集上可以取得0.7844的F0.5，性能远超经过大规模数据训练的传统拼写纠错模型。

　　图2无训练大模型字词纠错方法

　　2.句法错误纠正：在句法纠错方面，我们使用Lora方法训练了大模型，同时全参微调了中小模型（Bart、Bert），并在最后通过投票集成的方式，同时利用这两种模型来提高最终结果。

　　3.结果合并与后处理：考虑到在实践中，字词错误的识别和纠错相对容易，而语法错误更复杂，识别和纠错的难度更高，因此在合并不同模型的纠错结果时，我们首先考虑字词错误的结果，如果句子中没有发现字词错误，则认为句子中不存在字词错误，应该采纳语法错误的纠错结果。在对结果合并后，我们通过定义规则的方式来对结果进行优化，如根据国家语委刊发的《异形词整理表》来替换结果中残余的异形词，同时利用掩码语言模型来对结果中的“的/地/得”进行相应处理。

　　此外，本队伍还使用了一些数据增广策略，对数据进行扩充，我们分别在悟道语料库、大模型续写语料上基于规则，以字/词为基本单位，对句子进行随机的替换、删除、添加操作，结合混淆集，同音、形近词表生成基础的拼写错误。

　　总结

　　在本次比赛中，我们在前人比赛的经验上进行了进一步的探索。首先，我们提出了全新的无训练大模型建模方案，通过对大模型解码过程的控制，可以实现在不经过任何训练的情况下，将任何有汉语生成能力的模型改造成一个字词错误识别和纠正模型。该方案在比赛中取得了最好的效果，表现出了极为优秀的泛化能力。

　　此外我们还采用了有监督训练的模型来对无训练大模型建模方案进行补充。在训练有监督模型时，我们创新性地提出了运用大模型的续写能力来合成数据集，从而保证合成数据的领域与目标数据集一致。同时还兼具时效性。这些合成数据有效地提升了有监督模型，尤其是小模型在目标数据集上的表现。

　　最终，我们通过投票集成的方式，同时利用无训练大模型建模方案和有监督模型，取得了第一名的好成绩。

自动对焦：人工智能大模型

咨询详情：如需咨询文中涉及的相关产品或解决方案详情，请加微信：ZiDongHuaX 。

微信联盟：人工智能微信群、大模型微信群，各细分行业微信群：点击这里进入。

鸿达安视：水文水利在线监测仪器、智慧农业在线监测仪器　　　　　　金叶仪器：气体/颗粒物/烟尘在线监测解决方案

西凯昂：SMC气动元件、力士乐液压元件、倍加福光电产品等　　　　　山东诺方：颗粒物传感器、粉尘浓度传感器

深圳金瑞铭：RFID射频识别、智能传感器等物联网解决方案　　　　　　北京英诺艾智：容错服务器、边缘计算解决方案

2025深圳传感器展：多元顶级论坛齐聚，邀您共探无限商机

2025全球开发者先锋大会“人形机器人的开源之路”主题论坛成功举办

AARS技术荣获2025汉诺威工业博览会机器人大奖第一名

宏景智驾创始人及CEO刘飞龙博士受邀出席杭州市能源集团举办的“氢能驱动未来智造引领变革”专题讲座

3月天津工博会晚宴：春晚同款机器人给获奖企业颁奖，科技与趣味齐飞！

麦克传感亮相中国国际供热展，助力暖通行业低碳绿色发展

首届CJE前沿学术沙龙在深圳成功举办

4地1600+用户代表齐聚华测导航智能装备研讨会，共谋行业未来

中德智能制造/工业4.0“自动化制造与产品信息”任务组首次会议成功召开

聚焦自动驾驶等“5+6”重点垂直领域|全球开发者先锋大会

第二届机器人与智能传感技术高峰论坛议程

互通互联·驶向共赢 | 2025印尼轨道交通国际峰会/2025 Indonesia Rail Summit(IRS)

全球数字经济大会首次在欧洲设立分会场|3月4日巴塞罗那，2025全球数字经济大会 “融合・创新・共赢”，中欧共拓数字经济新赛道

2025 英飞凌消费、计算与通讯创新大会重磅来袭！

热烈祝贺2025年绿氨绿醇产业发展大会盛大开幕！

全链融合·前瞻领航 | 第五届航空计量测试与检验检测发展论坛

广东省委书记召开人工智能与机器人发展座谈会，普渡机器人等科创企业参会

UNITX亮相墨西哥国际工业制造博览会

第二届机器人与智能传感技术高峰论坛议程

粤港澳大湾区AI+智能制造创新峰会暨会长带队走进企业圆满举办

第五届CSIG图像图形技术挑战赛季军团队介绍

2025深圳传感器展：多元顶级论坛齐聚，邀您共探无限商机

2025全球开发者先锋大会“人形机器人的开源之路”主题论坛成功举办

AARS技术荣获2025汉诺威工业博览会机器人大奖第一名

宏景智驾创始人及CEO刘飞龙博士受邀出席杭州市能源集团举办的“氢能驱动未来 智造引领变革”专题讲座

3月天津工博会晚宴：春晚同款机器人给获奖企业颁奖，科技与趣味齐飞！

麦克传感亮相中国国际供热展，助力暖通行业低碳绿色发展

首届CJE前沿学术沙龙在深圳成功举办

4地1600+用户代表齐聚华测导航智能装备研讨会，共谋行业未来

中德智能制造/工业4.0“自动化制造与产品信息”任务组首次会议成功召开

聚焦自动驾驶等“5+6”重点垂直领域|全球开发者先锋大会

第二届机器人与智能传感技术高峰论坛议程

互通互联·驶向共赢 | 2025印尼轨道交通国际峰会/2025 Indonesia Rail Summit(IRS)

全球数字经济大会首次在欧洲设立分会场|3月4日巴塞罗那，2025全球数字经济大会 “融合・创新・共赢”，中欧共拓数字经济新赛道

2025 英飞凌消费、计算与通讯创新大会重磅来袭！

热烈祝贺2025年绿氨绿醇产业发展大会盛大开幕！

全链融合·前瞻领航 | 第五届航空计量测试与检验检测发展论坛

广东省委书记召开人工智能与机器人发展座谈会，普渡机器人等科创企业参会

UNITX亮相墨西哥国际工业制造博览会

第二届机器人与智能传感技术高峰论坛议程

粤港澳大湾区AI+智能制造创新峰会暨会长带队走进企业圆满举办

宏景智驾创始人及CEO刘飞龙博士受邀出席杭州市能源集团举办的“氢能驱动未来智造引领变革”专题讲座