自动化者人文

动感语言文字中的自动化科技：国务院办公厅关于全面加强新时代语言文字工作的意见

时间：2021-12-01 18:59:49 发布：自动化网来源：中国政府网第一对焦：国务院办公厅

国务院办公厅关于全面加强新时代

语言文字工作的意见

（一）指导思想。以习近平新时代中国特色社会主义思想为指导，全面贯彻党的十九大和十九届二中、三中、四中全会精神，按照党中央、国务院决策部署，坚持以人民为中心的发展思想，以推广普及和规范使用国家通用语言文字为重点，加强语言文字法治建设，推进语言文字规范化、标准化、信息化建设，科学保护各民族语言文字，构建和谐健康语言生活，传承弘扬中华优秀语言文化，提升国家文化软实力，为铸牢中华民族共同体意识、建设社会主义现代化强国贡献力量。

——坚持服务大局、服务人民。立足我国发展新的历史方位，聚焦国家发展战略，加强顶层设计，充分发挥语言文字的政治、社会、文化、育人和对外交流功能，提高语言文字工作服务国家发展大局的能力，推进语言文字工作治理体系和治理能力现代化，服务人民群众学习使用语言文字和提升科学文化素质的需求。

——坚持遵循规律、分类指导。准确把握我国语言国情，遵循语言文字发展规律，牢固确立国家通用语言文字的主体地位，树立科学语言文字观，改革创新、稳中求进、因地制宜、分类施策，妥善处理好各类语言文字关系，构建和谐健康语言生活。

（三）主要目标。到2025年，普通话在全国普及率达到85%，语言文字规范化、标准化、信息化水平进一步提高，语言文字科技水平和创新能力明显提升，中华优秀语言文化得到更好传承弘扬，与人民群众需求相适应的语言服务体系更加完善。

到2035年，国家通用语言文字在全国范围内的普及更全面、更充分，普通话在民族地区、农村地区的普及率显著提高，国家语言文字事业取得长足发展，基本实现新时代语言文字工作治理体系和治理能力现代化。

二、坚定不移推广普及国家通用语言文字

（五）坚持学校作为国家通用语言文字教育基础阵地。加强学校语言文字工作，全面落实国家通用语言文字作为教育教学基本用语用字的法定要求。坚持把语言文字规范化要求纳入学校、教师、学生管理和教育教学、评估评价等各个环节，开展学校语言文字工作达标建设。建立完善学生语言文字应用能力监测和评价标准。大力提高教师国家通用语言文字核心素养和教学能力。加强教材建设，确保国家通用语言文字规范标准的贯彻落实。建设书香校园，提高学生国家通用语言文字听说读写能力和语文素养。除国家另有规定外，学位论文应当使用国家通用语言文字撰写。

（七）提升国民语言文字应用能力。学校、机关、新闻出版、广播影视、网络信息、公共服务等系统相关从业人员，国家通用语言文字水平应达到国家规定的等级标准。开展国家通用语言文字示范培训，提高教师、基层干部等人群国家通用语言文字应用能力。开发普通话学习资源。推进普通话水平测试，完善国家通用语言文字应用能力测评体系。开展国民语言教育，提升国民语言文化素养，提高国民语言能力。

三、加快推进语言文字基础能力建设

（九）推动语言文字信息技术创新发展。发挥语言文字信息技术在国家信息化、智能化建设中的基础支撑作用，提升语言文字信息处理能力，推进语言文字的融媒体应用。大力推动语言文字与人工智能、大数据、云计算等信息技术的深度融合，加强人工智能环境下自然语言处理等关键问题研究和原创技术研发，加强语言技术成果转化及推广应用，支持数字经济发展。加强语言文字信息化平台建设，建设好全球中文学习平台，提供优质学习资源和信息服务资源。

（十一）研究制定国家语言发展规划。加强国家语言发展规划，将国家通用语言文字推广普及、语言文字规范化标准化信息化建设、民族语文教育、语言资源保护利用、外语教育、国际中文教育、语言人才培养等统一规划、统一部署。完善高校多语种外语教育规划和语种结构，培养和储备复合型语言人才。加强语言产业规划研究。坚持政府引导与市场运营相结合，发展语言智能、语言教育、语言翻译、语言创意等语言产业。

（十三）满足人民群众多样化语言需求。建立语言服务机制，建设国家语言志愿服务队伍。提升城乡社区语言服务能力，提高少数民族进城务工经商人员语言文化服务质量。编制发布国内外语言政策和语言生活状况报告。加快手语和盲文规范化、标准化、信息化建设，加快推广国家通用手语和国家通用盲文，加强手语、盲文学科建设和人才培养，为听力、视力残疾人提供无障碍语言文字服务。为来华旅游、留学、工作、居住人员提供语言服务。

五、积极推进中华优秀语言文化传承发展

（十五）深化与港澳台地区语言文化交流合作。支持和服务港澳地区开展普通话教育，合作开展普通话水平测试，提高港澳地区普通话应用水平。加大与港澳台地区青少年语言文化交流力度，组织开展中华经典诵读展演、语言文化研修等活动。加强与港澳台地区在科技术语、中文信息技术、语言文字科学研究和人才培养等方面的交流合作。加强台湾地区语言文字政策研究。

（十七）加强国际中文教育和服务。加强国际中文教师队伍建设。吸引更多海外中文教师来华攻读中文国际教育相关硕士博士学位。构建全球普通话水平测试体系。完善国际中文教育考试标准。加强中文在海外华文学校的推广应用，加强海外华文教师培训。大力提升中文在学术领域的影响力，提倡科研成果中文首发。推动提高中文在国际组织、国际会议的使用地位和使用比例。促进汉语拼音的国际应用。

（十九）加强党对语言文字工作的领导。把坚持和加强党的领导贯穿语言文字工作全过程。各级政府要高度重视语言文字工作，切实把语言文字工作纳入政府议事日程和相关工作绩效管理目标，建立健全工作机制、配足配齐工作人员。综合运用法律、行政、教育、科技等手段，履行政府依法监管语言文字应用和提供语言文字公共服务的职责，加快推进语言文字工作治理体系和治理能力现代化。把语言文字工作纳入各级政府履行教育职责评价体系，省级人民政府语言文字工作重要事项要及时向国家语委报告。强化县乡两级国家通用语言文字工作职能。

（二十一）夯实语言文字工作法治基础。贯彻落实国家通用语言文字法。推动完善语言文字法律制度，制定相关配套规章。依法加强管理，确保国家通用语言文字作为机关的公务用语用字，作为学校、新闻出版、广播影视、公共服务等领域的基本用语用字。指导地方根据国家通用语言文字法的规定，完善相关地方性法规。将语言文字规范化要求纳入相关行业法规规章和规范标准。推动开展国家通用语言文字法执法检查。健全语言文字依法管理和执法监督协调机制。将语言文字法律法规的学习宣传纳入普法规划和普法教育内容。

（二十二）加强语言文字工作队伍建设。加强语言文字系统干部队伍培养培训，提高语言文字工作治理能力和水平。开展普通话水平测试员、相关行业从业人员语言文字培训。完善人才培养和使用机制，建设高质量语言文字科研人才队伍。健全激励机制，依法依规表彰奖励为语言文字事业发展作出突出贡献的组织和个人。

国务院办公厅

动感语言文字工作：第十六届中国中文信息学会暑期校暨《前沿技术讲习班》（CIPS ATT）在京召开

中科院自动化所刘康研究员和中科院软件所韩先培研究员作题为《Research：the Good, the Bad and the Ugly》的报告

庆祝中国中文信息学会成立40周年系列活动 - 第十六届中国中文信息学会暑期学校暨《前沿技术讲习班》（CIPS ATT）在京召开

2021年7月22日-25日，庆祝中国中文信息学会成立40周年系列活动 - 第十六届中国中文信息学会暑期学校暨《前沿技术讲习班》第二十三期和第二十四期在京举行。本届讲习班主题为：预训练语言模型的基础理论与方法及其典型应用。讲习班吸引了来自全国各高校及科研院所的专家、学者、学生、产业界研发人员等近400人参加。

哈尔滨工业大学车万翔教授、清华大学刘知远副教授、中国科学院自动化研究所张家俊研究员担任本届讲习班的学术主席。刘知远副教授和车万翔教授分别致开幕辞，先后介绍了讲习班的课程内容和特邀讲者，并欢迎学员们来京参会！

讲习班邀请了哈尔滨工业大学车万翔教授、科大讯飞崔一鸣研究员、微软亚洲研究院董力研究员、百度公司孙宇研究员、清华大学刘知远副教授、循环智能杨植麟博士、复旦大学邱锡鹏教授、上海交通大学赵海教授、字节跳动王明轩研究员、清华大学黄民烈副教授、中国人民大学赵鑫副教授和陈旭助理教授、中科院计算所郭嘉丰教授和范意兴助理研究员、清华大学兰艳艳教授、中科院自动化所刘康研究员和中科院软件所韩先培研究员在不同的方向作了系统深入的讲解，并对预训练模型及其各领域的应用提出了未来的研究方向。

7月22日，车万翔教授和崔一鸣研究员作题为《自然语言处理：基于预训练模型的方法》的报告，重点介绍基于预训练模型的自然语言处理技术，包括基础知识、预训练词向量和预训练模型三大部分。基础知识部分介绍自然语言处理和深度学习的基础知识和基本工具；预训练词向量部分介绍静态词向量和动态词向量的预训练方法及应用方法；预训练模型部分介绍几种典型的预训练语言模型和应用，以及预训练模型的最新进展。除理论知识外，还结合具体代码进行深入介绍，达到理论和实践的统一。车万翔教授作题为《自然语言处理：基于预训练模型的方法》的报告

崔一鸣研究员作题为《自然语言处理：基于预训练模型的方法》的报告

7月23日上午，董力研究员作题为《跨语言预训练模型》的报告，主要介绍跨语言预训练的最新研究进展与趋势，对当前跨语言预训练方法、微调技术；同时，还将介绍跨语言文本理解与生成的常用评测方式。此外，对当前跨语言预训练研究面临的挑战进行了探讨。

孙宇研究员作题为《跨模态预训练模型》的报告，融合跨模态知识、跨模态对抗训练、多个模态统一建模等是跨模态预训练的新思路。报告针对语言-视觉、语言-语音跨模态预训练，介绍该领域最新的进展和趋势。

董力研究员作题为《跨语言预训练模型》的报告

孙宇研究员作题为《跨模态预训练模型》的报告

下午，刘知远副教授作题为《知识指导的预训练语言模型》的报告，作为典型的数据驱动方法，以预训练语言模型为代表的深度学习仍然面临可解释性不强、鲁棒性差等难题，如何将人类积累的大量语言知识和世界知识引入模型，是改进深度学习性能的重要方向，同时也面临很多挑战。报告系统介绍了知识指导的预训练语言模型的最新进展与趋势。

杨植麟博士作题为《面向生成的预训练模型》的报告，探讨如何在纷繁复杂的任务体系和架构体系当中寻找统一的解决方案，其中将重点讨论「生成理解一体化」的思想，讨论基于生成的方式如何统一预训练和微调任务。同时，报告还讨论了基于生成的思想在少样本学习、知识探测、诗歌生成等下游任务的应用，以及基于生成的预训练模型在工业界对话理解场景的落地案例。

刘知远副教授作题为《知识指导的预训练语言模型》的报告

杨植麟博士作题为《面向生成的预训练模型》的报告

7月24日上午，邱锡鹏教授作题为《预训练模型在NLP基础任务中的应用》的报告，介绍预训练模型在NLP基础任务上的应用，主要包括1）如何在下游任务精调预训练模型；2）在NLP基础任务上的应用；3）重点介绍了一种统一生成框架，可以用来解决众多NLP基础任务。

赵海教授作题为《预训练模型在机器阅读理解任务中的应用》的报告，主要探讨语言模型、表示对于机器阅读理解的技术性影响，包括技术演化的时间线、现状和挑战，特别是最近一年的最新进展和一些个人新的思考。

邱锡鹏教授作题为《预训练模型在NLP基础任务中的应用》的报告

赵海教授作题为《预训练模型在机器阅读理解任务中的应用》的报告

下午，王明轩研究员作题为《机器翻译的预训练方法》的报告，报告围绕单语预训练、多语言预训练、多模态预训练三个方面来介绍机器翻译中利用预训练提升的最新进展。预训练在机器翻译中需要达到三个目标：设计有效目标从而适应翻译任务；充分利用大量单语和有限双语、文本和不同模态数据；拉近跨语言跨任务表示。通过预训练和细调方法，在双语翻译，多语言联合翻译（包括zero-shot场景），语音翻译，图像辅助翻译等不同翻译场景都取得了显著提升。

黄民烈副教授作题为《基于预训练模型的对话系统》的报告，报告围绕基于预训练模型的对话系统，阐述其中重要的问题、挑战，以及最新的方法，特别是大数据、大模型下的框架和任务设计。

王明轩研究员作题为《机器翻译的预训练方法》的报告

黄民烈副教授作题为《基于预训练模型的对话系统》的报告

7月25日上午，赵鑫副教授和陈旭助理教授作题为《预训练模型在推荐系统中的应用》的报告，聚焦预训练模型在推荐系统领域的应用，对最近几年的相关研究进行简要梳理和回顾，主要内容包括：1）基础背景：预训练模型和推荐系统的相关背景知识；2）预训练模型在推荐系统中应用的动机和挑战：为什么预训练模型在推荐系统领域受到广泛关注，应用过程中的主要难点是什么；3）预训练模型在推荐系统中的应用策略和相关方法：如何更好地利用推荐系统中用户的行为数据、设计更好的模型架构和学习算法；4）预训练模型在推荐系统中应用的未来展望：该领域亟待解决的问题和未来的发展方向。

郭嘉丰研究员和范意兴助理研究员作题为《预训练模型在信息检索中的应用》的报告，聚焦预训练模型在信息检索中的应用，对最近几年的相关研究进行系统的梳理和回顾。主要内容包括：1）基础背景：信息检索的相关背景知识介绍；2）预训练模型在检索召回阶段的应用：包括预训练模型在传统稀疏检索框架下的应用以及基于预训练模型的稠密检索方法；3）预训练模型在重排序阶段的应用：包括基于预训练模型的表示学习、交互学习建模方法与模型加速，以及基于生成模型的排序建模等；4）面向信息检索的预训练模型设计：如何构建满足信息检索任务需求的自监督学习任务，进一步提升信息检索的性能。

赵鑫副教授作题为《预训练模型在推荐系统中的应用》的报告

陈旭助理教授作题为《预训练模型在推荐系统中的应用》的报告

郭嘉丰研究员作题为《预训练模型在信息检索中的应用》的报告

范意兴助理研究员作题为《预训练模型在信息检索中的应用》的报告

下午，兰艳艳教授作题为《学术论文写作的一些体会》的报告，结合个人研究背景和经历，主要介绍了学术论文写作的一些体会，包括逻辑的重要性，3W2H写作法则，论文的润色技巧，复盘与提高等。

刘康研究员和韩先培研究员作题为《Research：the Good, the Bad and the Ugly》的报告，介绍两位讲者在多年的科研经历中遇到过、看到过、听到过的Good、Bad、Ugly的科研方法（包括但不限于其中的故事、心态、理念、方法等），希望对于同学们的学习、科研和生活有所帮助。