【ZiDongHua 之人文化天下收录关键词: 汉王科技 人工智能 高质量发展
  
  数字力量护文化 人工智能守遗风|汉王科技庞素蕾入选“北京榜样·最美互联网从业者”提名
  
  近日,北京市委互联网企业工委启动“北京榜样·最美互联网从业者”评选活动,经过推荐、考察、专家评审等环节严格甄选,汉王科技数据产品经理庞素蕾、小米集团党委常务副书记、工会主席、妇工委主任施艳、快手科技党委副书记、副总裁徐静芸和360数字安全集团总裁胡振泉、58同城(集团)副总裁、党委书记胡迪等30名互联网优秀工作者获得 “北京榜样·最美互联网从业者”提名。
  
  以下内容是《北京日报》对汉王科技数据产品经理庞素蕾的介绍:  片
  
  庞素蕾在2006年大学毕业后进入汉王科技股份有限公司工作至今,先后负责手写识别、OCR和人脸等数据建设与产品研发,目前担任大模型数据产品经理,负责大模型数据与安全工作。庞素蕾深耕人工智能领域近二十年,为公司和社会创造了大量经济效益,为保护与传承中华传统文化做出重要贡献。她曾获汉王科技优秀共产党员、十佳员工等荣誉,获得系统集成项目经理、NPDP、ACP等资质。
  
  一、保护语言,少数民族文字走向互联网
  
  庞素蕾入职时,汉王科技的手写识别和OCR技术获得了国家科技进步一等奖和二等奖。但当时少数民族文字的手写识别还是空白,少数民族同胞只能通过纸笔进行传承。怎么能让这些资料电子化、用于互联网,是她面对的第一个难题。庞素蕾在新疆时就体会到维吾尔族语言的美丽与宝贵。她接到任务,第一个想到的就是回到家乡收集维语文字手写数据,帮助乡亲们用上维语手写输入法。她立刻联系了几所学校的老师开展维语手写数据收集工作。当她回到家乡,一位老师热情地握住她的手说:“我们一直想让维语文字资料电子化,可是输入实在太困难了!”庞素蕾体会到乡亲们迫切的心情,收集完数据后就立马赶回北京。经过不懈努力,她和同事们终于一起研发出维语手写识别输入法,解决了维吾尔族同胞输入难的问题。她接着收集了新疆地区多种语言文本数据用于OCR研发,这些珍贵数据也促成了“维哈柯语言文字软件开发及产业化”项目立项,为少数民族发展做出重要贡献。
  
 
  
  后续,庞素蕾又开始收集其他少数民族文字数据。少数民族文字结构复杂、使用人数少、资料匮乏,为解决数据不足的棘手问题,庞素蕾亲自深入甘肃、吉林、四川等地收集数据。路途遥远,过程艰辛,但她不畏艰苦,一心只想把工作做好。采集朝鲜语时正值冬季,她到吉林的第二天就被寒冷的天气冻感冒了,一度发烧到39℃。但为了尽快完成任务,她依然坚持在第一线,带病完成数据采集。后续她带领团队收集了彝族、藏族等少数民族的手写样本和文字资料,总数达上百万字。这些宝贵的数据用于“中华字库项目”中“汉字和少数民族文字的手写输入法”研发。研发工作取得了巨大突破,研究成果打破了少数民族文字与互联网之间的壁垒,让中华各民族使用文字更加便捷高效,让中华文明的传播更加广泛深远。
  
  二、发扬文化,小语种文字建立传播渠道
  
  中华文化既要传下来,也要走出去。2008年北京举办奥运会开始,中国和世界有了更加紧密的交流。庞素蕾也开始了让传统文化“走出去”的工作。
  
  她带领团队陆续收集了德语、俄语、印地语等十几种小语种文字数据,数据量超过千万字。很多外国人喜欢左手写字,与右手书写的笔迹有所差别,为提升手写算法在海外产品中的识别率,她利用周末到名胜古迹找外国人采集数据。这些数据帮助汉王科技的手写识别与OCR扩展至数十种文字。在这些数据的基础上,汉王科技成功立项两项国家级新一代人工智能重大项目,在国家安全、文化传播领域做出了卓越贡献。
  
  工作之外,庞素蕾也致力于中国文化的保护与宣传。她在采集时认识了不少外国朋友,闲暇时她会带着外国朋友到北京文化景点,为他们讲解中国的传统文化。“采集小语种数据能让我们与其他国家建立更顺畅的交流,我也希望中国的文化可以通过这些语言传递到世界上许多不同的国家。”
  
  三、传承历史,历史古籍重获数智化生命
  
  2022年,ChatGPT掀起人工智能新浪潮,汉王科技选择将大模型技术与我国传统文化相结合。庞素蕾勇于担当,投入到汉王天地大模型的研发工作,迅速组建大模型专项数据组,快速开发高效的数据标注平台,制定严谨的管理流程,向算法团队提供高质量的训练数据,包括历史、古文、水墨画等。
  
 
  
  开始时,模型对历史人物关系的理解存在错误,这是因为模型中的历史数据混杂在大量的自然数据中,信息被稀释,模型不能精准提取与问题相关的数据。为解决该问题,庞素蕾带领团队构建了完善的知识图谱,矫正了数万条历史人物数据。不断地优化迭代,让汉王天地大模型成为了“历史百事通”,让中国青少年可以用崭新的方式了解、喜欢与传播中国历史。
  
  在庞素蕾和同事的努力下,汉王天地大模型通过了互联网信息服务算法备案、生成式人工智能服务备案。庞素蕾团队的工作促成了汉王科技成功立项国家档案局科技项目,将大模型应用于档案电子化,攻关档案高质量发展核心问题,服务国家重大发展战略;辅助汉王科技与国家图书馆达成合作,用AI技术赋予中华古籍数智化生命。在未来,庞素蕾还会和团队一起用大模型赋能文化与历史传承,让传统文化在互联网时代焕发新生。
  
  面对互联网行业快速更新迭代,庞素蕾作为一名拥有18年党龄的中共党员、一名热爱AI行业的互联网从业者,勇于担当、默默奉献、磨砺技术,从少数民族文字到小语种,再到大模型,庞素蕾为公司打造了坚实的数据基础,为国家文化保护、传承与发展贡献了自己的力量。她在互联网行业、人工智能领域真正做到科技报国,产业兴邦。
  
  (内容来源:北京日报)