近日,在声学、语音和信号处理国际会议(ICASSP)信号处理挑战旗舰任务、全球首个小资源音色克隆挑战赛——多说话人多风格音色克隆大赛(M2VoC)上,猿辅导荣获其子赛道冠军,这是国内在线教育公司获得的首个语音识别类比赛冠军。
声学、语音和信号处理国际会议(ICASSP)作为IEEE信号处理协会组织的年度会议,也是信号处理及应用方面最顶级、最全面的国际会议。本次比赛分为少样本赛道和极少样本赛道两大任务。在极少样本赛道方面,针对每个说话人不同的说话风格和5个可用的音色克隆样例进行校验和最终测试,对参赛技术团队有着很高的技术要求。
主办方共收到来自知名公司和大学在内150多支队伍报名。最终,在极少样本开集赛道,来自猿辅导人工智能实验室的技术团队获得第一名。即使在样本量极小的情况,猿辅导依然实现了希望达到的目标,这印证了其在研发方面领先行业的前瞻性与先进性。
攻克关键“痛点”,猿辅导借AI创新助力教师和用户
实际上,作为本次大赛的参赛者,猿辅导技术团队斩获子赛道冠军宝座时所展示的并非新兴技术,而是早在小猿口算、猿辅导网课等产品内实现应用的语音AI技术。
一般的语音合成技术,只需保证语音合成的字眼准确性,并不会顾及在声调、停顿多方面的细节。而在教育领域,语音合成技术主要为满足在英语发音、数学题干读题等场景要求,在技术层面又需要非常准确发出老师所需要的音调,同时面对于低龄教学的自然拼读也必须游刃有余。为了保证教学的质量,这些平时不被当做是问题的“小痛点”变成了猿辅导AI研发必须攻克的关键目标。
基于猿辅导在语音识别领域的长期投入,技术团队在本次大赛中加入更多韵律信息,使得语音合成的效果更加流畅、自然、有节奏感,并最终因此夺得桂冠。这种从实际需求出发,解决用户、教师、教育多方面痛点的方式,正是猿辅导在AI研发方面的主要发展路径。
猿辅导对技术的大规模投入,可以追溯到2014年成立在线教育行业内首家AI研究院开始。在全国范围内,猿辅导是目前研发水平、科研力量、研发投入均名列前茅的在线教育公司。过去9年内,猿辅导核心的语音识别、图像技术等方面,均获得了多项国际大奖和荣誉:
2018年,猿辅导AI研究院的MARS数据模型获“MS MARCO机器阅读理解水平测试”第一名;2019年, 猿辅导AI研究院发表的论文《通过预训练拷贝增强的神经网络模型提升及其语法纠错效果》被国际计算语言学协会主办的“NAACL 2019”全球论文名单收录;2020年3月,猿辅导AI研究院《基于人工智能的少儿教育发展研究》课题正式入选教育部国家级重点课题;2020年1月,小猿搜题APP入选教育部“未来学校研究与实验计划”。
技术的突破对教学效率和学习体验的提升,产生了正向的推动。仍旧以语音合成技术为例,对教师来说,成熟的语音合成技术运用到备课工作中,既扩大了教学资源的供给量,又可以让教师将更多的精力投入到课程设计、学生互动当中;对学生来说,语音合成技术提供给学生更多低成本练习技能的学习途径,例如口语评测技术可以实现机器对学生在语言学习中的发音做打分和反馈,实现随时随地练习。同时,还可以针对学生不同的学习程度,生成有针对性的练习题,效率更高。
在线教育进入技术PK阶段,长期主义考验技术实力
截至目前,猿辅导产品矩阵已经覆盖了在线教育多个细分赛道及领域,并通过对产品的AI研发,构筑了完整的教学生态:猿辅导网课、猿题库、小猿搜题、小猿口算、斑马AI课等多款在线教育产品,均可为用户提供网课、智能练习、难题解析等多元化的智能教育服务,帮助学生系统性、高效率地完成学习闭环。
面向未来,猿辅导对技术研发的投入还在继续。近日,猿辅导宣布投资40亿,在武汉光谷兴建“第二总部”教育科技研发及运营中心。该中心建成后,将容纳2万名员工,成为猿辅导在全国面积最大、员工数量最多的办公园区,承接猿辅导、斑马英语等核心业务的研发和运营,并成为全球最大的“教育+科研”基地。
更重要的是,猿辅导在研发方面的持续投入,也为在线教育促进教育普惠提供了充分的技术支撑。正如猿辅导联合创始人李鑫所言,科技带来的巨大变化让资源更加均衡,让好的教育资源更好地覆盖到每一位学生,同时人工智能和大数据等技术也能让在线教育更加个性化,极大提升学习效率和体验。
从当前到未来,人工智能的发展,将对教育内容、模式、方法、体系、评估等带来影响和变革机遇。人工智能不仅在技术层面解放了教师的生产力,还能根据学习者的思维方式、学习特点匹配学习内容,让教育更加精准化、定制化。这让“统一教学”到“个性教学”的实现成为了单纯的时间问题。
在人工智能等技术已经展示了推动教育变革的巨大潜能背景下,猿辅导在技术研发上的“长期主义”式坚持,正在成为继续领跑在线教育行业的关键助力。
(免责声明:此文内容为本网站刊发或转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。)
评论排行