【“ZiDongHua”之创新&科技观察:自动语音识别、泰语语音识别AI】由Chula Computer Engineering的Ekapol Chuangsuwanich博士牵头的团队开发了"Gowajee",这个泰语语音识别AI能够更自然、更准确地理解和执行泰语命令。实际使用情况表明,语言错误发生率仅为9%,而其他语言识别AI则为15%。

 

 

"Gowajee"----来自Chula的泰语语音识别AI

 

 

Chula Engineering教授设计了"Gowajee",这是一种泰语语音识别AI,具有母语使用者的准确性,可确保用户的数据安全。该AI现已被部署到呼叫中心,并用于抑郁症患者筛查。

 


"Gowajee"——来自Chula的泰语语音识别AI

我们已习惯对Google或Siri等AI使用语音命令,但泰语使用者可能会厌烦AI不理解他们的吐字发音,从而导致转录发生错误。

意识到这个问题,Chula Computer Engineering的Ekapol Chuangsuwanich博士牵头的团队开发了"Gowajee",这个泰语语音识别AI能够更自然、更准确地理解和执行泰语命令。实际使用情况表明,语言错误发生率仅为9%,而其他语言识别AI则为15%。

Gowajee这个名字来源于"Go"和"Wajee"(意思是单词)。这个词被设计成类似于"OK Google"或"Hey Siri"的命令。Gowajee一词经过精心设计,与泰语中使用的任何其他单词都不同。

泰语声音数据库的编制工作于2017年开始,已经能够获取5000小时的数据,该团队认为这些数据足以准确地转录泰语。该AI有3个主要功能:

  1. 自动语音识别(ASR),可将语音转换为文本。
  2. 文本转语音(TTS),将一段文字转录成口语。
  3. 自动说话人验证(ASV),即通过声音进行身份验证。

Gowajee已被各种机构使用,如大学、公共和私营部门,尤其是在呼叫中心,其用户满意度非常高。

Gowajee也被用于在DMIND系统中筛查抑郁症患者。尽管情感环境具有挑战性,但Gowajee在解码情绪线索方面表现出色。

Gowajee和AI技术可用于许多其他场合,如牙科诊所、言语不清患者中风风险的检测、生活指导和听力障碍辅助。

"数据安全"是Gowajee的另一个优势,所有数据都存储在用户的数据库中,以确保其安全,对于像银行这样需要极高数据安全性的组织非常有用。