近日,中国电信人工智能研究院(TeleAI)取得了重大突破,发布了业界首款能够支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。这一创新打破了以往单一模型只能识别某一种特定方言的限制,能够同时识别并理解粤语、上海话、四川话、温州话等多达30余种的方言,成为了国内支持方言种类最多的语音识别大模型。
为了构建这一模型,中国电信人工智能研究院首先着手建立了庞大且高质量的方言数据库。目前,该研究院已经成功构建了覆盖超过30种方言、总时长超过30万小时的高质量数据库,这一数据库在方言的丰富性和质量上都处于行业领先地位。
星辰语音大模型的应用已经广泛落地并产生了显著效果。在福建、江西、广西、北京、内蒙古等地的中国电信万号智能客服中,该模型已经得到了试点应用。通过接入星辰大模型,万号智能客服能够迅速理解30种方言,为用户提供自然而流畅的服务,每天能够处理大约200万通电话。同时,智能客服翼声平台也通过接入星辰大模型的语音理解和分析能力,实现了全国31个省份的全覆盖,每天处理125万通客服电话。
此外,星辰语音大模型还在多地市的12345政务服务平台中得到了应用。通过该模型,客服人员能够迅速理解30种方言,更自然、更流畅地理解市民的需求,从而提升沟通效率,助力政务工作的智能化升级,为每一位市民提供更高效、更便捷的服务。
值得一提的是,星辰语音大模型已经对外开源,这将有助于推动整个行业的进步和发展。未来,中国电信人工智能研究院将继续深耕研发创新,致力于提高支持方言的数量和识别的准确度。他们的目标是建成首个能够覆盖全国333个地市方言和主要少数民族语言的语音识别大模型,为语音识别的普及和应用贡献更大的力量。