导读 随着人工智能战争的升温,科技巨头谷歌分享了它在去年 11 月宣布的通用语音模型 (USM) 取得的进展。作为支持世界上使用最多的语言的雄
随着人工智能战争的升温,科技巨头谷歌分享了它在去年 11 月宣布的通用语音模型 (USM) 取得的进展。
作为支持世界上使用最多的语言的雄心勃勃的计划的一部分,USM 是一个最先进的语音模型系列,拥有 20 亿个参数,这些参数经过 1200 万小时的语音训练,涵盖 300 多种语言的 280 亿个文本句子。
虽然它还没有达到 1000 种语言的目标,但它是谷歌的重要基础。
谷歌使用 USM 为 YouTube 上的视频生成实时字幕,这家搜索巨头表示,它不仅可以识别“英语和普通话等广泛使用的语言”,还可以识别“阿姆哈拉语、宿雾语、阿萨姆语和阿塞拜疆语等资源匮乏的语言”举几个例子”。
这些构建块将作为构建更大语言模型的基础。
谷歌在博文中写道:“USM 的开发是实现谷歌组织全球信息并使人人皆可访问的使命的关键努力。”
标签: