ASRU 2019 中英混杂语音识别挑战赛最终结果近日出炉,儒博语音团队凭借在中英文声学模型音素建模方面的传统经验,以及面向语言教育行业的人工智能软硬件整体解决方案儒博AI老师累积的中英文混合语料等业务数据,在此比赛中采用 TDNN-F 高效神经网络建模技术对中英文音素分别建模,并通过大量实验调整各种语言模型语料的权重和占比,最终斩获赛道二自由语言模型评测三等奖。
ASRU 2019 中英混杂语音识别挑战赛由中国计算机会学会语音对话与听觉专业组、西北工业大学音频语音与语言处理研究组、数据堂(北京)科技股份有限公司共同发起的,旨在促进多语种混杂语音识别领域的研究和技术交流。挑战赛吸引了国内外近百个团队参加,其中包括众多在语音识别技术领域拥有卓越研究成果的知名企业和高校。
西北工业大学计算机学院教授、中国计算机学会语音对话与听觉专业组常务委员谢磊教授指出,中英混杂是一个语音识别中的挑战性问题,而当前数据极为稀缺。
“本次比赛是对儒博语音技术团队从技术实力到开发能力的一个中期考核。” 儒博 AI 技术中心副总裁(前Nuance大中华区语音技术研发总监)徐燃博士表示,“团队成立不到一年便斩获此次大奖,得益于儒博 AI 老师业务板块前期积累的大量数据和在儿童教育机器人领域的专注,这些积淀使得团队能短时间内在中英文混合识别方面有所突破。”
据悉,儒博语音技术团队组建于2019年初,不到一年的时间完成了语音识别技术从无到有,从使用供应商技术到技术完全自主化的过程。目前,儒博已经建立了完整的语音技术栈:从前端信号处理、麦克风阵列解决方案、嵌入式唤醒词到云端中文,中英文和英文识别以及教育发音评估系统。儒博已完全实现语音识别相关技术的自主化和产品应用,并具备了对内和对外的全方位技术输出能力。
徐燃博士指出,通过人工智能教学解决方案儒博AI老师助力语言教育行业为孩子提供交互式、拟人化、个性化、寓教于乐的英语教育是儒博的重要业务方向之一。中英文混合识别的性能和专项定制化及优化能力是提供AI教育必须的核心技术,儒博 AI 技术团队将持续专注于研发和演进。
儒博CEO雷宇表示,优秀的团队、领先的技术、以用户为出发点的产品和服务是儒博立足的根本。斩获该奖项是对我们2019年在语音技术领域取得成绩的认可,也是对儒博坚定以AI和机器人技术赋能教育方向的肯定。
据了解,儒博凭借语音技术团队领先行业的技术实力,目前可面向语言教育培训行业提供多种定制化解决方案和服务:
1.前端信号处理和麦克风阵列解决方案: 能够提供降噪、回声消除、音源定位、说话人分离等核心信号处理技术,并设计多麦克风阵列包括环形阵列及线性阵列的信号处理解决方案,为智能音箱、机器人等智能终端提供前端语音信号处理,以保证语音输入的质量能够满足语音识别的要求;
2.嵌入式唤醒词解决方案和优化订制:能够为各种智能终端设备提供低系统资源占用的中英文甚至其他语言的唤醒词订制和优化方案,满足高唤醒率和低误唤醒的业务需求;
3.云端开放式中文、英文和中英文混合听写服务:提供开放的云端接口供各种业务使用云端语音识别转写服务,针对客户业务进行专项快速优化;
4.教育发音评估服务:提供开放的云端接口供教育产品使用英文单词跟读、句子跟读的发音评估服务,对单词、句子的发音质量进行评分,以及音标级别发音纠错。
(责任编辑:阳光)
下一篇:助力京蒙扶贫协作,内蒙古阿尔山风光抖音视频播放量超2.3亿
【免责声明:本网有部分文章是通讯员转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便我们及时对相关文章进行删除或其他方式处理 。对于不当转载或引用本网站内容而引起的民事纷争、行政处理或其他损失,本网站不承担责任。谢谢监督!】