直接开源,阿里达摩院公布下一代工业级语音识别模型

2022-12-22 15:06 来源:IT之家   阅读量:7545   

阿里巴巴达摩院今日发布新一代语音识别模型Paraformer,适用于语音输入法,智能客服,车载导航,会议纪要等场景。

据介绍,这是业内首个非自回归端到端语音识别模型其推理效率最高可达传统模型的10倍,识别准确率在众多权威数据集排名第一目前该模型在魔术社区面向全社会开源

资料显示,用GPU推理,不同版本的Paraformer可以提高推理效率5—10倍同时,Paraformer采用6倍下采样的低帧率建模方案,可以减少近6倍的计算量,支持大模型的高效推理

本站了解到,阿里达摩院表示,Paraformer是阿里巴巴研发的下一代杀手级语音识别基础模型,未来将广泛应用于理解,钉钉语音转文本,高德导航等会议纪要产品中。

相关阅读:

阿里达摩院推出AI模型社区魔:开源300+ AI模型,可体验国画AI

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。