本地离线语音识别控制如何实现?
发布日期:2022-01-24
点击次数:2335
随着离线语音行业的发展,生产厂家总结出了离线语音识别的较为完善的解决方案,在进行一些口音问题时,可以通过不同的需求使用不同的模型,如果是全国范围内的出售,那就可以使用音素模型,如果只是在某地出售,那就可以使用整词模型。对于噪音问题,可以让声学前端先处理,然后再去语音识别模块去进行处理,这样可以有效的减少噪音的影响,提高识别率。下面由轻生活科技小编继续跟大家聊聊天吧!
想要快速的完成命令词的录入,那么就会使用到深度神经网络语音识别技术;离线语音模块中,需要录入数量挺多的操作命令词,想要做到跟唤醒词差不多的特训,那就会使得成本加大,并且工作量会增加。如果是命令词众多的,那就可以使用深度神经网络语音识别技术,首先从语音的输入开始,然后到语音检测、语音语音特征的提取以及DNN运算采用硬件架构设计,软件进行语音解码,这样可以有高识别率以及高实时性,这样的效果可达直接商用的程度。
如果有大量指令词,那么使用TDNN、DNN等语音识别商务的算法,然后跟完整的语法文件相组合,这样能快速的让指令词达到可商用的程度,后续的话,也可以通过一些语音大脑模组,进行动态更新识别指令集,保持离线识别的准确率。
一般离线语音的语音库都集中在IC之中,这样可以更加快速便捷的让用户进行语音控制,但是,这会增加硬件的一个成本,所以很多生产厂家都会去找寻那些价格实惠,性价比高且不影响语音识别性能的IC。
而想要降低离线语音IC的成本,那就得从多方面去考虑,重要的是芯片,而芯片里面的外围电路是比较重要的部分,而算法也是比较重要的,如果算法能后的到进一步的提升,那么算力的占用空间就越来越少。现在芯片的集成程度都比较高,外围电路也相对简单一些,成本也是会低一些。可以通过语音识别专用的硬件来进行加速的推演算法,这样也可以降低IC的一个成本。
免责声明: 本文章转自其它平台,并不代表本站观点及立场。若有侵权或异议,请联系我们删除。谢谢! |