简介:摘要:近几十年来,在业内专家学者的努力下语音识别技术取得显著进步,已经从实验室走向市场。在这个过程中,深度学习和神经网络的发展做出不少贡献,但神经网络依赖大量数据而且神经网络模型具有不确定性,当训练数据与目标数据分布存在差异时识别效果可能非常差。在一些领域我们对识别系统的精度要求非常高。我们已经明显感觉到,语音识别技术在工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域都可以发挥重要作用。探索使用HMM模型来识别孤立词在我们的生活中具有重大意义。隐马尔可夫模型是成熟的模型,在语音识别,机器视觉等多个领域有着广泛的应用。隐马尔可夫模型能够很好地为语音等序列数据建模,可以很好地描述序列数据之间的关系。隐马尔可夫模型与GMM模型的完美融合可以使HMM模型在语音识别中更好地对状态进行建模从而提高识别率。因为GMM模型的加入使得HMM的观测矩阵更真实地贴近观测概率。加入GMM的HMM模型经过5个人的数据的训练其识别精确度可以达到87%。在数据量得到扩充的前提下效果有望达到100%。
简介:一引言1982年CD投放市场.20多年来,随着人们听觉审美品位的提高.越来越多的人对CD的音质感到不尽满意.认为它的声音与模拟的声音差距较大.充满了数字味“——声音较坚硬、偏冷.温暖感不够。于是HDCD.XRCD、DVD、DVD-Audio.SACD等新格式的唱片应运而生.其中.SACD又以其DSD这全新的模拟一数字转化技术备受青睐。但是这种技术跟传统的PCM技术相比较.音质究竟能有多大提升能否被人耳察觉或者敏锐地察觉:这种新技术是否真像开发商所说的那样“找到了一条还原声音的最佳方式,还是一种商业炒作。本文重点介绍的是DSD与PCM主观音质比较的初探工作及得出的结论。