用Matlab实现语音识别
实验室可提供的主要器材
- 安装有Matlab7.0 的计算机
- 高灵敏度麦克风
- 高保真耳机
- 已知频率音叉
- 硬币和胶泥等
实验目的、意义和要求
Matlab是一款功能强大的数据处理软件,它对于科研中的大量数据分析和处理带来了极大的便捷,对于现代科研来说,熟悉和掌握它是一项不可缺少的技能。Matlab还附带了大量的信号处理工具箱,如sptool、fdatool、wavelet、simulink工具箱等,为信号分析研究,特别是本项目相关的声波分析研究带来极大便利。Matlab可以通过声卡设备直接对于声波进行采集后进行处理。整个实验整个进行设计为现代科研模式,便于学生感受和学习科学的研究方法,也同时掌握Matlab采集数据,处理数据,分析数据的基本方法。
实验前应回答的问题
- 声音是什么?描写声音的表达式中主要包括哪些变量?
- 计算机是如何记录声音的,文件主要有哪些格式?其中主要的一些参数有哪些,各起什么作用?
- Matlab如何采集声音?
- 什么叫做傅立叶变换?Matlab如何实现傅立叶变换?
- 人的发声的基本原理是什么?
- 男女的声音为什么有高低,小孩和成年和老人的声音会有什么变化?
实验内容
- 图书馆中找到一本适合自己程度的Matlab书籍作为自己应用过程中的索引和学习教材。(可以从下文中列举的书目中选择)
- 到网上找到2-3篇下文中列举到的论文,研读和学习其他项目组的基本方法。
- 编制一个简单的matlab程序,用来采集和分析声音数据。给出实验室提供的音叉的频率。
- 利用硬币和胶泥改变音叉的频率,试用你编写的matlab程序作为频率检测工具,寻找硬币位置和频率的关系。
- 设计更复杂的实验研究其他声音频率和强度相关的研究,当然仍然要利用你编写的matlab程序作为频率检测工具。
- 采集和分析你自己和同伴的声音数据,初步建立模型分析。
- 重复论文中提到的语音识别方法,如动态时间伸缩算法(DTW)和隐马尔科夫模型(HMM)。
- 设计实验改进上述算法或者设计自己的新算法,比较其优劣。
实验报告要求
按照论文投递格式(篇幅限定于3-4页)对于你做出的研究结果写一份研究论文。
参考书籍与材料
- Rabiner L, Juang B H. Fundamentals of Speech Recognition, Prentice-Hall International. Inc, 1999, p.17
- D.G.Childers, Matlab之语音处理与合成工具箱(影印版), 清华大学出版社, 2004, p.45-51
- 黄文梅, 熊桂林, 杨勇, 信号分析与处理—MATLAB语言及应用, 国防科技大学出版社, 2000, p.37-40
- 杨行峻, 迟惠生,“语音数字信号处理”, 电子工业出版社. 1995
- 张焱, 张杰, 黄志同, 语音识别中动态时间规整和隐马尔可夫统一模型 数据采集与处理 1997年03期 p.218-222
- 何强, 何英, MATLAB扩展编程[M], 清华大学出版社, 2002 p.345-347
- Rabiner L and Juang B H. Introduction to hidden Markov models, IEEE ASSP Mag, vol.3,no.1,4-16,1986
- Huang X D. Hidden Markov Models for Speech Recognition, Edinburgh Information Technology Series.1999(7):136-202
- Rabiner L, A tutorial on hidden Markov models and selected applications in speech recognition, Proc, of IEEE, 77(2)257-286,1989
- Jen+Tzung Chien, Predictive Hidden Markov Model Selection for Speech Recognition, IEEE Transaction on Speech and Audio Processing, vol.13, No.3, May 2005
- 谢锦辉, 隐Markov模型(HMM)及其在语音处理中的应用, 华中理工大学出版社.
- Christoph Gerber, A General Approach to Speech Recognition, Electronic Workshops in Computing, 1995
- Xu Bo, FENG Yuguang, YU Jinsong, Intelligent classifier for dynamic fault patterns based on Hidden Markov Model
- MATLAB Primer, seventh edition, Chapman & Hall/CRC 2005
- Ara V.Nefian. Luhong Liang, Dynamic Bayesian Networks for Audio-Visual Speech Recognition, EURASIP Journal on Applied Signal Processing 2002:11,1-15
- 马大猷,理论声学
- 王炳锡等,实用语音识别基础,国防工业出版社,2005年
- 董长虹,matlab小波分析工具箱原理与应用,国防工业出版社,2004
- 杨家沅,语音识别与合成,四川科学技术出版社,1994年
- 王炳锡,语音编码,西安电子科技大学出版社,2002年
- 飞思科技产品研发中心,MATLAB7辅助信号处理技术与应用,电子工业出版社,2003
- 王沫然,MATLAB与科学计算,电子工业出版社,2003年
- 吕军、曹效英,基于语音识别的汉语发音自动评分系统的初步设计,现代教育技术,2006.3,第16卷
- 董泽、谢华等,小波变换模极大值消噪算法的研究,电力科学与工程,2005,12~16
- 蒋文建,韦岗,一种多层子带的噪声语音识别新方法,数据采集与处理,2002.3,17卷第1期
- Okawa S,Bocchieri E,Potamianos A. Multi-band speech recognition in noisy environments[C]. In: ICASSP,1998.641~644.
- DONG SUK YUK. Robust-Speech Recognition Using Neural Networks and Hidden Markov Models Adaptions using non-linear transformations[J].Doctor Thesis, University of New Jersey 1999.