designbook:matlab

用Matlab实现语音识别

labview.jpg

  1. 安装有Matlab7.0 的计算机
  2. 高灵敏度麦克风
  3. 高保真耳机
  4. 已知频率音叉
  5. 硬币和胶泥等

Matlab是一款功能强大的数据处理软件,它对于科研中的大量数据分析和处理带来了极大的便捷,对于现代科研来说,熟悉和掌握它是一项不可缺少的技能。Matlab还附带了大量的信号处理工具箱,如sptool、fdatool、wavelet、simulink工具箱等,为信号分析研究,特别是本项目相关的声波分析研究带来极大便利。Matlab可以通过声卡设备直接对于声波进行采集后进行处理。整个实验整个进行设计为现代科研模式,便于学生感受和学习科学的研究方法,也同时掌握Matlab采集数据,处理数据,分析数据的基本方法。

  1. 声音是什么?描写声音的表达式中主要包括哪些变量?
  2. 计算机是如何记录声音的,文件主要有哪些格式?其中主要的一些参数有哪些,各起什么作用?
  3. Matlab如何采集声音?
  4. 什么叫做傅立叶变换?Matlab如何实现傅立叶变换?
  5. 人的发声的基本原理是什么?
  6. 男女的声音为什么有高低,小孩和成年和老人的声音会有什么变化?
  1. 图书馆中找到一本适合自己程度的Matlab书籍作为自己应用过程中的索引和学习教材。(可以从下文中列举的书目中选择)
  2. 到网上找到2-3篇下文中列举到的论文,研读和学习其他项目组的基本方法。
  3. 编制一个简单的matlab程序,用来采集和分析声音数据。给出实验室提供的音叉的频率。
  4. 利用硬币和胶泥改变音叉的频率,试用你编写的matlab程序作为频率检测工具,寻找硬币位置和频率的关系。
  5. 设计更复杂的实验研究其他声音频率和强度相关的研究,当然仍然要利用你编写的matlab程序作为频率检测工具。
  6. 采集和分析你自己和同伴的声音数据,初步建立模型分析。
  7. 重复论文中提到的语音识别方法,如动态时间伸缩算法(DTW)和隐马尔科夫模型(HMM)。
  8. 设计实验改进上述算法或者设计自己的新算法,比较其优劣。

按照论文投递格式(篇幅限定于3-4页)对于你做出的研究结果写一份研究论文。

  1. Rabiner L, Juang B H. Fundamentals of Speech Recognition, Prentice-Hall International. Inc, 1999, p.17
  2. D.G.Childers, Matlab之语音处理与合成工具箱(影印版), 清华大学出版社, 2004, p.45-51
  3. 黄文梅, 熊桂林, 杨勇, 信号分析与处理—MATLAB语言及应用, 国防科技大学出版社, 2000, p.37-40
  4. 杨行峻, 迟惠生,“语音数字信号处理”, 电子工业出版社. 1995
  5. 张焱, 张杰, 黄志同, 语音识别中动态时间规整和隐马尔可夫统一模型 数据采集与处理 1997年03期 p.218-222
  6. 何强, 何英, MATLAB扩展编程[M], 清华大学出版社, 2002 p.345-347
  7. Rabiner L and Juang B H. Introduction to hidden Markov models, IEEE ASSP Mag, vol.3,no.1,4-16,1986
  8. Huang X D. Hidden Markov Models for Speech Recognition, Edinburgh Information Technology Series.1999(7):136-202
  9. Rabiner L, A tutorial on hidden Markov models and selected applications in speech recognition, Proc, of IEEE, 77(2)257-286,1989
  10. Jen+Tzung Chien, Predictive Hidden Markov Model Selection for Speech Recognition, IEEE Transaction on Speech and Audio Processing, vol.13, No.3, May 2005
  11. 谢锦辉, 隐Markov模型(HMM)及其在语音处理中的应用, 华中理工大学出版社.
  12. Christoph Gerber, A General Approach to Speech Recognition, Electronic Workshops in Computing, 1995
  13. Xu Bo, FENG Yuguang, YU Jinsong, Intelligent classifier for dynamic fault patterns based on Hidden Markov Model
  14. MATLAB Primer, seventh edition, Chapman & Hall/CRC 2005
  15. Ara V.Nefian. Luhong Liang, Dynamic Bayesian Networks for Audio-Visual Speech Recognition, EURASIP Journal on Applied Signal Processing 2002:11,1-15
  16. 马大猷,理论声学
  17. 王炳锡等,实用语音识别基础,国防工业出版社,2005年
  18. 董长虹,matlab小波分析工具箱原理与应用,国防工业出版社,2004
  19. 杨家沅,语音识别与合成,四川科学技术出版社,1994年
  20. 王炳锡,语音编码,西安电子科技大学出版社,2002年
  21. 飞思科技产品研发中心,MATLAB7辅助信号处理技术与应用,电子工业出版社,2003
  22. 王沫然,MATLAB与科学计算,电子工业出版社,2003年
  23. 吕军、曹效英,基于语音识别的汉语发音自动评分系统的初步设计,现代教育技术,2006.3,第16卷
  24. 董泽、谢华等,小波变换模极大值消噪算法的研究,电力科学与工程,2005,12~16
  25. 蒋文建,韦岗,一种多层子带的噪声语音识别新方法,数据采集与处理,2002.3,17卷第1期
  26. Okawa S,Bocchieri E,Potamianos A. Multi-band speech recognition in noisy environments[C]. In: ICASSP,1998.641~644.
  27. DONG SUK YUK. Robust-Speech Recognition Using Neural Networks and Hidden Markov Models Adaptions using non-linear transformations[J].Doctor Thesis, University of New Jersey 1999.
  • designbook/matlab.txt
  • 最后更改: 2007/07/22 21:35
  • (外部编辑)