News-2021-03-12

From cslt Wiki
Jump to: navigation, search

近日,清华大学国家研究中心语音和语言技术团队撰写的《语音识别基本法》一书由电子工业出版社出版,张景中院士为该书做序。目前,该书已在京东、当当、天猫等各大网站上架销售。

微信图片 20210313124740.png

全书共256页,约30万字,共13章。本书结合当下使用广泛的Kaldi语音平台,对语音识别的基本概念和流程进行了详细讲解,包括 GMM-HMM、DNN-HMM、端到端等常用结构,并探讨了语音识别在实际应用中的诸多问题,包括说话人自适应、环境鲁棒性、小语种语音识别、关键词识别与嵌入式应用等方面;同时,本书还对语音技术的相关前沿课题进行了介绍,包括说话人识别、语种识别、情绪识别、语音合成等方向。

本书由汤志远博士主笔,王东教授、李蓝天博士、石颖博士等参与撰写,蔡云麒博士和郑方教授指导校正。本书既可以作为语音识别初学者的入门读物,也可以作为相关领域技术人员拓展视野的参考书。