注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡人工智能語音信號處理(第3版)

語音信號處理(第3版)

語音信號處理(第3版)

定 價:¥89.00

作 者: 韓紀慶,張磊,鄭鐵然 著
出版社: 清華大學出版社
叢編項: 人工智能科學與技術叢書
標 簽: 暫缺

ISBN: 9787302517603 出版時間: 2019-04-01 包裝: 平裝
開本: 16開 頁數(shù): 425 字數(shù):  

內(nèi)容簡介

  本書系統(tǒng)地介紹語音信號處理的基礎、概念、原理、方法與應用。全書共分9章。第1章介紹語音信號處理及其發(fā)展過程; 第2章介紹語音信號的產(chǎn)生與人類聽覺的機理,傳統(tǒng)的線性語音產(chǎn)生模型,以及非線性語音產(chǎn)生模型; 第3章從語音信號的時域特征入手,引入時頻分析的思想,并進一步闡述時頻分析中短時傅里葉變換和小波變換在語音信號特征分析中的應用,最后對廣泛使用的倒譜特征以及同態(tài)解卷積進行介紹; 第4章介紹語音信號的線性預測原理、解法、幾種推演方法以及線譜對分析法; 第5章介紹語音編碼的相關知識,包括語音的波形編碼、極低速率語音編碼技術,以及相關編碼器的性能指標和評測方法; 第6章介紹語音識別的基本內(nèi)容,從基于矢量量化的識別技術到動態(tài)時間歸正的識別技術,從隱馬爾可夫模型技術到基于深度學習的語音識別技術,從孤立詞識別到連接詞識別及連續(xù)語音識別技術,再到關鍵詞檢出技術,最后還介紹新興起的語音識別應用技術,以及用于HMM系統(tǒng)構(gòu)建的HTK工具和用于深度學習系統(tǒng)構(gòu)建的Kaldi工具等; 第7章介紹說話人識別的基本內(nèi)容,從基于GMMUBM的識別技術到基于支持向量機的識別技術,從基于聯(lián)合因子分析的識別技術到基于ivector的識別技術,以及近年來受到關注的基于深度學習的識別技術等; 第8章介紹頑健語音識別技術,從影響語音識別性能的環(huán)境變化因素分析開始,介紹噪聲環(huán)境下頑健語音識別技術,以及變異語音識別的技術; 第9章介紹語音合成的基本原理、線性預測合成、共振峰合成以及漢語按規(guī)則合成,以及基于HMM的合成技術等內(nèi)容。 本書可作為高等院校計算機應用、信號與信息處理、通信與電子系統(tǒng)等專業(yè)及學科的高年級本科生、研究生教材,也可供該領域的科研及工程技術人員參考。

作者簡介

  韓紀慶現(xiàn)任哈爾濱工業(yè)大學計算機科學與技術學院二級教授、學校長聘崗教授、博士生導師。兼任中國中文信息學會理事及語音處理專委會副主任、全國人機語音通訊學術會議常設機構(gòu)委員會副主席、《中文信息學報》編委、《數(shù)據(jù)采集與處理》雜志編委。長期從事語音信號處理、音頻信息處理等領域的教學與科研工作。作為項目負責人,正在主持和已經(jīng)完成“國家自然科學基金重點項目”2項、“面上項目”5項、“國家973計劃”課題1項、教育部“跨世紀優(yōu)秀人才培養(yǎng)計劃”基金1項及其他科研項目10余項。獲省部級科技二等獎3項、三等獎2項。獲國家發(fā)明專利7項。已在國內(nèi)外刊物和會議上發(fā)表論文200余篇,并出版圖書5部。

圖書目錄

目錄




第1章緒論

1.1語音信號處理的發(fā)展

1.2語音信號處理的應用

1.3語音信號處理的總體結(jié)構(gòu)

參考文獻

第2章語音信號的聲學基礎及產(chǎn)生模型

2.1語音信號的產(chǎn)生

2.1.1語音的發(fā)音器官

2.1.2語音的聲學特征

2.1.3語音信號在時域和頻域的表示

2.1.4漢語中語音的分類

2.1.5漢語語音的韻律特性

2.2語音信號的感知

2.2.1聽覺系統(tǒng)

2.2.2聽覺特性

2.2.3掩蔽效應

2.3語音信號的線性產(chǎn)生模型

2.3.1激勵模型

2.3.2聲道模型

2.3.3輻射模型

2.4語音信號的非線性產(chǎn)生模型

2.4.1調(diào)頻調(diào)幅模型的基本原理

2.4.2Teager能量算子

2.4.3能量分離算法

2.4.4調(diào)頻調(diào)幅模型的應用

參考文獻

第3章語音信號的特征分析

3.1語音信號數(shù)字化

3.1.1語音信號的采樣和量化

3.1.2短時加窗處理

3.2語音信號的時域分析

3.2.1短時能量分析

3.2.2短時平均過零率

3.2.3短時自相關函數(shù)和短時平均幅度差函數(shù)

3.2.4端點檢測和語音分割

3.3語音信號的頻域分析

3.3.1濾波器組方法

3.3.2傅里葉頻譜分析

3.4傳統(tǒng)傅里葉變換缺點及時頻分析的思想

3.4.1信號的時頻表示

3.4.2不確定原理

3.5Gabor變換

3.6小波變換在語音信號分析中的應用

3.6.1小波的數(shù)學表示及意義

3.6.2小波分析特點

3.6.3小波變換的多分辨分析

3.6.4小波變換在語音處理中的應用

3.7語音信號的同態(tài)解卷積

3.7.1同態(tài)信號處理的基本原理

3.7.2語音信號的復倒譜

3.7.3避免相位卷繞的算法

3.7.4基于聽覺特性的Mel頻率倒譜系數(shù)

3.8語音信號特征應用

3.8.1基音周期估計

3.8.2共振峰的估計

參考文獻

第4章語音信號的線性預測分析

4.1線性預測的基本原理

4.2線性預測方程組的解法

4.2.1自相關法

4.2.2協(xié)方差法

4.2.3格型法

4.2.4幾種求解線性預測方法的比較

4.3線性預測的幾種推演參數(shù)

4.3.1歸一化自相關函數(shù)

4.3.2反射系數(shù)

4.3.3預測器多項式的根

4.3.4LPC倒譜

4.3.5全極點系統(tǒng)的沖激響應及其自相關函數(shù)

4.3.6預測誤差濾波器的沖激響應及其自相關函數(shù)

4.3.7對數(shù)面積比系數(shù)

4.4線譜對分析法

4.4.1線譜對分析的原理

4.4.2線譜對參數(shù)的求解

4.5感知線性預測PLP系數(shù)

參考文獻

第5章語音編碼

5.1波形編碼

5.1.1均勻量化PCM

5.1.2非均勻量化 PCM

5.1.3自適應量化PCM

5.1.4差分脈沖編碼

5.1.5自適應差分脈沖編碼

5.1.6增量調(diào)制和自適應增量調(diào)制

5.1.7子帶編碼

5.1.8自適應變換域編碼

5.2參數(shù)編碼和混合編碼

5.2.1參數(shù)編碼

5.2.2基于全極點語音產(chǎn)生模型的混合編碼

5.2.3基于正弦模型的混合編碼

5.3極低速率語音編碼技術

5.3.1400bps~1.2Kbps的聲碼器

5.3.2識別合成型聲碼器

5.4語音編碼器的性能指標和質(zhì)量評測方法

5.4.1編碼速率

5.4.2頑健性

5.4.3時延

5.4.4計算復雜度和算法的可擴展性

5.4.5語音質(zhì)量及其評價方法

5.5語音編碼國際標準

5.6感知音頻編碼

5.6.1感知編碼的一般框架

5.6.2心理聲學模型

5.6.3常用的感知編碼標準

參考文獻

第6章語音識別

6.1概述

6.2基于矢量量化的識別技術

6.2.1Kmeans矢量量化算法

6.2.2LBG算法

6.3動態(tài)時間歸正的識別技術

6.3.1DTW基本原理

6.3.2模板訓練算法

6.4隱馬爾可夫模型技術

6.4.1HMM基本思想

6.4.2HMM基本算法

6.4.3HMM算法實現(xiàn)中的問題

6.4.4關于HMM訓練的幾點考慮

6.5連接詞語音識別技術

6.5.1連接詞識別問題的一般描述

6.5.2二階動態(tài)規(guī)劃算法

6.5.3分層構(gòu)筑方法

6.6大詞表連續(xù)語音識別中的聲學模型和語言學模型

6.6.1聲學模型

6.6.2統(tǒng)計語言學模型

6.6.3統(tǒng)計語言學模型平滑技術

6.6.4語言學模型自適應技術

6.7大詞表連續(xù)語音識別中的解碼技術

6.7.1圖的基本搜索算法

6.7.2面向語音識別的搜索算法

6.8大詞表連續(xù)語音識別后處理技術

6.8.1語音識別中間結(jié)果的表示形式

6.8.2錯誤處理

6.8.3最小字錯誤率解碼方法

6.9基于HMM的自適應技術

6.9.1基于Bayesian理論的自適應方法

6.9.2基于變換的自適應方法

6.10基于深度學習的語音識別技術

6.10.1基于DNNHMM的語音識別技術

6.10.2基于RNN的語音識別技術

6.10.3端到端的語音識別技術

6.11關鍵詞檢出技術

6.11.1問題描述

6.11.2關鍵詞檢出系統(tǒng)的組成

6.11.3垃圾模型建模方法

6.11.4語音解碼器的設計

6.11.5關鍵詞確認過程

6.11.6關鍵詞檢出系統(tǒng)性能優(yōu)化

6.12語音識別的應用技術

6.12.1語音信息檢索

6.12.2發(fā)音學習技術

6.12.3基于語音的情感處理

6.12.4網(wǎng)絡環(huán)境下的語音識別

6.12.5嵌入式語音識別技術

6.13HTK工具介紹

6.13.1數(shù)據(jù)準備階段

6.13.2模型訓練階段

6.13.3識別階段

6.14Kaldi工具介紹

6.14.1Kaldi工具簡介

6.14.2Kaldi工具安裝

6.14.3數(shù)據(jù)準備

6.14.4特征提取

6.14.5模型訓練

6.14.6性能評測

參考文獻

第7章說話人識別

7.1概述

7.2基于GMM與GMMUBM說話人識別

7.2.1GMM的說話人識別

7.2.2GMMUBM的說話人識別

7.3基于SVM的說話人識別

7.3.1SVM說話人識別

7.3.2基于GMM均值超矢量的SVM說話人識別

7.3.3基于GMM得分的SVM說話人識別

7.4復雜信道下的說話人識別

7.4.1特征映射

7.4.2說話人模型合成

7.4.3擾動屬性投影

7.4.4聯(lián)合因子分析

7.5基于ivector的說話人識別

7.5.1基于GMMUBM的ivector說話人識別

7.5.2基于DNN的ivector說話人識別

7.6得分規(guī)整

7.6.1零規(guī)整

7.6.2測試規(guī)整

7.6.3說話人自適應的測試規(guī)整

7.6.4TZnorm

7.6.5Hnorm

7.6.6Cnorm

參考文獻

第8章頑健語音識別技術

8.1概述

8.2影響語音識別性能的環(huán)境變化因素

8.3噪聲環(huán)境下的頑健語音識別技術

8.3.1基于語音增強的方法

8.3.2通道畸變的抑制方法

8.3.3基于模型的補償方法

8.4變異語音識別方法

8.4.1變異語音的分析

8.4.2變異語音的分類

8.4.3變異語音的識別

參考文獻

第9章語音合成

9.1語音合成的基本原理

9.2參數(shù)合成方法

9.2.1線性預測合成方法

9.2.2共振峰合成方法

9.3波形拼接合成技術

9.3.1TDPSOLA算法

9.3.2FDPSOLA算法

9.4漢語按規(guī)則合成

9.4.1韻律規(guī)則

9.4.2多音節(jié)協(xié)同發(fā)音規(guī)則合成

9.4.3輕聲音節(jié)規(guī)則合成

9.4.4兒化音節(jié)的規(guī)則合成

9.5基于HMM的參數(shù)化語音合成技術

9.5.1基于HMM參數(shù)語音合成系統(tǒng)的訓練

9.5.2基于HMM參數(shù)語音合成系統(tǒng)的合成階段

參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.shuitoufair.cn 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號