第1部分 緒論
第1章 基于文本方式的信息檢索
1. 1 布爾模型
1. 2 聚類模型
1. 3 向量模型
1. 4 概率模型
第2章 基于內容的多媒體檢索技術
2. 1 多媒體分析步驟
2. 2 多媒體特征提取
2. 3 多媒體數(shù)據(jù)流分割
2. 4 多媒體識別分類
第3章 WWW多媒體信息檢索
第2部分 基于內容的圖像檢索
第4章 圖像特征的提取與表達
4. 1 圖像顏色特征
4. 1. 1 顏色直方圖
4. 1. 2 顏色矩
4. 1. 3 顏色集
4. 1. 4 顏色聚合向量
4. 1. 5 顏色相圖
4. 2 圖像紋理特征
4. 2. 1 Tamura紋理特征
4. 2. 2 自回歸紋理模型
4. 2. 3 基于小波變換的紋理特征
4. 2. 4 其他紋理特征
4. 3 圖像形狀特征
4. 3. 1 傅立葉形狀描述符
4. 3. 2 形狀無關矩
4. 3. 3 基于內角的形狀特征
4. 3. 4 其他形狀特征
4. 4 圖像空間關系特征
4. 4. 1 基于圖像分割的方法
4. 4. 2 基于圖像子塊的方法
4. 5 圖像高維特征約減和索引
4. 5. 1 圖像高維特征縮減
4. 5. 2 圖像高維特征索引
第5章 圖像相似度比較方法
5. 1 圖像特征相似度比較
5. 1. 1 歐拉距離
5. 1. 2 直方圖相交
5. 1. 3 二次式距離
5. 1. 4 馬氏距離
5. 1. 5 非幾何的相似度方法
5. 2 圖像特征性能評價
5. 2. 1 顏色特征評價
5. 2. 2 紋理特征評價
第6章 圖像檢索中的相關反饋機制
6. 1 相關反饋技術分類
6. 2 查詢向量相關反饋
6. 2. 1 文本檢索中的相關反饋
6. 2. 2 圖像檢索相關反饋模型
6. 3 特征權重相關反饋
6. 3. 1 特征權重相關反饋結構
6. 3. 2 圖像特征歸一化
6. 3. 3 圖像特征權重調整
6. 4 其他圖像相關反饋技術
第7章 圖像檢索的現(xiàn)狀和未來
7. 1 現(xiàn)有圖像檢索系統(tǒng)
7. 2 圖像檢索未來發(fā)展趨勢
第3部分 視頻結構化與視頻檢索
第8章 視頻內容結構化
8. 1 視頻鏡頭邊緣檢測
8. 1. 1 絕對幀間差法
8. 1. 2 圖像像素差法
8. 1. 3 圖像數(shù)值差法
8. 1. 4 顏色直方圖法
8. 1. 5 壓縮域差法
8. 1. 6 矩不變量法
8. 1. 7 邊界跟蹤法
8. 1. 8 運動矢量法
8. 2 鏡頭邊緣閾值確定
8. 2. 1 像素點變化閡值
8. 2. 2 鏡頭切分閡值
8. 2. 3 鏡頭漸變閡值
8. 3 視頻關鍵幀提取
8. 3. 1 基于鏡頭邊界法
8. 3. 2 基于顏色特征法
8. 3. 3 基于運動分析法
8. 3. 4 基于聚類的關鍵幀提取
8. 4 視頻場景構造
8. 5 新聞類視頻結構化
8. 5. 1 視頻新聞內容分析
8. 5. 2 現(xiàn)有新聞類分析系統(tǒng)
第9章 視頻檢索和視頻反饋
9. 1 視頻檢索
9. 2 視頻相關反饋
9. 2. 1 視頻層次反饋
9. 2. 2 鏡頭層次的反饋
第10章 視頻檢索技術的現(xiàn)狀和未來
10. 1 視頻檢索的應用前景
10. 2 現(xiàn)有視頻檢索系統(tǒng)
10. 3 視頻檢索發(fā)展趨勢
第4部分 基于內容的音頻檢索
第11章 音頻信號特征提取與表達
11. 1 音頻時域特征提取
11. 1. 1 短時平均能量
11. 1. 2 過零率
11. 1. 3 線性預測系數(shù)
11. 2 音頻頻域特征提取
11. 2. 1 傅立葉級數(shù)
11. 2. 2 復數(shù)形式博立葉級數(shù)
11. 2. 3 傅立葉積分與連續(xù)頻譜
11. 2. 4 抽樣定理
11. 2. 5 連續(xù)信號的濾波與卷積
11. 2. 6 能譜特征
11. 2. 7 平均功率與功率譜特征
11. 2. 8 倒譜特征分析
11. 2. 9 LPC倒譜和Mel系數(shù)
11. 2. 10 其他頻域特征
11. 3 音頻時頻特征提取
11. 3. 1 短時傅立葉變換
11. 3. 2 小波變換
11. 3. 3 連續(xù)小波變換
11. 3. 4 離散小波變換
11. 3. 5 小波特征系數(shù)提取
11. 4 音頻例子特征提取
第12章 音頻分割與識別
12. 1 音頻分割算法
12. 1. 1 音頻分層分割
12. 1. 2 基于壓縮域特征音頻分割
12. 1. 3 基于模板的音頻分割
12. 2 音頻例子識別模型
12. 2. 1 基于隱馬爾可夫鏈音頻例子識別
12. 2. 2 基于增量支持向量機的音頻例子識別
12. 2. 3 基于最近特征線法的音頻例子識別
12. 2. 4 音頻例子混合識別模型
第13章 基于內容的音頻檢索技術
13. 1 相似音頻例子檢索
13. 1. 1 基于分類模型的音頻例子檢索
13. 1. 2 基于模糊聚類音頻例子檢索與音頻相關反饋
13. 2 廣播新聞結構化
13. 3 音樂檢索
第14章 音頻檢索的現(xiàn)狀與未來
14. 1 音頻檢索的類別
14. 2 音頻檢索未來與挑戰(zhàn)
第5部分 多媒體融合分析與檢索
第15章 多媒體融合分析
15. 1 多媒質特征融合
15. 2 單媒質交叉索引
15. 3 單媒質結果融合
第16章 多媒體融合檢索系統(tǒng)
16. 1 文本與視覺信息融合檢索
16. 2 結合文本和視覺的圖像檢索與反饋
16. 3 基于多模態(tài)融合的視頻結構化
16. 3. 1 多模態(tài)信息結構化新聞類視頻
16. 3. 2 音頻分析技術
16. 3. 3 視頻中的文本分析
16. 4 基于壓縮域音頻特征的足球比賽精彩場景識別提取
16. 4. 1 足球比賽的聲音特征
16. 4. 2 思路和實現(xiàn)方法
16. 4. 3 結果分析和比較
16. 5 基于支持向量機的視頻字幕提取
16. 6 基于人臉對象的多媒體內容分析
16. 7 基于多模態(tài)融合的視頻場景分析
第6部分 網上多媒體信息檢索系統(tǒng)
第17章 面向WWW多媒體檢索系統(tǒng)
17. 1 網絡信息收集Web Crawler
17. 2 面向WWW的多媒體檢索系統(tǒng)Webscope-CBIR
17. 3 網絡智能檢索界面
17. 4 個性化WWW檢索
第18章 發(fā)展與挑戰(zhàn)
18. 1 數(shù)字化圖書館
18. 2 特征維數(shù)約減與變換
18. 3 三維多媒體檢索
18. 4 基于關鍵塊的圖像檢索
18. 5 檢索復雜性度量
18. 6 新一代媒體表示對軟件和硬件的影響
18. 7 感知界面
18. 8 多媒體推理
18. 9 結論
附錄1 音頻處理工具HTK
附錄2 多媒體研究領域資料匯總
參考文獻