第1章 搜索引擎概述
1.1 搜索引擎的概念
1.2 搜索引擎的歷史
1.3 搜索引擎的分類
1.4 搜索引擎的關鍵技術
1.5 當代主要搜索引擎介紹
1.5.1 谷歌搜索
1.5.2 雅虎搜索
1.5.3 百度搜索
1.5.4 北大天網搜索
1.6 搜索引擎的發(fā)展
1.7 小結
思考題
第2章 搜索引擎的體系結構和工作原理
2.1 搜索引擎的體系結構
2.1.1 搜索器
2.1.2 索引器
2.1.3 檢索器
2.1.4 用戶接口
2.2 搜索引擎的工作原理
2.2.1 網頁搜集
2.2.2 網頁處理
2.2.3 查詢服務
2.3 元搜索引擎
2.3.1 元搜索引擎的基本構成
2.3.2 元搜索引擎的分類
2.3.3 常用元搜索引擎介紹
2.3.4 元搜索引擎的特點
2.3.5 主要技術指標
2.4 小結
思考題
第3章 信息處理技術
3.1 檢索模型
3.1.1 經典模型
3.1.2 代數模型
3.2 文本處理
3.2.1 詞法分析
3.2.2 分詞技術
3.2.3 無用詞匯刪除
3.2.4 詞干提取
3.2.5 索引詞選擇
3.2.6 詞典
3.3 文本壓縮
3.3.1 基本概念
3.3.2 統(tǒng)計方法
3.3.3 字典方法
3.3.4 倒排文檔壓縮
3.4 Web信息處理
3.4.1 Web信息的特點
3.4.2 Web信息的表現(xiàn)方式
3.4.3 Web信息系統(tǒng)結構
3.5 小結
思考題
第4章 信息檢索技術
4.1 順排檢索
4.1.1 表展開法
4.1.2 邏輯樹展開法
4.1.3 BF算法
4.1.4 KMP算法
4.1.5 BM算法
4.2 倒排檢索
4.2.1 倒排檢索
4.2.2 倒排文檔
4.2.3 逆波蘭表達式
4.2.4 檢索指令表的生成
4.2.5 檢索實施
4.3 其他檢索方法
4.3.1 布爾檢索
4.3.2 后綴樹和后綴數組
4.3.3 加權檢索
4.3.4 全文檢索
4.3.5 超文本檢索
4.4 web信息檢索
4.4.1 網頁的搜集
4.4.2 網頁的預處理
4.4.3 網頁索引的建立
4.4.4 相似度計算與排序方法
4.5 小結
思考題
第5章 信息檢索評價
5.1 相關性
5.1.1 相關性的特征
5.1.2 相關性類別
5.1.3 相關性模型
5.2 性能評價指標
5.2.1 有效性
5.2.2 查全率和查準率
5.2.3 其他指標
5.3 相關組織和會議
5.4 小結
思考題
第6章 網絡搜索引擎技術
6.1 搜索引擎的基本結構
6.1.1 搜索引擎的結構分類
6.1.2 網頁收集模塊
6.1.3 網頁索引模塊
6.1.4 查詢模塊
6.1.5 用戶界面
6.1.6 搜索引擎的主要指標及分析
6.2 搜索引擎的數據結構
6.2.1 存儲結構
6.2.2 信息庫
6.2.3 文本索引
6.2.4 詞典
6.2.5 采樣表
6.2.6 前向索引
6.2.7 后向索引
6.3 搜索引擎爬蟲
6.3.1 網絡爬蟲
6.3.2 深度優(yōu)先策略
6.3.3 廣度優(yōu)先策略
6.3.4 不重復抓取策略
6.3.5 網頁抓取優(yōu)先策略
6.3.6 網頁重訪策略
6.3.7 網頁抓取提速策略
6.3.8 Robots協(xié)議
6.3.9 網頁內容提取技術
6.4 小結
思考題
第7章 多媒體檢索概述
7.1 多媒體信息
7.1.1 多媒體及多媒體技術
7.1.2 音頻信息
7.1.3 圖形與圖像信息
7.1.4 視頻信息
7.2 多媒體的基本概念
7.2.1 多媒體技術的特點
7.2.2 多媒體信息系統(tǒng)
7.2.3 多媒體數據庫
7.2.4 多媒體信息檢索
7.3 多媒體數據壓縮
7.3.1 多媒體壓縮原理
7.3.2 多媒體壓縮編碼
7.4 多媒體內容的理解
7.4.1 圖像分割
7.4.2 特征提取
7.4.3 分類
7.5 多媒體信息檢索的關鍵技術
7.5.1 信息模型和表示
……
第8章 基于內容的多媒體信息檢索技術
第9章 搜索引擎開發(fā)技術
參考文獻