注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡軟件與程序設計自然語言理解與行業(yè)知識圖譜:概念、方法與工程落地

自然語言理解與行業(yè)知識圖譜:概念、方法與工程落地

自然語言理解與行業(yè)知識圖譜:概念、方法與工程落地

定 價:¥119.00

作 者: 王楠,趙宏宇,蔡月 著
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111698302 出版時間: 2022-02-01 包裝:
開本: 頁數: 字數:  

內容簡介

  本部分首先闡述自然語言理解的發(fā)展脈絡和理解邏輯,主要圍繞語言符號、處理體系、語義理解等進行探討,引出自然語言理解的自動分析原理和方法,包括自然語言特征、統(tǒng)計學習、機器學習、深度學習、知識圖譜等。第1章概述自然語言發(fā)展脈絡,描述了語言理解的研究現(xiàn)狀、商業(yè)形勢、認知突破口和未來預測。第2章梳理語言理解的演變流程,介紹我們面臨的各類自然語言理解任務,最后給出語言理解的研究體系框架,引出自然語言理解的基礎——自然語言處理。第3章重點介紹自然語言處理相關特征工程和文本任務對應的各類算法模型、深度學習的前沿進展。語言處理需要考慮特征構造(字、詞、句、章級別)和特征表示,以利于后續(xù)自動處理。在特征表示方面,從早的符號表示到現(xiàn)在的張量表示,形成統(tǒng)計學習的基礎。接下來結合統(tǒng)計學習框架,論述語言學習原理和語言模型,結合概率圖模型和其他機器學習算法,闡述這些常規(guī)算法在自然語言處理任務中的應用和效果。然后進一步討論深度學習的各類算法,對語言學習中的神經網絡算法和新成果進行分析。最后探討現(xiàn)有處理方法的發(fā)展邊界,提出引入外源知識(知識圖譜)來提高認知能力的必要性。第4章系統(tǒng)介紹知識圖譜,包括知識圖譜工程和知識圖譜智能。然后梳理國內外常見的通用知識圖譜,并進一步總結熱門行業(yè)的知識圖譜發(fā)展現(xiàn)狀。最后結合語言知識和知識圖譜的搭建流程,引入語義特征,通過行業(yè)文本實例操作,幫助讀者了解語義理解的本質。行業(yè)知識圖譜部分包含第5~8章。本部分在上述基本自然語言處理方法講解的基礎上,繼續(xù)闡述行業(yè)知識圖譜搭建和行業(yè)應用的方法。目前從事自然語言理解的公司都將精力放在通用文本理解上,這些文本往往口語化嚴重、特征雜亂、信息量不足,導致算法處理形成的最終產品的用戶體驗不佳。考慮到行業(yè)文本往往有一定規(guī)范,相對容易取得突破口,也有利于推動行業(yè)發(fā)展,所以我們選擇從行業(yè)文本出發(fā),以專利文本實操作為樣板。第5章介紹行業(yè)知識工程實踐,以專利行業(yè)為例,詳細地描述了一個行業(yè)知識工程建設的過程。首先基于自然語言處理和知識圖譜搭建方法,建設行業(yè)知識庫,包括術語庫、產品庫、技術庫、標準庫、規(guī)則庫等,進而開發(fā)行業(yè)主題分析模型、行業(yè)文本分類算法、相似度計算方法、價值評估方法和機器翻譯方法。第6章介紹知識圖譜模塊的搭建,包括關鍵詞助手、語義搜索、分級管理、高級分析、推薦和問答等。結合實際應用,探討知識圖譜在提高智能性方面的能力和效果。第7章在前面知識工程和知識圖譜智能基礎上搭建智能應用平臺,介紹了平臺的各類功能組件,描述了自下而上的軟件服務封裝邏輯,進一步向上封裝為行業(yè)文本分析功能組件,包括檢索、分析、挖掘、管理、預警、運營等。讀者可以將這套思路在各行業(yè)進行實踐驗證,將上述組件和權限、安全板塊集成為應用平臺,搭建常態(tài)化文本分析運營平臺,完成平臺級別或各細分模塊的商業(yè)產品落地。第8章依托智能應用平臺,結合實踐案例給出團隊的應用經驗,即通過四個行業(yè)案例來驗證平臺的認知能力?!蹲匀徽Z言理解與行業(yè)知識圖譜:概念、方法與工程落地》以自然語言理解和行業(yè)知識圖譜應用落地為目標,闡述了一個從0到1的行業(yè)文本理解案例。《自然語言理解與行業(yè)知識圖譜:概念、方法與工程落地》為互聯(lián)網企業(yè)的智能平臺構建提供了很好的案例參考,也為行業(yè)信息化從業(yè)者提供了從入門到進階的技術指導,適合作為自然語言處理、知識圖譜、計算機、人工智能等領域從業(yè)者的學習指導書,也非常適合對自然語言處理、知識圖譜感興趣的學生和創(chuàng)業(yè)團隊閱讀。

作者簡介

  王楠,北京大學博士,“創(chuàng)青春-中關村U30”2020年度優(yōu)勝者,先后任教于中國科學院、北京信息科技大學計算機學院。研究方向包括人工智能算法、知識圖譜、自然語言處理與地球電磁學等。主持或參與國家科技重大專項、高分專項、軍口預研、衛(wèi)星系統(tǒng)、企業(yè)大數據系統(tǒng)等科研項目,累計獲得研發(fā)經費超過千萬元人民幣。負責企業(yè)級“專利大數據智能分析系統(tǒng)”的研發(fā),領導技術團隊完成軟件平臺搭建、商用和優(yōu)化。以作者身份發(fā)表行業(yè)內高水平論文十余篇,獲得多項發(fā)明和實用新型專利,提交專利申請十余項。趙宏宇,現(xiàn)就職于騰訊看點搜索團隊,擔任算法研究員。有多年NLP、搜索系統(tǒng)、推薦系統(tǒng)的工作經驗,涉及專利、招聘和網頁搜索等場景。精通PyTorch、TensorFlow等主流深度學習框架,擅長運用NLP前沿技術解決工業(yè)項目難題。在意圖識別、內容推薦、相關性排序等領域有多年實戰(zhàn)經驗。曾參與千萬級用戶求職領域的推薦工作,作為算法主要負責人,主導全新算法落地迭代、線上算法優(yōu)化以及上億DAU網頁搜索優(yōu)化迭代。曾與人合著《智能搜索與推薦系統(tǒng):原理、算法與應用》一書。蔡月,清華-深圳灣實驗室聯(lián)合培養(yǎng)博士后,于2017年獲得北京大學生物醫(yī)學工程博士學位。曾擔任東軟醫(yī)療上海磁共振研發(fā)中心高級算法研究員。研究方向為數據科學、磁共振圖像算法、深度學習等,擅長腦科學領域數據分析、磁共振圖像加速、去噪等算法研究。曾在腦科學領域SCI期刊Neuroscience、Neurotoxicity Research上發(fā)表多篇文章,獲得多項發(fā)明專利。

圖書目錄



本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.shuitoufair.cn 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號