語言知識庫是眾多自然語言處理系統(tǒng)不可或缺的組成部分,同時也是各種自然語言處理技術賴以實現(xiàn)的基礎。語言知識庫建設已經成為自然語言處理領域基本、重要的應用基礎研究之一。本書是以北京大學計算語言學研究所開發(fā)的綜合型語言知識庫為基礎,圍繞異質資源的集成創(chuàng)新這一主題,從資源集成的廣度和深度兩個方向開展研究的。首先,介紹了綜合型語言知識庫系統(tǒng)的構成及功能;其次,以名詞為切入點,研究從語料中自動獲取名詞語法屬性的方法,內容涉及數(shù)詞與名詞構成的數(shù)名結構,數(shù)詞、量詞與名詞構成的數(shù)量名短語及名詞與名詞構成的復合名詞短語,并對這3種屬性關系進行了詳細的句法和語義分析。