基于多Web信息源的主題概念網(wǎng)絡獲取
發(fā)布時間:2020-12-09 01:57
Wikipedia一方面能夠提供關于特定百科條目的概念性描述;另一方面,也通過分類系統(tǒng)將這些百科條目組織成一個概念網(wǎng)絡.它對信息的廣泛覆蓋和有效組織使其成為了自動化知識獲取的常用信息源.然而,僅僅依靠Wikipedia自身的信息,還不足以準確地刻畫其內(nèi)部概念間的關聯(lián)性知識,而這是符號化知識表述的一個重要組成部分.因此,提出了一種基于多Web信息源的主題概念網(wǎng)絡獲取方法.它以Wikipedia的分類系統(tǒng)為基礎,同時利用搜索引擎收集相關的Web信息作為關聯(lián)性知識驗證和發(fā)現(xiàn)的參照系,并通過集成信息檢索和自然語言處理等領域的方法,實現(xiàn)了以給定的主題詞為核心,在Wikipedia分類系統(tǒng)對應的概念網(wǎng)絡中獲取面向該主題的概念網(wǎng)絡,同時網(wǎng)絡內(nèi)的概念間關系得到識別和標注.我們基于不同領域的主題詞進行了實驗,對實驗結果的經(jīng)驗性評估展示了所獲取的主題概念網(wǎng)絡既能滿足面向主題的要求,其內(nèi)部的概念關聯(lián)性知識又具備了一定的精度要求.
【文章來源】:計算機研究與發(fā)展. 2013年09期 第1843-1854頁 北大核心
【文章頁數(shù)】:12 頁
本文編號:2906051
【文章來源】:計算機研究與發(fā)展. 2013年09期 第1843-1854頁 北大核心
【文章頁數(shù)】:12 頁
本文編號:2906051
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/sousuoyinqinglunwen/2906051.html
最近更新
教材專著