基于卷積神經(jīng)網(wǎng)絡(luò)和關(guān)鍵詞策略的實(shí)體關(guān)系抽取方法
本文選題:卷積神經(jīng)網(wǎng)絡(luò)(CNN) + 關(guān)系抽取; 參考:《模式識(shí)別與人工智能》2017年05期
【摘要】:針對(duì)傳統(tǒng)的實(shí)體關(guān)系抽取方法在定義特征過程中費(fèi)時(shí)且容易造成錯(cuò)誤傳播,及現(xiàn)有深度學(xué)習(xí)方法依靠單一詞向量學(xué)習(xí)特征的不足,文中提出基于卷積神經(jīng)網(wǎng)絡(luò)和關(guān)鍵詞策略的實(shí)體關(guān)系抽取方法.在原始詞向量的基礎(chǔ)上,通過基于句子級(jí)的關(guān)鍵詞抽取算法(TP-ISP)獲得類別關(guān)鍵詞特征.類別關(guān)鍵詞的加入提高類別區(qū)分度,同時(shí)彌補(bǔ)網(wǎng)絡(luò)自動(dòng)學(xué)習(xí)特征的不足.在網(wǎng)絡(luò)訓(xùn)練階段,采用分段最大池化策略,減少傳統(tǒng)最大池化策略的信息丟失.實(shí)驗(yàn)表明,文中方法有利于提升實(shí)體關(guān)系抽取結(jié)果.
[Abstract]:Traditional entity relation extraction methods are time-consuming and prone to error propagation in defining features, and the existing in-depth learning methods rely on single word vector learning features. In this paper, an entity relation extraction method based on convolution neural network and keyword strategy is proposed. Based on the original word vector, the keyword feature of category is obtained by sentence level keyword extraction algorithm (TP-ISP). The addition of category keywords improves the classification and makes up for the deficiency of network automatic learning feature. In the stage of network training, the piecewise maximization strategy is adopted to reduce the information loss of the traditional maximization strategy. The experimental results show that the proposed method is helpful to improve the results of entity relation extraction.
【作者單位】: 太原理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;山西能源學(xué)院電氣與動(dòng)力工程系;
【基金】:國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)(No.2014AA015204) 山西省自然科學(xué)基金項(xiàng)目(No.2014011022-1) 中國(guó)科學(xué)院計(jì)算技術(shù)研究所網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室課題資助~~
【分類號(hào)】:TP183;TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 鄧擘;鄭彥寧;傅繼彬;;漢語實(shí)體關(guān)系模式的自動(dòng)獲取研究[J];計(jì)算機(jī)科學(xué);2010年02期
2 牟晉娟;包宏;;中文實(shí)體關(guān)系抽取研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年15期
3 朱姍;;基于規(guī)則和本體的實(shí)體關(guān)系抽取系統(tǒng)研究[J];情報(bào)雜志;2010年S2期
4 車萬翔,劉挺,李生;實(shí)體關(guān)系自動(dòng)抽取[J];中文信息學(xué)報(bào);2005年02期
5 朱鴻宇;劉瑰;陳左寧;唐福華;;實(shí)體關(guān)系識(shí)別中長(zhǎng)距離依賴問題的研究[J];小型微型計(jì)算機(jī)系統(tǒng);2008年02期
6 周利娟;林鴻飛;羅文華;;基于實(shí)體關(guān)系的犯罪網(wǎng)絡(luò)識(shí)別機(jī)制[J];計(jì)算機(jī)應(yīng)用研究;2011年03期
7 徐健;張智雄;吳振新;;實(shí)體關(guān)系抽取的技術(shù)方法綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2008年08期
8 李小紅;錢龍華;;基于自舉的弱指導(dǎo)中文實(shí)體關(guān)系抽取研究[J];高科技與產(chǎn)業(yè)化;2010年09期
9 董靜;孫樂;馮元勇;黃瑞紅;;中文實(shí)體關(guān)系抽取中的特征選擇研究[J];中文信息學(xué)報(bào);2007年04期
10 黃晨;錢龍華;周國(guó)棟;朱巧明;;基于卷積樹核的無指導(dǎo)中文實(shí)體關(guān)系抽取研究[J];中文信息學(xué)報(bào);2010年04期
相關(guān)會(huì)議論文 前3條
1 車萬翔;劉挺;李生;;實(shí)體關(guān)系自動(dòng)抽取[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
2 莊成龍;錢龍華;周國(guó)棟;;基于樹核函數(shù)的實(shí)體關(guān)系抽取方法研究[A];第四屆全國(guó)學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年
3 徐芬;王挺;陳火旺;;基于SVM方法的中文實(shí)體關(guān)系抽取[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
相關(guān)博士學(xué)位論文 前5條
1 陳忱;面向Web的實(shí)體關(guān)系查詢與分析關(guān)鍵技術(shù)研究[D];東北大學(xué);2013年
2 郭喜躍;面向開放領(lǐng)域文本的實(shí)體關(guān)系抽取[D];華中師范大學(xué);2016年
3 張奇;信息抽取中實(shí)體關(guān)系識(shí)別研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
4 張宏濤;面向生物文本的實(shí)體關(guān)系自動(dòng)抽取問題研究[D];清華大學(xué);2012年
5 張素香;信息抽取中關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 施琦;無監(jiān)督中文實(shí)體關(guān)系抽取研究[D];中國(guó)地質(zhì)大學(xué)(北京);2015年
2 林家欣;基于多源知識(shí)的地理選擇題答題方法研究[D];哈爾濱工業(yè)大學(xué);2015年
3 劉紹毓;實(shí)體關(guān)系抽取關(guān)鍵技術(shù)研究[D];解放軍信息工程大學(xué);2015年
4 胡春艷;中文開放式實(shí)體關(guān)系抽取技術(shù)研究[D];東北大學(xué);2014年
5 程文亮;中文企業(yè)知識(shí)圖譜構(gòu)建與分析[D];華東師范大學(xué);2016年
6 徐力;面向Web2.0的二元人物關(guān)系抽取研究[D];華東交通大學(xué);2016年
7 韓海丹;面向智能服務(wù)機(jī)器人的家庭環(huán)境關(guān)系知識(shí)庫構(gòu)建[D];燕山大學(xué);2016年
8 孔兵;中文文本實(shí)體關(guān)系抽取方法研究[D];哈爾濱工業(yè)大學(xué);2016年
9 劉q,
本文編號(hào):2042681
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/zidonghuakongzhilunwen/2042681.html