a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

中文微博實體鏈接研究

發(fā)布時間:2018-01-20 16:28

  本文關鍵詞: 微博實體鏈接 改進的拼音編輯距離 后綴詞表匹配法 實體消歧 出處:《北京大學學報(自然科學版)》2014年01期  論文類型:期刊論文


【摘要】:針對2013年CCF自然語言處理與中文計算會議(NLPCC2013)中文微博實體鏈接的任務,使用CCF提供的新浪微博數(shù)據(jù)作為訓練和測試數(shù)據(jù),利用西南交通大學耶寶智慧中文分詞平臺作為自然語言預處理工具,提出一種實體鏈接的方法。該方法應用改進的拼音編輯距離算法和后綴詞表匹配法,提出實體聚類消歧與基于百度百科詞頻的同類實體消歧相結合的消歧方法。在2013年CCF中文微博實體鏈接評測任務中正確結果的準確率為0.8838,在10個參賽隊伍中名列第3位。表明該方法有效并可以適應文本中的噪聲。
[Abstract]:Aiming at the task of CCF Natural language processing (NLPCC2013) Chinese Weibo physical link in 2013, the data of Sina Weibo provided by CCF is used as training and testing data. This paper presents a method of entity linking by using the Chinese word segmentation platform of Yebao, Southwest Jiaotong University, as a natural language preprocessing tool. The method applies the improved Pinyin Editing distance algorithm and the suffix table matching method. A disambiguation method combining entity clustering disambiguation with similar entity disambiguation based on Baidu Encyclopedia frequency is proposed. In 2013, the accuracy of correct results in the CCF Weibo Chinese entity link evaluation task was 0.8838. . The result shows that the method is effective and can adapt to the noise in the text.
【作者單位】: 西南交通大學信息科學技術學院;
【基金】:國家自然科學基金(61170111,61202043,61262058) 中國科學院自動化所復雜系統(tǒng)管理與控制重點實驗室開放課題(20110102) 中央高;究蒲袠I(yè)務費專項基金(SWJTU11ZT08)資助
【分類號】:TP391.1;TP393.092
【正文快照】: 中文微博實體鏈接是指給定一條微博中的實體指稱,確定這些指稱在給定知識庫中的目標實體,實體鏈接在計算機理解微博的意義以及文本挖掘等方面有重要影響。根據(jù)新浪微博2012年的統(tǒng)計數(shù)據(jù),在這一年中其注冊用戶總數(shù)達到5.03億,全年增長率為73%,用戶每日發(fā)微博的數(shù)量不計其數(shù)。

【參考文獻】

相關期刊論文 前6條

1 胡文博;都云程;呂學強;施水才;;基于多層條件隨機場的中文命名實體識別[J];計算機工程與應用;2009年01期

2 繆建明;張全;;一種基于概念關聯(lián)式的詞義消岐方法[J];計算機科學;2010年01期

3 趙軍;;命名實體識別、排歧和跨語言關聯(lián)[J];中文信息學報;2009年02期

4 趙軍;劉康;周光有;蔡黎;;開放式文本信息抽取[J];中文信息學報;2011年06期

5 楊欣欣;李培峰;朱巧明;;基于網(wǎng)頁文本依存特征的人名消歧[J];計算機工程;2012年19期

6 曹犟;鄔曉鈞;夏云慶;鄭方;;基于拼音索引的中文模糊匹配算法[J];清華大學學報(自然科學版);2009年S1期

【共引文獻】

相關期刊論文 前10條

1 陶佳燕;李銀紅;石東源;覃松濤;鄭發(fā)林;蒙亮;;EMS與繼電保護定值校核系統(tǒng)實時數(shù)據(jù)匹配新方法[J];電力系統(tǒng)自動化;2012年10期

2 冷冰濤;梁維謙;董保帥;原道德;;基于連續(xù)識別的嵌入式孤立詞識別系統(tǒng)[J];電聲技術;2011年11期

3 曾道建;來斯惟;張元哲;劉康;趙軍;;面向非結構化文本的開放式實體屬性抽取[J];江西師范大學學報(自然科學版);2013年03期

4 賈真;楊宇飛;何大可;劉勝久;尹紅風;;面向中文網(wǎng)絡百科的屬性和屬性值抽取[J];北京大學學報(自然科學版);2014年01期

5 羅文華;;非結構化數(shù)據(jù)處理分析在電子數(shù)據(jù)取證中的應用[J];警察技術;2010年03期

6 馮鯨華;古麗拉·阿東別克;瑪依來·哈帕爾;;基于N-gram語言模型的哈薩克文機構名識別[J];計算機工程與應用;2010年31期

7 李靜;羅文華;林鴻飛;;自然語言處理技術在網(wǎng)絡案情分析系統(tǒng)中的應用[J];計算機工程與應用;2012年03期

8 刁興春;譚明超;曹建軍;;一種融合多種編輯距離的字符串相似度計算方法[J];計算機應用研究;2010年12期

9 彭文惠;吳小剛;蔣華;;基于柔性字符串匹配的校園BBS過濾系統(tǒng)[J];計算機與現(xiàn)代化;2011年02期

10 趙軍;劉康;周光有;蔡黎;;開放式文本信息抽取[J];中文信息學報;2011年06期

相關會議論文 前5條

1 張佳寶;周斌;吳泉源;;基于Hadoop的并行化命名實體識別技術研究與實現(xiàn)[A];全國計算機安全學術交流會論文集·第二十五卷[C];2010年

2 鐘茂生;;基于詞語形式標記的句際語義關系自動識別方法[A];第五屆全國信息檢索學術會議論文集[C];2009年

3 齊振宇;趙軍;楊帆;;一種開放式中文命名實體識別的新方法[A];第五屆全國信息檢索學術會議論文集[C];2009年

4 羅維;吉宗誠;呂雅娟;劉群;;一種改進詞語對齊的新方法[A];第五屆全國青年計算語言學研討會論文集[C];2010年

5 艾斯卡爾·肉孜;宗成慶;姑麗加瑪麗·麥麥提艾力;熱合木·馬合木提;艾斯卡爾·艾木都拉;;基于條件隨機場的維吾爾人名識別方法[A];第十二屆全國人機語音通訊學術會議(NCMMSC'2013)論文集[C];2013年

相關博士學位論文 前6條

1 劉娜;文本自動摘要和信息抽取方法及其應用研究[D];大連海事大學;2012年

2 鐘茂生;基于內容相關度計算的文本結構分析方法研究[D];上海交通大學;2010年

3 曹魯慧;Web個人信息集成問題研究[D];山東大學;2012年

4 陸前;英、漢跨語言話題檢測與跟蹤技術研究[D];中央民族大學;2013年

5 張俊三;Web中相關實體發(fā)現(xiàn)研究[D];北京交通大學;2013年

6 伍大勇;搜索引擎中命名實體查詢處理相關技術研究[D];哈爾濱工業(yè)大學;2012年

相關碩士學位論文 前10條

1 廖文平;基于CRF的中文地名識別研究[D];大連理工大學;2010年

2 紅霞;基于層疊條件隨機場的中文機構名識別的研究[D];大連理工大學;2010年

3 范春曉;基于XML的Web信息抽取技術研究[D];沈陽理工大學;2010年

4 王思麗;藏文網(wǎng)頁自動發(fā)現(xiàn)與采集技術研究[D];西北民族大學;2010年

5 楊曉東;中文命名實體識別及若干相關問題的研究[D];江蘇大學;2010年

6 羅永剛;基金信息與基金投資風險的定量關系研究[D];華東師范大學;2011年

7 尹義方;野營房產(chǎn)品設計與成本核算系統(tǒng)研究[D];東北石油大學;2011年

8 何世柱;文本分類和聚類若干模型的研究[D];江西師范大學;2011年

9 陳慧煒;刑事案件文本信息抽取研究[D];南京師范大學;2011年

10 馬二磊;互聯(lián)網(wǎng)人物信息排歧技術研究[D];哈爾濱工業(yè)大學;2010年

【二級參考文獻】

相關期刊論文 前10條

1 周俊生;戴新宇;尹存燕;陳家駿;;基于層疊條件隨機場模型的中文機構名自動識別[J];電子學報;2006年05期

2 王廣正;王喜鳳;;基于知網(wǎng)語義相關度計算的詞義消歧方法[J];安徽工業(yè)大學學報(自然科學版);2008年01期

3 陳笑蓉;秦進;;基于最大熵原理的漢語詞義消歧[J];計算機科學;2005年05期

4 張華平,劉群;基于角色標注的中國人名自動識別研究[J];計算機學報;2004年01期

5 莊明,老松楊,吳玲達;一種統(tǒng)計和詞性相結合的命名實體發(fā)現(xiàn)方法[J];計算機應用;2004年01期

6 鄭家恒,李鑫,譚紅葉;基于語料庫的中文姓名識別方法研究[J];中文信息學報;2000年01期

7 劉秉偉,黃萱菁,郭以昆,吳立德;基于統(tǒng)計方法的中文姓名識別[J];中文信息學報;2000年03期

8 黃德根,楊元生,王省,張艷麗,鐘萬勰;基于統(tǒng)計方法的中文姓名識別[J];中文信息學報;2001年02期

9 張華平,劉群;基于N-最短路徑方法的中文詞語粗分模型[J];中文信息學報;2002年05期

10 王厚峰;指代消解的基本方法和實現(xiàn)技術[J];中文信息學報;2002年06期

相關會議論文 前1條

1 齊振宇;趙軍;楊帆;;一種開放式中文命名實體識別的新方法[A];第五屆全國信息檢索學術會議論文集[C];2009年

相關碩士學位論文 前4條

1 喬羽;基于最大熵模型的中文人名識別方法研究[D];山西大學;2005年

2 陳晴;基于條件隨機場的自動分詞技術的研究[D];東北大學;2005年

3 王志強;基于條件隨機域的中文命名實體識別研究[D];南京理工大學;2006年

4 郭家清;基于條件隨機場的命名實體識別研究[D];沈陽航空工業(yè)學院;2007年

【相似文獻】

相關期刊論文 前10條

1 陳年長;;人工智能將影響未來工廠的主要設計思想[J];世界科技研究與發(fā)展;1989年01期

2 余國建,楊惠英 ,吳子喬 ,張健 ,胡代槐 ,李育福;在袖珍機上開發(fā)中醫(yī)專家系統(tǒng)的方法與技術[J];大自然探索;1993年01期

3 吳伏家,王世偉;圓孔拉刀智能CAD系統(tǒng)的研究[J];新技術新工藝;1995年05期

4 鄭金華,肖松青,彭貴華;一種實用的知識庫模型[J];湘潭大學自然科學學報;1999年03期

5 劉玉葆,孟志青;戰(zhàn)略投資DSS知識庫管理系統(tǒng)的設計[J];湘潭大學自然科學學報;1999年03期

6 李偉,劉海峰,靳紅;藥物研究開發(fā)知識庫"的建立[J];河北科技大學學報;2002年04期

7 劉佳,許鋒,李虎,王宛山;網(wǎng)絡化集成制造平臺下個性化定制系統(tǒng)研究[J];機械制造;2005年08期

8 陳正銘;鄧雪梅;;Web知識挖掘與計算機網(wǎng)絡[J];韶關學院學報;2006年09期

9 王巍;閆新慶;李文鋒;陳定方;;一種在關系型數(shù)據(jù)庫中存儲OWL對象的方法[J];微計算機信息;2006年30期

10 席生長;胡宏濤;;信息檢索技術在中石油勘探與生產(chǎn)分公司門戶內的應用研究[J];福建電腦;2008年01期

相關會議論文 前10條

1 胡志光;梁川;常愛玲;;電除塵器幫助系統(tǒng)軟件的開發(fā)研究[A];第十二屆中國電除塵學術會議論文集[C];2007年

2 張遠芳;張有仁;;PDMS2001:一個基于并行計算的數(shù)據(jù)挖掘系統(tǒng)[A];2002中國控制與決策學術年會論文集[C];2002年

3 錢海忠;武芳;孫建東;葛磊;朱強;王家耀;;自動制圖綜合鏈理論與技術模型[A];中國測繪學會九屆四次理事會暨2008年學術年會論文集[C];2008年

4 張亞瓊;韓江洪;魏振春;;一種改進的DES自動機模型知識表示和快速知識提取方法[A];全國第十屆企業(yè)信息化與工業(yè)工程學術年會論文集[C];2006年

5 高陽;李一智;劉洪生;楊玲玲;;技術改造投資決策支持系統(tǒng)研究。[A];1993中國控制與決策學術年會論文集[C];1993年

6 劉旭花;孟祥增;劉俊曉;吳鵬飛;;一種基于知識庫的圖像對象自動識別方法[A];第十三屆全國圖象圖形學學術會議論文集[C];2006年

7 杜向陽;張吉林;;基于語義本體知識庫技術的主題分類方法在輿情監(jiān)測實踐中的應用[A];中國新聞技術工作者聯(lián)合會五屆一次理事會暨學術年會論文集(上篇)[C];2009年

8 陳再旺;宋蓓;;人工智能在醫(yī)療診斷系統(tǒng)中的應用[A];廣西計算機學會2004年學術年會論文集[C];2004年

9 劉國剛;;人工智能客戶服務體系的研究與實現(xiàn)[A];2008年中國通信學會無線及移動通信委員會學術年會論文集[C];2008年

10 周強;王俊俊;陳麗歐;;構建大規(guī)模的漢語事件知識庫[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年

相關重要報紙文章 前10條

1 胡紅軍;軟件業(yè)應注重搭建行業(yè)知識庫[N];經(jīng)濟日報;2007年

2 ;開天辟地第一回[N];計算機世界;2002年

3 李廣錄;BakBone NetVault TrueCDP可恢復到任意時間點[N];中國計算機報;2008年

4 北京市科學技術委員會信息處 姜廣智 阿孜古麗;行業(yè)信息化知識庫構建先進的行業(yè)信息化平臺[N];中國計算機報;2006年

5 本報記者 吳蔚;東軟建健康管理知識庫[N];中國計算機報;2010年

6 凌曼文;小公司也可上線知識庫[N];中國計算機報;2007年

7 高雪娟;PLM將汽車上市周期縮短十個月[N];中國計算機報;2007年

8 北京市科學技術委員會信息處 姜廣智 阿孜古麗;催生軟件產(chǎn)業(yè)發(fā)展軌跡的新拐點[N];中國計算機報;2006年

9 陸元婕;聰明的搜索引擎[N];中國計算機報;2001年

10 吳玉征;中國軟件業(yè)應走行業(yè)應用之路[N];計算機世界;2007年

相關博士學位論文 前10條

1 黃莎莎;語義萬維網(wǎng)中本體與規(guī)則上的非經(jīng)典推理[D];湖南大學;2012年

2 劉忠途;基于知識的CAD系統(tǒng)若干關鍵技術研究[D];華中科技大學;2005年

3 李榮;基于知識的裝配序列規(guī)劃關鍵技術研究[D];哈爾濱工業(yè)大學;2009年

4 李歡;問答系統(tǒng)中的文本信息抽取研究與應用[D];中國科學技術大學;2009年

5 高明霞;問答式OWL知識檢索技術[D];北京工業(yè)大學;2008年

6 杜震洪;近海環(huán)境地物認知模型與智能服務聚合研究[D];浙江大學;2010年

7 譚武征;基于知識的概念創(chuàng)新設計系統(tǒng)關鍵技術的研究[D];上海交通大學;2008年

8 陳興蜀;應用區(qū)域邊界的安全體系結構及實用模型研究[D];四川大學;2004年

9 杜永萍;基于模式知識庫的問題回答關鍵技術研究[D];復旦大學;2005年

10 李如仁;公眾參與式地理信息系統(tǒng)的理論與實踐[D];遼寧工程技術大學;2007年

相關碩士學位論文 前10條

1 周美希;漢語語句組塊及消歧的研究與實現(xiàn)[D];電子科技大學;2005年

2 石林;基于對象的Web圖像檢索研究[D];山東師范大學;2005年

3 郭寶恩;計算機輔助QFD概念設計專家系統(tǒng)的開發(fā)研究[D];天津科技大學;2005年

4 葉紅;面向對象及構件技術在專家系統(tǒng)開發(fā)中的應用研究[D];安徽大學;2005年

5 羅云;青少年焦慮抑郁單光子成像數(shù)據(jù)挖掘方法研究[D];大連理工大學;2006年

6 袁利鋒;以財務數(shù)據(jù)為基礎的專家系統(tǒng)的研究與開發(fā)[D];華北電力大學(北京);2006年

7 楊楠;基于知識的人工骨三維結構仿生設計[D];西北工業(yè)大學;2007年

8 陸翠敏;納米材料數(shù)據(jù)庫系統(tǒng)的研制與開發(fā)[D];河北理工學院;2003年

9 張愛華;辦公自動化系統(tǒng)中知識管理的研究與實現(xiàn)[D];大連理工大學;2007年

10 曲曉棠;基于多Agent的網(wǎng)絡教學系統(tǒng)的研究與應用[D];蘇州大學;2007年

,

本文編號:1448885

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/ydhl/1448885.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶73534***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
激情综合亚洲色婷婷五月app| 无码人妻久久久一区二区三区免费| 国产97人人超碰caoprom| 久久精品一区二区三区AV| 亚洲一区 日韩精品 中文字幕| 97人妻精品一区二区三区| 国产丰满人妻被黑人猛烈进入| 久久久久国产精品夜夜夜夜夜| 韩国三级电影在线| 亚洲和欧洲一码二码区别综合| 天天躁日日躁狠狠久久| 久久精品国产对白国产AV | 国产精品一区二区av片| 三级三级久久三级久久| 狠狠爱无码一区二区三区| 91成人网| 中国熟妇xxx| 久久精品区| 久久久久久久久久久av| 成熟的蜜桃| 色性av| 中国人与牲禽动交精品| 婷婷精品视频| 日韩亚洲天堂| 综合久久网| 97综合网| 亚洲一区日韩| 东京热精品| 国产精品人与拘| 精品国产50部农村老熟女av| 亚洲女人被黑人巨大猛进| 乱vodafonewifi熟妇| 四虎影视永久地址WWW成人| 九九在线中文字幕无码| 欧美成人精品高清在线播放 | 黑人熟女| 出轨的新婚少妇| 羞羞影院| 激情伊人五月天久久综合| 亚洲日韩v无码中文字幕| 在线亚洲高清揄拍自拍一品区|