基于上下文關(guān)系的命名實(shí)體識(shí)別方法研究與應(yīng)用
發(fā)布時(shí)間:2025-06-27 06:28
隨著互聯(lián)網(wǎng)在工作生活用中的普及與發(fā)展,各行的工作流程逐漸從數(shù)字時(shí)代進(jìn)入了信息共享時(shí)代,也因此得到了越來(lái)越多的效率提升。目前,信息共享已經(jīng)成為了提高工作效率的重要渠道,也是智能化生活中不可缺少的環(huán)節(jié)之一。在醫(yī)療衛(wèi)生領(lǐng)域中,由于缺乏一些與專(zhuān)業(yè)學(xué)科相關(guān)的預(yù)備工作,導(dǎo)致了其中如電子病例等非結(jié)構(gòu)化文本檔案中蘊(yùn)含的信息難以得到充分利用,影響了相關(guān)工作的效率。為了在專(zhuān)有領(lǐng)域文檔中識(shí)別有效內(nèi)容,以及檢索關(guān)鍵信息以提高文檔信息的可用性,本文從減少識(shí)別方法的預(yù)備工作與提高已有工作的利用率兩個(gè)角度出發(fā),提出了一種基于中文文本的專(zhuān)有領(lǐng)域命名實(shí)體識(shí)別方法。1)為了減少識(shí)別方法在領(lǐng)域應(yīng)用前的預(yù)備工作,本文提出了基于簡(jiǎn)單標(biāo)注集合的中文文本分詞模型,該模型的核心內(nèi)容是應(yīng)用在條件隨機(jī)場(chǎng)模型上的復(fù)雜特征函數(shù)。復(fù)雜函數(shù)在基本標(biāo)記序列上可以進(jìn)行更深層的特征提取,利用中文文本在行文與表達(dá)過(guò)程中特定的方式與規(guī)律,從訓(xùn)練樣本中獲取與語(yǔ)法規(guī)則更相關(guān)的信息,從而提高了樣本集信息的利用率,也間接減少了訓(xùn)練樣本的標(biāo)注工作量。2)從提高已有工作利用率的角度出發(fā),本文提出了基于依存關(guān)系的語(yǔ)義識(shí)別模型,該模型的原理是利用了詞匯之間的依存關(guān)系,對(duì)句...
【文章頁(yè)數(shù)】:106 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
學(xué)位論文數(shù)據(jù)集
摘要
abstract
第一章 緒論
1.1 課題背景及研究意義
1.1.1 課題背景
1.1.2 課題研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)機(jī)器學(xué)習(xí)的歷史與現(xiàn)狀
1.2.2 深度學(xué)習(xí)的歷史與現(xiàn)狀
1.2.3 命名實(shí)體識(shí)別的歷史與現(xiàn)狀
1.3 主要研究?jī)?nèi)容及創(chuàng)新點(diǎn)
1.3.1 本文的主要研究?jī)?nèi)容
1.3.2 本文的主要?jiǎng)?chuàng)新點(diǎn)
1.4 本文的結(jié)構(gòu)安排
第二章 基礎(chǔ)理論及相關(guān)技術(shù)介紹
2.1 基礎(chǔ)理論介紹
2.1.1 條件隨機(jī)場(chǎng)模型
2.1.2 N-Gram模型
2.1.3 依存語(yǔ)法模型
2.2 相關(guān)技術(shù)介紹
2.2.1 漢語(yǔ)中的分詞技術(shù)
2.2.2 漢語(yǔ)分詞中的歧義消除技術(shù)
2.2.2.1 基于規(guī)則詞典的歧義消除技術(shù)
2.2.2.2 基于統(tǒng)計(jì)模型的歧義消除技術(shù)
2.2.3 基于依存語(yǔ)法的漢語(yǔ)句法分析技術(shù)
2.2.4 漢語(yǔ)中的句法錯(cuò)誤糾正技術(shù)
2.2.5 漢語(yǔ)命名實(shí)體識(shí)別技術(shù)
2.2.5.1 基于深度學(xué)習(xí)的漢語(yǔ)命名實(shí)體識(shí)別技術(shù)
2.2.5.2 基于統(tǒng)計(jì)模型的漢語(yǔ)命名實(shí)體識(shí)別技術(shù)
2.3 實(shí)驗(yàn)結(jié)果評(píng)估標(biāo)準(zhǔn)
2.4 實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備
2.5 本章小結(jié)
第三章 基于漢語(yǔ)詞匯特征的分詞方法研究
3.1 問(wèn)題描述
3.2 條件隨機(jī)場(chǎng)的特征函數(shù)框架研究
3.2.1 傳統(tǒng)特征函數(shù)
3.2.2 復(fù)雜特征函數(shù)
3.2.3 特征函數(shù)提取模板
3.3 基于條件隨機(jī)場(chǎng)的漢語(yǔ)詞匯特征函數(shù)研究
3.3.1 詞匯特征的轉(zhuǎn)化研究
3.3.1.1 隨機(jī)特征(R)
3.3.1.2 詞綴特征(P)
3.3.1.3 邊界特征(M)
3.3.1.4 鄰接特征(Ant、Sub)
3.3.1.5 構(gòu)詞特征(D)
3.3.1.6 特征集小結(jié)
3.3.2 詞匯特征對(duì)比實(shí)驗(yàn)
3.3.2.1 實(shí)驗(yàn)?zāi)康?br> 3.3.2.2 實(shí)驗(yàn)數(shù)據(jù)與參數(shù)設(shè)定
3.3.2.3 詞綴特征(Pre、Post)的對(duì)比實(shí)驗(yàn)
3.3.2.4 鄰接特征(Ant、Sub)的對(duì)比實(shí)驗(yàn)
3.3.2.5 邊界特征(MS、ME)的對(duì)比實(shí)驗(yàn)
3.3.2.6 構(gòu)詞特征(D1、D2)的對(duì)比實(shí)驗(yàn)
3.3.3 詞匯特征組合實(shí)驗(yàn)
3.4 詞匯特征分詞方法的對(duì)比實(shí)驗(yàn)
3.4.1 實(shí)驗(yàn)設(shè)置
3.4.2 實(shí)驗(yàn)結(jié)果與分析
3.5 本章小結(jié)
第四章 漢語(yǔ)語(yǔ)義依存關(guān)系的提取方法研究
4.1 問(wèn)題描述
4.2 漢語(yǔ)語(yǔ)義依存關(guān)系
4.2.1 依存關(guān)系的確定
4.2.2 依存關(guān)系的提取研究
4.3 基于N-Gram的中文語(yǔ)義依存關(guān)系研究
4.3.1 單層N-Gram集成模型
4.3.2 多層N-Gram集成模型
4.3.3 同類(lèi)詞匯的符號(hào)化編碼
4.4 基于依存關(guān)系的分詞修正研究
4.4.1 基于依存關(guān)系的句法診斷方法
4.4.2 基于句法診斷的分詞修正流程
4.4.3 基于依存關(guān)系的歧義消除方法
4.4.4 實(shí)驗(yàn)數(shù)據(jù)及參數(shù)設(shè)定
4.4.5 實(shí)驗(yàn)結(jié)果與分析
4.5 本章小結(jié)
第五章 基于依存關(guān)系的中文命名實(shí)體識(shí)別方法研究
5.1 整體算法框架
5.2 基于依存關(guān)系的命名實(shí)體識(shí)別研究
5.2.1 基于語(yǔ)境的依存關(guān)系研究
5.2.2 語(yǔ)境關(guān)系的知識(shí)擴(kuò)充研究
5.2.3 特定語(yǔ)境關(guān)系的提取研究
5.3 實(shí)驗(yàn)數(shù)據(jù)及參數(shù)設(shè)定
5.3.1 基于同類(lèi)語(yǔ)料的命名實(shí)體識(shí)別研究實(shí)驗(yàn)
5.3.2 基于專(zhuān)有領(lǐng)域的命名實(shí)體識(shí)別實(shí)驗(yàn)
5.4 實(shí)驗(yàn)結(jié)果分析
5.4.1 同類(lèi)語(yǔ)料中的地名識(shí)別實(shí)驗(yàn)
5.4.2 專(zhuān)有領(lǐng)域的命名實(shí)體識(shí)別實(shí)驗(yàn)
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 主要研究成果
6.2 工作展望
參考文獻(xiàn)
致謝
研究成果及發(fā)表的學(xué)術(shù)論文
作者及導(dǎo)師簡(jiǎn)介
附件
本文編號(hào):4053954
【文章頁(yè)數(shù)】:106 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
學(xué)位論文數(shù)據(jù)集
摘要
abstract
第一章 緒論
1.1 課題背景及研究意義
1.1.1 課題背景
1.1.2 課題研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)機(jī)器學(xué)習(xí)的歷史與現(xiàn)狀
1.2.2 深度學(xué)習(xí)的歷史與現(xiàn)狀
1.2.3 命名實(shí)體識(shí)別的歷史與現(xiàn)狀
1.3 主要研究?jī)?nèi)容及創(chuàng)新點(diǎn)
1.3.1 本文的主要研究?jī)?nèi)容
1.3.2 本文的主要?jiǎng)?chuàng)新點(diǎn)
1.4 本文的結(jié)構(gòu)安排
第二章 基礎(chǔ)理論及相關(guān)技術(shù)介紹
2.1 基礎(chǔ)理論介紹
2.1.1 條件隨機(jī)場(chǎng)模型
2.1.2 N-Gram模型
2.1.3 依存語(yǔ)法模型
2.2 相關(guān)技術(shù)介紹
2.2.1 漢語(yǔ)中的分詞技術(shù)
2.2.2 漢語(yǔ)分詞中的歧義消除技術(shù)
2.2.2.1 基于規(guī)則詞典的歧義消除技術(shù)
2.2.2.2 基于統(tǒng)計(jì)模型的歧義消除技術(shù)
2.2.3 基于依存語(yǔ)法的漢語(yǔ)句法分析技術(shù)
2.2.4 漢語(yǔ)中的句法錯(cuò)誤糾正技術(shù)
2.2.5 漢語(yǔ)命名實(shí)體識(shí)別技術(shù)
2.2.5.1 基于深度學(xué)習(xí)的漢語(yǔ)命名實(shí)體識(shí)別技術(shù)
2.2.5.2 基于統(tǒng)計(jì)模型的漢語(yǔ)命名實(shí)體識(shí)別技術(shù)
2.3 實(shí)驗(yàn)結(jié)果評(píng)估標(biāo)準(zhǔn)
2.4 實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備
2.5 本章小結(jié)
第三章 基于漢語(yǔ)詞匯特征的分詞方法研究
3.1 問(wèn)題描述
3.2 條件隨機(jī)場(chǎng)的特征函數(shù)框架研究
3.2.1 傳統(tǒng)特征函數(shù)
3.2.2 復(fù)雜特征函數(shù)
3.2.3 特征函數(shù)提取模板
3.3 基于條件隨機(jī)場(chǎng)的漢語(yǔ)詞匯特征函數(shù)研究
3.3.1 詞匯特征的轉(zhuǎn)化研究
3.3.1.1 隨機(jī)特征(R)
3.3.1.2 詞綴特征(P)
3.3.1.3 邊界特征(M)
3.3.1.4 鄰接特征(Ant、Sub)
3.3.1.5 構(gòu)詞特征(D)
3.3.1.6 特征集小結(jié)
3.3.2 詞匯特征對(duì)比實(shí)驗(yàn)
3.3.2.1 實(shí)驗(yàn)?zāi)康?br> 3.3.2.2 實(shí)驗(yàn)數(shù)據(jù)與參數(shù)設(shè)定
3.3.2.3 詞綴特征(Pre、Post)的對(duì)比實(shí)驗(yàn)
3.3.2.4 鄰接特征(Ant、Sub)的對(duì)比實(shí)驗(yàn)
3.3.2.5 邊界特征(MS、ME)的對(duì)比實(shí)驗(yàn)
3.3.2.6 構(gòu)詞特征(D1、D2)的對(duì)比實(shí)驗(yàn)
3.3.3 詞匯特征組合實(shí)驗(yàn)
3.4 詞匯特征分詞方法的對(duì)比實(shí)驗(yàn)
3.4.1 實(shí)驗(yàn)設(shè)置
3.4.2 實(shí)驗(yàn)結(jié)果與分析
3.5 本章小結(jié)
第四章 漢語(yǔ)語(yǔ)義依存關(guān)系的提取方法研究
4.1 問(wèn)題描述
4.2 漢語(yǔ)語(yǔ)義依存關(guān)系
4.2.1 依存關(guān)系的確定
4.2.2 依存關(guān)系的提取研究
4.3 基于N-Gram的中文語(yǔ)義依存關(guān)系研究
4.3.1 單層N-Gram集成模型
4.3.2 多層N-Gram集成模型
4.3.3 同類(lèi)詞匯的符號(hào)化編碼
4.4 基于依存關(guān)系的分詞修正研究
4.4.1 基于依存關(guān)系的句法診斷方法
4.4.2 基于句法診斷的分詞修正流程
4.4.3 基于依存關(guān)系的歧義消除方法
4.4.4 實(shí)驗(yàn)數(shù)據(jù)及參數(shù)設(shè)定
4.4.5 實(shí)驗(yàn)結(jié)果與分析
4.5 本章小結(jié)
第五章 基于依存關(guān)系的中文命名實(shí)體識(shí)別方法研究
5.1 整體算法框架
5.2 基于依存關(guān)系的命名實(shí)體識(shí)別研究
5.2.1 基于語(yǔ)境的依存關(guān)系研究
5.2.2 語(yǔ)境關(guān)系的知識(shí)擴(kuò)充研究
5.2.3 特定語(yǔ)境關(guān)系的提取研究
5.3 實(shí)驗(yàn)數(shù)據(jù)及參數(shù)設(shè)定
5.3.1 基于同類(lèi)語(yǔ)料的命名實(shí)體識(shí)別研究實(shí)驗(yàn)
5.3.2 基于專(zhuān)有領(lǐng)域的命名實(shí)體識(shí)別實(shí)驗(yàn)
5.4 實(shí)驗(yàn)結(jié)果分析
5.4.1 同類(lèi)語(yǔ)料中的地名識(shí)別實(shí)驗(yàn)
5.4.2 專(zhuān)有領(lǐng)域的命名實(shí)體識(shí)別實(shí)驗(yàn)
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 主要研究成果
6.2 工作展望
參考文獻(xiàn)
致謝
研究成果及發(fā)表的學(xué)術(shù)論文
作者及導(dǎo)師簡(jiǎn)介
附件
本文編號(hào):4053954
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/ruanjiangongchenglunwen/4053954.html
上一篇:基于BIM技術(shù)的施工場(chǎng)地布置優(yōu)化研究
下一篇:沒(méi)有了
下一篇:沒(méi)有了
最近更新
教材專(zhuān)著