a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于相關(guān)性判據(jù)的信息檢索優(yōu)化

發(fā)布時(shí)間:2020-11-20 21:47
   信息檢索的出現(xiàn)使得人們獲取信息的效率得到了較大的提高,信息檢索的其本質(zhì)是用戶需求與文獻(xiàn)集的匹配過程,用戶將需求通過初始查詢式的形式表達(dá)出來,根據(jù)某種檢索模型在檢索系統(tǒng)中查找自己所需的信息,也就是說,信息檢索是個(gè)用戶需求與檢索對象相匹配的一個(gè)過程,本質(zhì)是種相關(guān)性檢索。在21世紀(jì)之前,學(xué)界對于信息檢索的研究側(cè)重于系統(tǒng)觀的相關(guān)性,通過對檢索系統(tǒng)的檢索機(jī)制、信息源的組織形式和相關(guān)性評級算法的探討以期能提高信息系統(tǒng)的檢索性能。 隨著科技和社會發(fā)展,尤其是最近幾年人機(jī)互動和智能檢索的興起,信息檢索中人的作用越來越受到重視,以人為本的相關(guān)反饋在未來應(yīng)該是信息檢索的主流,學(xué)者們對信息檢索中相關(guān)性的影響因素和提高技術(shù)開始進(jìn)行深入的研究,典型的有相關(guān)反饋技術(shù)。影響相關(guān)性的因素多種多樣,學(xué)者們進(jìn)行了廣泛的摸索,用戶決定了查詢式的質(zhì)量,查詢式依賴于用戶,因此用戶是相關(guān)反饋的最重要影響因素。信息檢索系統(tǒng)的核心是相關(guān)性評價(jià),在相關(guān)反饋中,用戶是相關(guān)性評價(jià)的主導(dǎo),這個(gè)評價(jià)過程受用戶自身和情境影響,主觀性很強(qiáng)。在信息檢索領(lǐng)域尤其是在國內(nèi),針對信息檢索系統(tǒng)的查詢擴(kuò)展研究較為成熟,但是基于用戶的相關(guān)反饋研究比較少,且目前為止還大部分研究還是基于理論,對相關(guān)性影響因素的實(shí)證研究較少。 鑒于此,本文綜述了目前國內(nèi)外的信息檢索優(yōu)化技術(shù)和相關(guān)性研究現(xiàn)狀,歸納了相關(guān)性定義、評價(jià)、影響因素和提高技術(shù),重點(diǎn)介紹了用戶相關(guān)反饋技術(shù),并建立了一個(gè)信息檢索系統(tǒng),采用國際標(biāo)準(zhǔn)五大測試集Cranfield, Medline, CISI, NPL和CACM作為語料庫,并建立索引,將廣為應(yīng)用的向量空間模型作為信息檢索模型,利用TF-IDF算法計(jì)算權(quán)重,檢索系統(tǒng)采用改進(jìn)的計(jì)算公式Ide Dec-hi優(yōu)化查詢向量,在此平臺上運(yùn)行了三部分信息檢索實(shí)驗(yàn),第一部分沒有相關(guān)反饋,用戶不需要參與反饋,輸入檢索查詢式后,檢索系統(tǒng)輸出檢索文獻(xiàn)集,這個(gè)部分作為BASELINE,檢索結(jié)果作為參照基準(zhǔn);第二部分基于相關(guān)反饋,檢索系統(tǒng)輸出檢索結(jié)果后,用戶需要判斷排在前面的N(參照Salton和Buckley的實(shí)驗(yàn),N值取15)篇文獻(xiàn)哪些是相關(guān)文獻(xiàn)和不相關(guān)文獻(xiàn),然后進(jìn)行二次檢索,檢索系統(tǒng)根據(jù)用戶反饋的結(jié)果,利用Ide Dec-hi算法重新計(jì)算文獻(xiàn)集和查詢式的相似度,再將檢索結(jié)果反饋給用戶,這部分是為對照組。第三部分基于相關(guān)性判據(jù)集和相關(guān)反饋,類似于第二部分,不同在于用戶在進(jìn)行相關(guān)性判斷時(shí)不是隨性的,而是根據(jù)既定的判斷依據(jù)來,此部分即為實(shí)驗(yàn)組。本文試圖通過實(shí)證研究證實(shí)相關(guān)反饋技術(shù)和依據(jù)相關(guān)性判據(jù)集對提高相關(guān)性具有良好的效果,并提出了本文的不足和后期研究應(yīng)該做的工作。
【學(xué)位單位】:南京大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2013
【中圖分類】:G354
【文章目錄】:
中文摘要
Abstract
論文表格目錄
論文圖表目錄
1. 緒論
    1.1. 研究背景
    1.2. 研究內(nèi)容
    1.3. 研究意義
    1.4. 論文組織結(jié)構(gòu)
2. 信息檢索及查詢擴(kuò)展技術(shù)研究
    2.1. 信息檢索概述
        2.1.1. 向量模型
        2.1.2. 概率模型
        2.1.3. 布爾模型
    2.2. 查詢擴(kuò)展
        2.2.1. 基于全局分析的查詢擴(kuò)展技術(shù)
            2.2.1.1. 文本聚類
            2.2.1.2. 潛在語義索引
            2.2.1.3. 相似性詞典
        2.2.2. 基于局部分析的查詢擴(kuò)展技術(shù)
            2.2.2.1. 局部聚類
            2.2.2.2. 局部上下文分析
        2.2.3. 基于語義詞表的查詢擴(kuò)展技術(shù)
3. 信息檢索中相關(guān)性研究
    3.1. 相關(guān)性定義
        3.1.1. 面向系統(tǒng)的相關(guān)性
        3.1.2. 面向用戶的相關(guān)性
        3.1.3. 系統(tǒng)和用戶相結(jié)合的相關(guān)性
    3.2. 相關(guān)性度量和評價(jià)
        3.2.1. 系統(tǒng)觀相關(guān)性度量及其評價(jià)指標(biāo)
            3.2.1.1. 基于不同檢索方式的相關(guān)性度量
                3.2.1.1.1. 基于向量空間模型的相關(guān)性度量
                3.2.1.1.2. 基于概率模型的相關(guān)性度量
                3.2.1.1.3. 基于布爾模型的相關(guān)性度量
            3.2.1.2. 常用評價(jià)指標(biāo)
        3.2.2. 用戶相關(guān)性度量判斷和評價(jià)
    3.3. 相關(guān)性影響因素
    3.4. 相關(guān)性提高技術(shù)研究
        3.4.1. 用戶相關(guān)性
        3.4.2. 系統(tǒng)觀相關(guān)性
        3.4.3. 用戶相關(guān)反饋技術(shù)
            3.4.3.1. 基于向量空間模型的相關(guān)反饋
                3.4.3.1.1. 向量空間模型的相關(guān)反饋權(quán)重計(jì)算
                3.4.3.1.2. 向量空間模型的相關(guān)反饋的優(yōu)缺點(diǎn)
            3.4.3.2. 基于概率模型的相關(guān)反饋
                3.4.3.2.1. 經(jīng)典概率模型的相關(guān)反饋權(quán)重計(jì)算
                3.4.3.2.2. 經(jīng)典概率模型相關(guān)反饋優(yōu)缺點(diǎn)
            3.4.3.3. 基于布爾模型的相關(guān)反饋
            3.4.3.4. 用戶相關(guān)反饋小結(jié)
4. 實(shí)驗(yàn)及結(jié)果分析
    4.1. 實(shí)驗(yàn)框架
    4.2. 數(shù)據(jù)預(yù)處理
        4.2.1. 測試集簡介
        4.2.2. 文獻(xiàn)和查詢的預(yù)處理
        4.2.3. 相似度計(jì)算和評價(jià)
    4.3. 實(shí)驗(yàn)內(nèi)容
        4.3.1. BASELINE
        4.3.2. 對照組
        4.3.3. 實(shí)驗(yàn)組
    4.4. 結(jié)果分析
        4.4.1. 實(shí)驗(yàn)結(jié)果
        4.4.2. 結(jié)果分析
5. 總結(jié)與展望
    5.1. 研究總結(jié)
    5.2. 進(jìn)一步工作
參考文獻(xiàn)
攻讀碩士期間主要科研及成果
致謝

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王雅坤;成全;;信息檢索相關(guān)性研究綜述及發(fā)展趨勢[J];圖書與情報(bào);2012年01期

2 袁占亭,張愛民,張秋余;基于概念的Web信息檢索[J];計(jì)算機(jī)工程與應(yīng)用;2003年36期

3 顧榕,王小平,曹立明;一種基于潛在語義分析的查詢擴(kuò)展算法[J];計(jì)算機(jī)工程與應(yīng)用;2004年18期

4 閉劍婷;蘇一丹;;基于潛在語義分析的跨語言查詢擴(kuò)展方法[J];計(jì)算機(jī)工程;2009年10期

5 張敏,宋睿華,馬少平;基于語義關(guān)系查詢擴(kuò)展的文檔重構(gòu)方法[J];計(jì)算機(jī)學(xué)報(bào);2004年10期

6 馮運(yùn);陳治平;;基于局部類別分析的查詢擴(kuò)展[J];計(jì)算機(jī)應(yīng)用;2007年01期

7 賀宏朝,何丕廉,高劍峰,黃昌寧;一種基于上下文的中文信息檢索查詢擴(kuò)展[J];中文信息學(xué)報(bào);2002年06期

8 劉遠(yuǎn)超;王曉龍;徐志明;關(guān)毅;;文檔聚類綜述[J];中文信息學(xué)報(bào);2006年03期

9 丁國棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴(kuò)展方法[J];中文信息學(xué)報(bào);2006年03期

10 張保明;;查全率—查準(zhǔn)率互逆相關(guān)性的數(shù)學(xué)解釋[J];情報(bào)科學(xué);1982年02期


相關(guān)博士學(xué)位論文 前1條

1 成穎;信息檢索相關(guān)性判據(jù)及應(yīng)用研究[D];南京大學(xué);2011年



本文編號:2892039

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/tushudanganlunwen/2892039.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶064b4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
优优色影院| 无码精品视频一区二区三区| 日本高清视频在线网站| 性荡视频播放在线视频7777| 无码人妻精品一区二区三区久久 | 中文字幕av一区二区三区| 2018天天弄国产大片| AV人摸人人人澡人人超碰小说| 亚洲中文字幕久久精品无码喷水| 亚洲av之男人的天堂网站| 蜜芽亚洲AV无码精品国产| 亚洲v码和欧洲s码的区别| 久草免费| 日本免费| 日本不卡一二三区| 婷婷在线| 伊人狠狠操| 国产精品久久久久久久久久久久冷 | 成人午夜高潮刺激免费视频| 99久久人妻精品免费一区| 亚洲欧美色一区二区三区| 国产精品午夜福利不卡| 泰州市| 亚洲啪啪啪网站| 欧美猛交免费| 国产精品久久久久久亚洲av| www性| 伦理片| 韶山市| 后入| 蜜桃成人| 亚洲AV无码专区国产乱码4| 久久久久亚洲精品无码网址色欲| 精品无码国产一区二区三区AV| 亚洲日韩一中文字暮AV| 天海翼一区二区三区高清在线| 女同亚洲一区二区无线码| 综合亚洲AV图片区| 成人免费无码a毛片| 国产精品成人免费视频一区 | 樱花草视频www|