a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

當(dāng)前位置:主頁 > 管理論文 > 統(tǒng)計學(xué)論文 >

貝葉斯統(tǒng)計在文本挖掘的若干研究

發(fā)布時間:2020-12-19 00:40
  隨著信息時代的發(fā)展,越來越多非結(jié)構(gòu)化的文本信息不斷出現(xiàn),我們需要新的工具來整理、搜索和理解這些文本信息,以便獲取有價值的信息。文本挖掘(text mining)是解決這一系列問題的有效工具。在文本挖掘中,最常使用的是文本分類(Text classification)。文本分類是文本挖掘中有監(jiān)督的學(xué)習(xí)過程,目的是基于文檔內(nèi)容將文檔分配到一個或者多個預(yù)定義類別。由于文本信息構(gòu)造復(fù)雜性、變化多樣性和高維性,這給文本分類任務(wù)有效地提取文本特征帶來了極大的挑戰(zhàn)。概率主題模型(probabilistic topic models)是文本挖掘中提取文本特征的有效工具。主要是通過貝葉斯統(tǒng)計方法發(fā)現(xiàn)文本中的隱藏語義結(jié)構(gòu),進(jìn)而獲取有效的特征。因此,文本分類和概率主題模型是文本挖掘中非常有意義的研究課題。本文不僅關(guān)注文本分類,并探索了基于貝葉斯非參數(shù)的概率主題模型在文本分類中特征表示及其特征選擇,主要工作如下:(1)波利亞罐子(Polya urn)模型是廣泛應(yīng)用于統(tǒng)計和文本挖掘的基本模型,大多數(shù)訓(xùn)練模型的算法都非常緩慢和復(fù)雜,因此通常很難適應(yīng)大數(shù)據(jù)集。本文對波利亞罐子模型的極大似然估計(MLE)提出了一種新... 

【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:112 頁

【學(xué)位級別】:博士

【文章目錄】:
摘要
ABSTRACT(英文摘要)
主要符號對照表
第一章 引言
    §1.1 研究背景
    §1.2 研究現(xiàn)狀
        §1.2.1 特征表示與特征選擇
        §1.2.2 機(jī)器學(xué)習(xí)分類方法
        §1.2.3 深度學(xué)習(xí)分類方法
        §1.2.4 主題模型的研究現(xiàn)狀
    §1.3 研究的主要內(nèi)容
第二章 波利亞罐子模型及其在文本分類上的應(yīng)用
    §2.1 引言
    §2.2 波利亞罐子模型
    §2.3 參數(shù)估計
        §2.3.1 極大似然估計
        §2.3.2 一個新的計算算法
        §2.3.3 極大似然估計的漸進(jìn)性質(zhì)
    §2.4 隨機(jī)模擬
    §2.5 波利亞罐子模型在文本分類上的應(yīng)用
        §2.5.1 數(shù)據(jù)描述
        §2.5.2 文本預(yù)處理
        §2.5.3 分類方法和評估準(zhǔn)則
        §2.5.4 結(jié)果比較
    §2.6 定理證明
        §2.6.1 定理3.1的證明
        §2.6.2 定理3.2的證明
第三章 基于分層狄利克雷過程的圖挖掘主題模型
    §3.1 引言
    §3.2 相關(guān)模型分析
        §3.2.1 隱狄利克雷分配模型
        §3.2.2 圖挖掘模型
        §3.2.3 分層狄利克雷過程
    §3.3 基于分層狄利克雷過程的圖挖掘主題模型
    §3.4 后驗推斷
    §3.5 實例分析
        §3.5.1 數(shù)據(jù)描述
        §3.5.2 實驗設(shè)計
        §3.5.3 評估準(zhǔn)則
        §3.5.4 結(jié)果分析
        §3.5.5 閾值的選擇
    §3.6 后驗分布的推導(dǎo)及相關(guān)定理證明
        §3.6.1 基于分層狄利克雷過程的圖挖掘主題模型的后驗分布推導(dǎo)
        §3.6.2 定理4.1的證明
第四章 基于隱馬爾可夫模型的Pitman-Yor先驗概率主題模型
    §4.1 引言
    §4.2 模型及估計方法
        §4.2.1 符號
        §4.2.2 Pitman-Yor過程和相關(guān)的貝葉斯非參數(shù)過程
    §4.3 相關(guān)的模型
        §4.3.1 隱馬爾可夫主題模型
        §4.3.2 分層Pitman-Yor過程主題模型
    §4.4 基于隱馬爾可夫模型的Pitman-Yor先驗概率主題模型
        §4.4.1 模型構(gòu)建
    §4.5 基于隱馬爾可夫模型的Pitman-Yor先驗概率主題模型的變量推斷
        §4.5.1 后驗推斷
        §4.5.2 參數(shù)估計
        §4.5.3 迭代算法的收斂性
    §4.6 實例分析
        §4.6.1 數(shù)據(jù)集
        §4.6.2 實驗設(shè)置
        §4.6.3 結(jié)果分析
    §4.7 變量推斷的相關(guān)證明
第五章 基于句子的分層Pitman-Yor主題模型
    §5.1 引言
    §5.2 相關(guān)的工作回顧
        §5.2.1 基于句子的隱狄利克雷分配模型
        §5.2.2 Pitman-Yor過程及分層Pitman-Yor過程
    §5.3 基于句子的分層Pitman-Yor主題模型
    §5.4 基于句子的分層Pitman-Yor主題模型的后驗推斷
    §5.5 實列分析
        §5.5.1 文本建模
        §5.5.2 文本分類
第六章 結(jié)論與展望
參考文獻(xiàn)
致謝
在學(xué)期間的研究成果及發(fā)表的論文



本文編號:2924913

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2924913.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶80806***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
夜色阁亚洲一区二区三区| 99国产精品久久99久久久| 江城| 午夜99| 香港三级电影在线| 成aⅴ人免费观看中文字幕| 在线看片人成视频免费无遮挡| 香港经典三级av在在线观看| 国产精品视频一区二区三区四| 乌恰县| 沟厕白嫩大屁股国产盗摄| 视频h| 中文字幕人妻熟妇| 国产性猛交xx乱| 超碰人人人人| 亚洲激情五月| 女同一区| 色婷婷导航| 国内揄拍国产精品人妻网站| 亚洲影院天堂中文av色| 特级毛片aaaaaa| 色偷偷av男人的天堂| 狠狠五月激情六月丁香| 久久国产自偷自偷免费一区调 | 午夜熟女插插XX免费视频| 精品无码一区久久久99| 亚洲啪啪综合AV一区| 粉嫩极品国产在线观看| 韩国三级中文字幕HD| 久久亚洲AV成人无码软件| 亚洲精品成人网久久久久久 | 西平县| 亚洲区精品区日韩区综合区| 9人人澡人人爽人人精品| 国产午夜精品一区二区三区| www国产精品内射老熟女| 午夜精品一区| 黑人亨特玩人妻杨晓蓉| 亚洲欧美日韩精品久久奇米色影视| 天天综合天天做天天综合| av天堂影视|