a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

貝葉斯統(tǒng)計(jì)在文本挖掘的若干研究

發(fā)布時(shí)間:2020-12-19 00:40
  隨著信息時(shí)代的發(fā)展,越來(lái)越多非結(jié)構(gòu)化的文本信息不斷出現(xiàn),我們需要新的工具來(lái)整理、搜索和理解這些文本信息,以便獲取有價(jià)值的信息。文本挖掘(text mining)是解決這一系列問(wèn)題的有效工具。在文本挖掘中,最常使用的是文本分類(lèi)(Text classification)。文本分類(lèi)是文本挖掘中有監(jiān)督的學(xué)習(xí)過(guò)程,目的是基于文檔內(nèi)容將文檔分配到一個(gè)或者多個(gè)預(yù)定義類(lèi)別。由于文本信息構(gòu)造復(fù)雜性、變化多樣性和高維性,這給文本分類(lèi)任務(wù)有效地提取文本特征帶來(lái)了極大的挑戰(zhàn)。概率主題模型(probabilistic topic models)是文本挖掘中提取文本特征的有效工具。主要是通過(guò)貝葉斯統(tǒng)計(jì)方法發(fā)現(xiàn)文本中的隱藏語(yǔ)義結(jié)構(gòu),進(jìn)而獲取有效的特征。因此,文本分類(lèi)和概率主題模型是文本挖掘中非常有意義的研究課題。本文不僅關(guān)注文本分類(lèi),并探索了基于貝葉斯非參數(shù)的概率主題模型在文本分類(lèi)中特征表示及其特征選擇,主要工作如下:(1)波利亞罐子(Polya urn)模型是廣泛應(yīng)用于統(tǒng)計(jì)和文本挖掘的基本模型,大多數(shù)訓(xùn)練模型的算法都非常緩慢和復(fù)雜,因此通常很難適應(yīng)大數(shù)據(jù)集。本文對(duì)波利亞罐子模型的極大似然估計(jì)(MLE)提出了一種新... 

【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:112 頁(yè)

【學(xué)位級(jí)別】:博士

【文章目錄】:
摘要
ABSTRACT(英文摘要)
主要符號(hào)對(duì)照表
第一章 引言
    §1.1 研究背景
    §1.2 研究現(xiàn)狀
        §1.2.1 特征表示與特征選擇
        §1.2.2 機(jī)器學(xué)習(xí)分類(lèi)方法
        §1.2.3 深度學(xué)習(xí)分類(lèi)方法
        §1.2.4 主題模型的研究現(xiàn)狀
    §1.3 研究的主要內(nèi)容
第二章 波利亞罐子模型及其在文本分類(lèi)上的應(yīng)用
    §2.1 引言
    §2.2 波利亞罐子模型
    §2.3 參數(shù)估計(jì)
        §2.3.1 極大似然估計(jì)
        §2.3.2 一個(gè)新的計(jì)算算法
        §2.3.3 極大似然估計(jì)的漸進(jìn)性質(zhì)
    §2.4 隨機(jī)模擬
    §2.5 波利亞罐子模型在文本分類(lèi)上的應(yīng)用
        §2.5.1 數(shù)據(jù)描述
        §2.5.2 文本預(yù)處理
        §2.5.3 分類(lèi)方法和評(píng)估準(zhǔn)則
        §2.5.4 結(jié)果比較
    §2.6 定理證明
        §2.6.1 定理3.1的證明
        §2.6.2 定理3.2的證明
第三章 基于分層狄利克雷過(guò)程的圖挖掘主題模型
    §3.1 引言
    §3.2 相關(guān)模型分析
        §3.2.1 隱狄利克雷分配模型
        §3.2.2 圖挖掘模型
        §3.2.3 分層狄利克雷過(guò)程
    §3.3 基于分層狄利克雷過(guò)程的圖挖掘主題模型
    §3.4 后驗(yàn)推斷
    §3.5 實(shí)例分析
        §3.5.1 數(shù)據(jù)描述
        §3.5.2 實(shí)驗(yàn)設(shè)計(jì)
        §3.5.3 評(píng)估準(zhǔn)則
        §3.5.4 結(jié)果分析
        §3.5.5 閾值的選擇
    §3.6 后驗(yàn)分布的推導(dǎo)及相關(guān)定理證明
        §3.6.1 基于分層狄利克雷過(guò)程的圖挖掘主題模型的后驗(yàn)分布推導(dǎo)
        §3.6.2 定理4.1的證明
第四章 基于隱馬爾可夫模型的Pitman-Yor先驗(yàn)概率主題模型
    §4.1 引言
    §4.2 模型及估計(jì)方法
        §4.2.1 符號(hào)
        §4.2.2 Pitman-Yor過(guò)程和相關(guān)的貝葉斯非參數(shù)過(guò)程
    §4.3 相關(guān)的模型
        §4.3.1 隱馬爾可夫主題模型
        §4.3.2 分層Pitman-Yor過(guò)程主題模型
    §4.4 基于隱馬爾可夫模型的Pitman-Yor先驗(yàn)概率主題模型
        §4.4.1 模型構(gòu)建
    §4.5 基于隱馬爾可夫模型的Pitman-Yor先驗(yàn)概率主題模型的變量推斷
        §4.5.1 后驗(yàn)推斷
        §4.5.2 參數(shù)估計(jì)
        §4.5.3 迭代算法的收斂性
    §4.6 實(shí)例分析
        §4.6.1 數(shù)據(jù)集
        §4.6.2 實(shí)驗(yàn)設(shè)置
        §4.6.3 結(jié)果分析
    §4.7 變量推斷的相關(guān)證明
第五章 基于句子的分層Pitman-Yor主題模型
    §5.1 引言
    §5.2 相關(guān)的工作回顧
        §5.2.1 基于句子的隱狄利克雷分配模型
        §5.2.2 Pitman-Yor過(guò)程及分層Pitman-Yor過(guò)程
    §5.3 基于句子的分層Pitman-Yor主題模型
    §5.4 基于句子的分層Pitman-Yor主題模型的后驗(yàn)推斷
    §5.5 實(shí)列分析
        §5.5.1 文本建模
        §5.5.2 文本分類(lèi)
第六章 結(jié)論與展望
參考文獻(xiàn)
致謝
在學(xué)期間的研究成果及發(fā)表的論文



本文編號(hào):2924913

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2924913.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)80806***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
久久久久久精品国产亚洲av麻豆 | 无码人妻AV免费一区二区三区| 亚洲欧美一区| 久久国产亚洲精品赲碰热| 影音先锋女人aa鲁色资源| av蜜桃| 极品在线色综合| 亚欧免费无码AⅤ在线观看蜜桃| 亚洲欧洲中文日韩久久AV乱码| 亚洲av综合色一区二区三区| 国产啪精品视频网站免费 | 中文字幕在线观看| 无码精品国产va在线观看| 精品成人乱色一区二区| 亚洲av无码专区亚洲猫咪| 海门市| 欧美激情性做爰免费视频| 91精品国产闺蜜国产在线闺蜜| 亚洲人成网站色www| 无码日韩人妻精品久久| 国产精品青青青在线观看| 久久久久久蜜桃| 天堂av影视| 丁香午夜| y111111国产精品久久久| 日韩加勒比无码人妻系列| 真实国产乱子伦精品一区二区三区| 精品无码一区二区三区爱欲九九| 国产av大陆精品一区二区三区| 精品一区二区三区中文字幕| 久久久成人av毛片免费观看| 麻豆╳╳╳乱女另类| 亚洲中文字幕久久精品无码2021| 色综合久久中文综合网| 国产成人精品久久一区二区三区| 欧美黑人XXXX性高清版| 一本一生久久a久久精品综合蜜| 亚洲av熟女| 黑人粗进入袖珍| 伦理在线看| 国产成人精品免费久久久久|