微博網(wǎng)絡(luò)熱點(diǎn)話題發(fā)現(xiàn)技術(shù)研究
發(fā)布時(shí)間:2024-11-02 14:12
微博已經(jīng)成為當(dāng)今社會(huì)新一代的重要媒體,幾乎現(xiàn)實(shí)社會(huì)中的事件都會(huì)在微博中形成討論,并進(jìn)一步醞釀發(fā)酵,進(jìn)而影響到現(xiàn)實(shí)中的社會(huì)事件。因此對(duì)微博網(wǎng)絡(luò)中話題的產(chǎn)生發(fā)展及影響力研究,是當(dāng)前業(yè)界關(guān)注的問題之一,具有較強(qiáng)的社會(huì)意義和現(xiàn)實(shí)意義。 本論文的主要工作如下: 1、研究了微博文本的特點(diǎn),并針對(duì)其特殊性分析了現(xiàn)有文本處理策略對(duì)微博文本的適用性,在現(xiàn)有文本表示策略的基礎(chǔ)上,結(jié)合微博網(wǎng)絡(luò)的特點(diǎn),提出了一種適用于微博短文本的文本表示策略,其基本思想是將TFIDF策略與近義詞庫應(yīng)用相結(jié)合,對(duì)傳統(tǒng)的特征空間進(jìn)行調(diào)整,合并具有相關(guān)性的特征項(xiàng),以修正傳統(tǒng)特征空間中正交假設(shè)帶來的文本相似性度量的偏差,并利用微博評(píng)論擴(kuò)充微博文本,從而能夠更準(zhǔn)確的計(jì)算文本間的相似度。 2、在分析現(xiàn)有聚類算法的基礎(chǔ)上,給出了傳統(tǒng)文本聚類算法的優(yōu)缺點(diǎn),并在分析微博網(wǎng)絡(luò)中話題的發(fā)現(xiàn)對(duì)聚類算法的要求的基礎(chǔ)上,提出了增量式聚類算法Ant-tree的改進(jìn)算法——RD-Ant-tree算法。該算法利用Ant-tree算法在效率上的先天優(yōu)勢(shì),針對(duì)Ant-tree算法對(duì)數(shù)據(jù)輸入順序敏感的問題,通過動(dòng)態(tài)調(diào)整結(jié)果樹,降低了輸入順序?qū)λ惴ńY(jié)...
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
中文摘要
ABSTRACT
1 引言
1.1 背景及意義
1.2 相關(guān)研究現(xiàn)狀
1.2.1 短文本預(yù)處理與表示策略相關(guān)研究現(xiàn)狀
1.2.2 文本聚類相關(guān)研究現(xiàn)狀
1.3 論文主要工作及組織結(jié)構(gòu)
2 微博網(wǎng)絡(luò)話題發(fā)現(xiàn)相關(guān)技術(shù)
2.1 微博文本的特點(diǎn)
2.2 短文本表示策略的相關(guān)研究
2.3 經(jīng)典文本聚類算法
2.3.1 基于劃分的聚類算法
2.3.2 層次聚類算法
2.3.3 密度聚類算法
2.3.4 增量式聚類算法
2.4 微博用戶劃分研究
2.5 微博話題傳播特點(diǎn)
2.5.1 微博話題生命周期
2.5.2 二次傳播理論
2.6 本章小結(jié)
3 微博短文本表示策略研究
3.1 短文本降維策略改進(jìn)
3.1.1 短文本表示策略比較
3.1.2 RD-TFIDF表示策略的理論基礎(chǔ)
3.1.3 RD-TFIDF表示策略
3.2 評(píng)論信息擴(kuò)展的微博文本表示
3.2.1 微博評(píng)論的表現(xiàn)形式
3.2.2 微博評(píng)論的獲取
3.2.3 微博評(píng)論信息的過濾
3.2.5 微博文本信息擴(kuò)展策略
3.3 RD-TFIDF文本表示策略驗(yàn)證
3.3.1 實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備
3.3.2 評(píng)價(jià)方法與標(biāo)準(zhǔn)
3.3.3 實(shí)驗(yàn)結(jié)果與分析
3.4 本章小結(jié)
4 微博信息短文本聚類算法研究
4.1 Ant-tree的改進(jìn)算法RD-Ant-tree
4.1.1 現(xiàn)有聚類算法分析
4.1.2 Ant-tree算法的相關(guān)研究與改進(jìn)思路
4.1.3 DR-Ant-tree算法的設(shè)計(jì)思想
4.1.4 DR-Ant-tree算法描述
4.1.5 DR-Ant-tree算法性能分析
4.2 DR-Ant-tree算法驗(yàn)證
4.2.1 性能評(píng)價(jià)指標(biāo)
4.2.2 實(shí)驗(yàn)結(jié)果及分析
4.3 本章小結(jié)
5 基于微博網(wǎng)絡(luò)的話題評(píng)估研究
5.1 基于話題能量的話題熱度評(píng)估
5.1.1 熱點(diǎn)話題特征
5.1.2 微博話題熱度的影響因素
5.1.3 基于話題能量的熱度評(píng)估模型
5.2 話題潛在影響力評(píng)估
5.2.1 微博平臺(tái)的用戶劃分
5.2.2 微博突發(fā)事件傳播模型分析
5.2.3 微博話題的潛在影響力
5.3 本章小結(jié)
6 微博網(wǎng)絡(luò)熱點(diǎn)話題系統(tǒng)總體設(shè)計(jì)與實(shí)現(xiàn)
6.1 整體設(shè)計(jì)
6.2 話題發(fā)現(xiàn)模塊核心實(shí)現(xiàn)
6.2.1 微博信息的預(yù)處理實(shí)現(xiàn)
6.2.2 聚類分析實(shí)現(xiàn)
6.3 話題評(píng)估模塊處理流程與運(yùn)行效果
6.5 本章小結(jié)
7 結(jié)論與展望
7.1 總結(jié)
7.2 研究展望
參考文獻(xiàn)
作者簡(jiǎn)歷
學(xué)位論文數(shù)據(jù)集
本文編號(hào):4009632
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
中文摘要
ABSTRACT
1 引言
1.1 背景及意義
1.2 相關(guān)研究現(xiàn)狀
1.2.1 短文本預(yù)處理與表示策略相關(guān)研究現(xiàn)狀
1.2.2 文本聚類相關(guān)研究現(xiàn)狀
1.3 論文主要工作及組織結(jié)構(gòu)
2 微博網(wǎng)絡(luò)話題發(fā)現(xiàn)相關(guān)技術(shù)
2.1 微博文本的特點(diǎn)
2.2 短文本表示策略的相關(guān)研究
2.3 經(jīng)典文本聚類算法
2.3.1 基于劃分的聚類算法
2.3.2 層次聚類算法
2.3.3 密度聚類算法
2.3.4 增量式聚類算法
2.4 微博用戶劃分研究
2.5 微博話題傳播特點(diǎn)
2.5.1 微博話題生命周期
2.5.2 二次傳播理論
2.6 本章小結(jié)
3 微博短文本表示策略研究
3.1 短文本降維策略改進(jìn)
3.1.1 短文本表示策略比較
3.1.2 RD-TFIDF表示策略的理論基礎(chǔ)
3.1.3 RD-TFIDF表示策略
3.2 評(píng)論信息擴(kuò)展的微博文本表示
3.2.1 微博評(píng)論的表現(xiàn)形式
3.2.2 微博評(píng)論的獲取
3.2.3 微博評(píng)論信息的過濾
3.2.5 微博文本信息擴(kuò)展策略
3.3 RD-TFIDF文本表示策略驗(yàn)證
3.3.1 實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備
3.3.2 評(píng)價(jià)方法與標(biāo)準(zhǔn)
3.3.3 實(shí)驗(yàn)結(jié)果與分析
3.4 本章小結(jié)
4 微博信息短文本聚類算法研究
4.1 Ant-tree的改進(jìn)算法RD-Ant-tree
4.1.1 現(xiàn)有聚類算法分析
4.1.2 Ant-tree算法的相關(guān)研究與改進(jìn)思路
4.1.3 DR-Ant-tree算法的設(shè)計(jì)思想
4.1.4 DR-Ant-tree算法描述
4.1.5 DR-Ant-tree算法性能分析
4.2 DR-Ant-tree算法驗(yàn)證
4.2.1 性能評(píng)價(jià)指標(biāo)
4.2.2 實(shí)驗(yàn)結(jié)果及分析
4.3 本章小結(jié)
5 基于微博網(wǎng)絡(luò)的話題評(píng)估研究
5.1 基于話題能量的話題熱度評(píng)估
5.1.1 熱點(diǎn)話題特征
5.1.2 微博話題熱度的影響因素
5.1.3 基于話題能量的熱度評(píng)估模型
5.2 話題潛在影響力評(píng)估
5.2.1 微博平臺(tái)的用戶劃分
5.2.2 微博突發(fā)事件傳播模型分析
5.2.3 微博話題的潛在影響力
5.3 本章小結(jié)
6 微博網(wǎng)絡(luò)熱點(diǎn)話題系統(tǒng)總體設(shè)計(jì)與實(shí)現(xiàn)
6.1 整體設(shè)計(jì)
6.2 話題發(fā)現(xiàn)模塊核心實(shí)現(xiàn)
6.2.1 微博信息的預(yù)處理實(shí)現(xiàn)
6.2.2 聚類分析實(shí)現(xiàn)
6.3 話題評(píng)估模塊處理流程與運(yùn)行效果
6.5 本章小結(jié)
7 結(jié)論與展望
7.1 總結(jié)
7.2 研究展望
參考文獻(xiàn)
作者簡(jiǎn)歷
學(xué)位論文數(shù)據(jù)集
本文編號(hào):4009632
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/ydhl/4009632.html
最近更新
教材專著