a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

社交網(wǎng)絡關聯(lián)分析技術及應用研究

發(fā)布時間:2020-05-26 22:36
【摘要】:在互聯(lián)網(wǎng)高速發(fā)展和大數(shù)據(jù)時代背景下,企業(yè)和用戶對于獲取數(shù)據(jù)背后潛在知識的要求更加迫切,數(shù)據(jù)挖掘正是發(fā)現(xiàn)潛在知識的重要途徑。但在面向社交網(wǎng)絡的數(shù)據(jù)挖掘中,社交網(wǎng)絡數(shù)據(jù)復雜性對挖掘算法的準確性和執(zhí)行效率提出了嚴峻挑戰(zhàn),如何提高算法效率成為了研究的核心問題。本文針對關聯(lián)規(guī)則挖掘方法進行深入研究,對于挖掘社交網(wǎng)絡數(shù)據(jù)間關聯(lián)關系具有一定的理論和實際意義。本文首先詳細闡述數(shù)據(jù)挖掘和關聯(lián)規(guī)則挖掘基本理論,分析社交網(wǎng)絡數(shù)據(jù)除具備傳統(tǒng)互聯(lián)網(wǎng)大數(shù)據(jù)特點外自身獨有特征,并研究了社交網(wǎng)絡數(shù)據(jù)特征對于關聯(lián)分析算法的實際需求,在明確社交網(wǎng)絡數(shù)據(jù)分析重點基礎上,提出適用于社交網(wǎng)絡數(shù)據(jù)分析流程。其次,針對經(jīng)典關聯(lián)規(guī)則挖掘算法Apriori進行深入研究,分析對于社交網(wǎng)絡數(shù)據(jù)關聯(lián)分析,Apriori還面臨著多次迭代掃描數(shù)據(jù)庫、產(chǎn)生候選項集過程中“連接”動作時間復雜度較高的問題。針對這些問題,本文利用Apriori頻繁項集產(chǎn)生階段從全局事務集中發(fā)現(xiàn)高階頻繁項集的特征,引入全局優(yōu)化搜索算法遺傳禁忌搜索產(chǎn)生頻繁項集,提出基于遺傳禁忌搜索的關聯(lián)規(guī)則挖掘算法,經(jīng)過實驗評估,驗證了算法的準確性和有效性,能夠解決好上述問題。再次,分析遺傳禁忌搜索在關聯(lián)規(guī)則挖掘中的可行性與優(yōu)勢,設計關聯(lián)規(guī)則編碼方式,結合關聯(lián)規(guī)則衡量標準構建為選擇算子提供主要依據(jù)的適應度函數(shù),針對遺傳禁忌搜索中模擬染色體交叉、變異操作,設計關聯(lián)規(guī)則挖掘相關遺傳算子,使算法能夠在全局事務集中快速發(fā)現(xiàn)高階頻繁項集,大幅度提升了關聯(lián)規(guī)則挖掘效率,保證了挖掘結果準確性。最后,將上述研究成果應用于面向社交網(wǎng)絡的實際場景中,設計并實現(xiàn)了在線教育學習平臺“學習支持”系統(tǒng),針對在線教育學習平臺用戶在社交網(wǎng)絡發(fā)布微博內(nèi)容與其在學習平臺近期學習狀態(tài)數(shù)據(jù)關聯(lián)關系進行挖掘,并對系統(tǒng)數(shù)據(jù)采集和預處理模塊進行詳細設計。應用結果表明系統(tǒng)能夠很好地運行于面向社交網(wǎng)絡的實際場景。系統(tǒng)應用部分既是理論研究與實際相結合,同時為在線教育平臺學生培養(yǎng)和成績預警提供了一種新思路。
【圖文】:

數(shù)據(jù)表,數(shù)據(jù)挖掘,冗余數(shù)據(jù),數(shù)據(jù)類型


有其他一些常見的數(shù)據(jù)類型例如半結構化數(shù)據(jù)、時間數(shù)據(jù)、實時數(shù)據(jù)、Web 數(shù)據(jù)等均可應用于數(shù)據(jù)挖掘中,如圖 2.2 所示。圖2.2 數(shù)據(jù)挖掘數(shù)據(jù)類型關系數(shù)據(jù)庫由多個規(guī)范化的數(shù)據(jù)表組成,這些數(shù)據(jù)表規(guī)范化后降低了冗余數(shù)據(jù)的可能性,,加快了數(shù)據(jù)訪問時間,表中記錄著多個元組,每個元組可以認為是一個數(shù)據(jù)對象,被唯一主鍵標識,通過數(shù)據(jù)庫查詢語言 SQL 獲取表中數(shù)據(jù)子集,構建適合應用于數(shù)據(jù)挖掘的表。關系數(shù)據(jù)庫數(shù)據(jù)在數(shù)據(jù)挖掘中同樣以表格的形式或單個關系展示,表格的每一列代表數(shù)據(jù)對象所具有的各特征,而每一行則代表在指定特征下的特征值。

數(shù)據(jù)集,數(shù)據(jù)


法的有效性和準確性。本文用于評估的真實數(shù)據(jù)集來自于 UCI 的事務數(shù)據(jù),共有103582 條事務,數(shù)據(jù)集大小 15116KB,圖 4.6 展示了部分數(shù)據(jù)集數(shù)據(jù)。圖4.6 數(shù)據(jù)集部分數(shù)據(jù)數(shù)據(jù)集中第一列標明各事務的編號,后續(xù)數(shù)據(jù)列表示每一事務中所有的購買物品,具體以物品編號顯示。4.4.1 評分函數(shù)評價評分函數(shù)是對算法和模型有效性量化表示的一種評估方法,關聯(lián)分析是描述性分析問題,故本文采用最大似然思想的評分函數(shù)對提出算法進行評估。評分函數(shù)設計定義為: 1, , ,NiEva s c p rule i s c (4-5)其中 p rule i , s ,c 為具體關聯(lián)規(guī)則 rule(i)在支持度 s 和置信度 c 下的評分函數(shù),本文將該函數(shù)定義為上文設計的具體關聯(lián)規(guī)則的適應度函數(shù): , , fitp rule i s c F (4-6)為了使評分函數(shù)值便于反應評估結果,需將評分函數(shù)值限定在[0,1]區(qū)間內(nèi),因此對式 4-5 取對數(shù)及取反
【學位授予單位】:西安電子科技大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP311.13;TP393.09

【參考文獻】

相關期刊論文 前4條

1 呂鐵;韓娜;;智能制造:全球趨勢與中國戰(zhàn)略[J];人民論壇·學術前沿;2015年11期

2 程學旗;靳小龍;王元卓;郭嘉豐;張鐵贏;李國杰;;大數(shù)據(jù)系統(tǒng)和分析技術綜述[J];軟件學報;2014年09期

3 孫大為;張廣艷;鄭緯民;;大數(shù)據(jù)流式計算:關鍵技術及系統(tǒng)實例[J];軟件學報;2014年04期

4 陳申燕;曹e

本文編號:2682502


資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/kejilunwen/sousuoyinqinglunwen/2682502.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶2b1ef***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
亚洲毛片不卡av在线播放一区| 国产69精品麻豆久久久久| 亚洲精品NV久久久久久久久久| 午夜亚洲国产理论片亚洲2020 | 久久青青草原国产毛片| 又大又硬又黄又刺激的免费视频| 亚洲成av人片在www| 十八毛片| 九九久久99| 国产精品久久久久久久久电影网| 欧美精品一区二区蜜臀亚洲| 欧美黑吊粗大猛烈18p| 懂色av粉嫩av蜜臀av| 午夜激情小说| 插我舔内射18免费视频| 无码AV片在线观看免费| 免费特级毛片| 色偷偷噜噜噜亚洲男人 | 亚洲精品一区二区三区新线路| 欧美一级黄片免费看| 四虎影视一区二区精品| 香蕉久久福利院| 洗澡被公强奷30分钟在线观看| 久久久久亚洲波多野结衣| 天天爽天天爽天天爽| 甘谷县| 国产精品99久久久久久人免费| 国产精品九九| 久久久成人av毛片免费观看| 熟妇与小伙子MATUR老熟妇E| 久久天天躁狠狠夜夜躁2020| 无码国产精品一区二区免费模式 | 国产婷婷丁香五月缴情成人网 | 亚洲一区av| 欧美色老翁oldvideos| 欧美禽狂配大交3d怪物| 国产激情无码视频在线播放性色 | www.亚洲一区| 欧美日韩www| 美女久久久久| 国产性生交大片免费|