a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

基于社交大數(shù)據(jù)的用戶信用畫像方法研究

發(fā)布時間:2018-08-08 11:42
【摘要】:近年來,移動互聯(lián)網(wǎng)和社交媒體異軍突起,逐步取代了傳統(tǒng)的博客、BBS論壇,成為人們進(jìn)行社交、學(xué)習(xí)、娛樂的主要平臺。與此同時,伴隨著整個社會對于互聯(lián)網(wǎng)、特別是移動互聯(lián)網(wǎng)的廣泛接受,被連接的用戶數(shù)以及用戶產(chǎn)生數(shù)據(jù)(UGC),呈現(xiàn)出爆發(fā)式增長。較之前的互聯(lián)網(wǎng)媒體技術(shù)(諸如郵件、論壇、博客),社交媒體記錄的數(shù)據(jù)類型更加豐富、及時,時效性更強。特別的,微博類型的社交媒體數(shù)據(jù),成為了信息發(fā)布、用戶間互動、事件發(fā)現(xiàn)擴散的公眾平臺。作為一種允許公開訪問、內(nèi)容簡短、近乎實時、海量規(guī)模的典型大數(shù)據(jù),微博等社交媒體數(shù)據(jù)獲得了學(xué)術(shù)界以及工業(yè)界研究者的廣泛關(guān)注。為了充分利用這一數(shù)據(jù)源,學(xué)術(shù)界在社交網(wǎng)絡(luò)理論、用戶行為模式、公共事件發(fā)展規(guī)律、謠言發(fā)現(xiàn)檢測方法的等方面開展了廣泛的研究。總體而言,社交媒體大數(shù)據(jù)中蘊含的寶貴信息、知識需要新穎的數(shù)據(jù)處理、分析方法來解決。但是,社交媒體大數(shù)據(jù)的長度短、質(zhì)量差、變化迅速、相關(guān)性弱這些問題也形成了新的挑戰(zhàn)和問題,使得傳統(tǒng)的數(shù)據(jù)挖掘方法無能為力。為了應(yīng)對社交媒體大數(shù)據(jù)中"序列性"、"行為性"、"多源性"等挑戰(zhàn),更好的實現(xiàn)基于社交數(shù)據(jù)的用戶信用畫像這一目標(biāo),本文進(jìn)行了微博類型數(shù)據(jù)的高效序列挖掘算法、基于微博用戶隱行為模式的用戶信用畫像、基于特征設(shè)計和集成學(xué)習(xí)融合多源信息的用戶信用畫像三個方面的研究。除此之外,在微博數(shù)據(jù)下用戶信用畫像算法的研究過程中,對于社交大數(shù)據(jù)上用戶畫像算法、技術(shù)做出研究歸納和展望。具體而言,本論文的主要研究內(nèi)容、創(chuàng)新點和學(xué)術(shù)貢獻(xiàn)包括以下三方面:1)微博數(shù)據(jù)是以時間線(Timeline)的形式呈現(xiàn)給用戶,本質(zhì)上是一種事件類型的序列數(shù)據(jù)。事件序列數(shù)據(jù)挖掘除了考慮項目(item)出現(xiàn)頻率外,也開始考慮項目的效用(utility),進(jìn)而實現(xiàn)高效用事件片段挖掘。針對單條事件序列的高效用挖掘,本文提出了對現(xiàn)有高效用片段(high utility episode)挖掘算法的多重優(yōu)化策略,使得算法運行速度和內(nèi)存效率都得到大規(guī)模的提升。更重要的一點,本文引入的詞法序前綴樹挖掘框架具有更緊的剪枝閾值估計,使得針對事件序列的高效用事件片段挖掘算法變得快速而實用(第三章)。2)微博數(shù)據(jù)中每一條微博,包含了限定長度的用戶產(chǎn)生文本內(nèi)容,也包含了與用戶行為相關(guān)的上下文信息。文本和行為兩種數(shù)據(jù)源可以同時為用戶信用建模提供數(shù)據(jù)支持,但是簡單特征抽取然后組合的做法,難以發(fā)現(xiàn)用戶文本和行為數(shù)據(jù)之間的緊相關(guān)性。為了實現(xiàn)基于行為模式的用戶信用畫像,本文通過概率圖模型的建模方法,將可觀察的用戶文本和多種行為特征融合,從而獲取為信用預(yù)測提供輸入的用戶隱行為模式。本文設(shè)計的概率主題模型LUBD-CM,假設(shè)一條微博由同一個主題產(chǎn)生,并且微博上行為數(shù)據(jù)和文本數(shù)據(jù)都受所分配主題約束。實驗結(jié)果表明,LUBD-CM這一模型相對LUBD-CM的簡化變種,傳統(tǒng)的LDA,樸素Bayes算法,對于用戶信用標(biāo)簽的預(yù)測性能都有大幅提升(第四章)。3)社交平臺上的用戶數(shù)據(jù),除了用戶產(chǎn)生內(nèi)容,也包括用戶個人信息、社交網(wǎng)絡(luò)關(guān)系。不同來源的用戶社交數(shù)據(jù),蘊含了不同類型的與用戶信用相關(guān)的信息。但是,微博社交數(shù)據(jù)的"即時性"導(dǎo)致數(shù)據(jù)質(zhì)量一般很低,難以作為標(biāo)準(zhǔn)分類器如SVM、決策樹的輸入并獲得較高的用戶標(biāo)簽預(yù)測性能。為了融合多源異構(gòu)社交數(shù)據(jù)中信用畫像有效信息,本文從個人信用相關(guān)的領(lǐng)域知識入手,廣泛分析多種可能的特征設(shè)計方案,從中選擇較好的社交特征,并且利用雙層集成學(xué)習(xí)框架,全面挖掘隱含在多種社交特征中的有效信息,從而實現(xiàn)綜合堆棧方法、提升方法和集成方法的用戶信用畫像預(yù)測系統(tǒng)(第五章)。值得一提的是,本文提出的針對微博社交數(shù)據(jù)的系列數(shù)據(jù)挖掘、用戶畫像方法,對于用戶產(chǎn)生的其他類型社交大數(shù)據(jù)(如Facebook數(shù)據(jù),微信數(shù)據(jù)),很大程度上也是適用的。本文雖然重點研究了用戶信用屬性的預(yù)測和畫像,所提出新方法、新技術(shù)對于其他類型個人標(biāo)簽(如年齡、性別、婚否)的預(yù)測,也都是適用的。
[Abstract]:In recent years, mobile Internet and social media have sprung up, gradually replacing traditional blogs, BBS forums, as the main platform for people to socialize, learn, and entertain. At the same time, with the wide acceptance of the whole society, especially the mobile Internet, the number of connected users and the user generated data (UGC). Explosive growth. Compared with previous Internet media technologies (such as mail, forums, blogs), social media records are more rich in data, timely and more timeliness. In particular, micro-blog type social media data has become a public platform for information release, interuser interaction, and event discovery diffusion. In order to make full use of this data source, the academic community has carried out a wide range of social network theory, user behavior patterns, public event development rules, and rumor discovery detection methods, in order to make full use of this data source. In general, the valuable information contained in the large data of social media requires new data processing and analytical methods to solve them. However, new challenges and problems have been formed by the short length, poor quality, rapid change and weak correlation of the social media data, which makes the traditional data mining methods incapable. In response to the challenges of "sequence", "behavioural" and "multi source" in social media data, the goal of a user credit portrait based on social data is better implemented. This paper carries out an efficient sequence mining algorithm for micro-blog type data, based on the user's credit portrait of the implicit behavior model of micro-blog users, based on feature design and integrated learning fusion. Research on three aspects of user credit portrait of multi source information. In addition, in the research process of user credit image algorithm under micro-blog data, this paper makes a summary and prospect for the user portrait algorithm on social large data. In particular, the main research content, innovation and academic contributions of this paper include the following three aspects: 1) Micro-blog data is presented to the user in the form of time line (Timeline), which is essentially an event type sequence data. Event sequence data mining, in addition to considering the frequency of the project (item), also starts to consider the utility of the project (utility), and then implements efficient fragment mining. This paper proposes a multiple optimization strategy for the existing high utility episode mining algorithm, which makes the algorithm running speed and memory efficiency improved on a large scale. More important, the word sequence prefix tree mining framework introduced in this paper has a tighter pruning threshold value estimation, which makes the event sequence efficient use of events. Fragment mining algorithm becomes fast and practical (third chapter).2) every micro-blog in micro-blog data contains text content and context information related to user behavior. Text and behavior two data sources can provide data support for user's credit model at the same time, but simple feature extraction is then used. In order to realize the user's credit picture based on the behavior pattern, this paper, through the modeling method of the probability graph model, combines the observable user text with a variety of behavior features to obtain the user's implicit behavior pattern which provides input for the prediction of the letter. The probabilistic theme model, LUBD-CM, is designed to assume that a micro-blog is generated by the same topic and that both the behavior data and the text data on micro-blog are constrained by the assigned topic. The experimental results show that the LUBD-CM model is a simplified variant of the LUBD-CM, the traditional LDA, and the simple Bayes algorithm, for the prediction performance of the user credit label. Promotion (fourth chapter).3) user data on social platform, except user generated content, including user personal information, social network relationship. Different sources of user social data contain different types of information related to user credit. However, the "immediacy" of micro-blog social data causes the data quality to be generally very low and difficult to be used as a standard. Quasi classifier such as SVM, the input of the decision tree and the higher user tag prediction performance. In order to fuse the effective information of the credit picture in the multi-source heterogeneous social data, this paper, starting with the personal credit related domain knowledge, analyzes a wide variety of possible feature design schemes to select better social features and use the double layer integration. Learning framework, fully mining the effective information hidden in a variety of social characteristics, so as to realize the comprehensive stack method, the promotion method and the integration method user credit picture prediction system (fifth chapter). It is worth mentioning that the series data mining for micro-blog social data, the user portrait method and the user generated by this paper His type of social data (such as Facebook data, WeChat data) is largely applicable. Although this paper focuses on the prediction and portrait of the user's credit attributes, the new method is also applicable to other types of personal tags such as age, sex, or marital status.
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2017
【分類號】:TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 靈子;信用消費悄然興起[J];信息經(jīng)濟與技術(shù);1994年12期

2 高靜霞,何英華;淺析信用及其對企業(yè)的影響[J];科技情報開發(fā)與經(jīng)濟;2002年06期

3 肖勝;柯曉燕;徐靜;全波;馮炳麟;;開放信用消費 實現(xiàn)差異化服務(wù)[J];通信企業(yè)管理;2013年06期

4 韓偉;;小議信用檔案的建立[J];機電兵船檔案;2003年01期

5 ;信用你用了嗎?[J];數(shù)字生活;2001年03期

6 陳正月,張建忠;信用檔案悄然叩開百姓門[J];湖北檔案;2000年09期

7 任瓏;陳小筑;曹文煉;張子紅;;加速培育信用信息服務(wù)市場[J];中國信息界;2004年07期

8 ;新聞·時事追蹤[J];上海微型計算機;1999年42期

9 王雪玉;;銀行系電商崛起[J];金融科技時代;2014年06期

10 ;[J];;年期

相關(guān)重要報紙文章 前10條

1 大林;信用消費呼喚誠信[N];健康報;2006年

2 商務(wù)部市場秩序司司長 向欣;支持信用消費發(fā)展 推動消費模式轉(zhuǎn)變[N];國際商報;2009年

3 譚浩俊;信用消費基礎(chǔ)建設(shè)應(yīng)提速[N];經(jīng)濟參考報;2012年

4 孫韶華;促消費新政出臺 信用消費或受支持[N];中國貿(mào)易報;2012年

5 記者 孫韶華;信用消費有望獲政策“紅包”[N];經(jīng)濟參考報;2012年

6 江德斌;鼓勵信用消費 “債務(wù)奴隸”會不會更多[N];中國商報;2012年

7 孫韶華;信用消費有望獲鼓勵[N];聯(lián)合日報;2012年

8 本報記者 吳力;不要對信用消費盲目叫好[N];國際商報;2013年

9 記者 張慧敏;“三零”信用消費模式促消費效果明顯[N];北京商報;2013年

10 胡慧平;“債百萬”敲響信用消費警鐘[N];大眾科技報;2003年

相關(guān)博士學(xué)位論文 前5條

1 郭光明;基于社交大數(shù)據(jù)的用戶信用畫像方法研究[D];中國科學(xué)技術(shù)大學(xué);2017年

2 陳忠;信用消費論[D];中國社會科學(xué)院研究生院;2002年

3 葉建亮;交易擴展中的信用[D];浙江大學(xué);2004年

4 葉建亮;交易擴展中的信用——一個制度與組織的視角[D];浙江大學(xué);2004年

5 葉圣利;中國誠信經(jīng)濟思想研究[D];復(fù)旦大學(xué);2004年

相關(guān)碩士學(xué)位論文 前10條

1 黃羽茜;美國信用消費保護法律體系的歷史發(fā)展及其對我國的借鑒意義[D];中國政法大學(xué);2007年

2 曲豪;我國信用消費的倫理研究[D];河北大學(xué);2015年

3 許勇;基于流動性風(fēng)險和信用風(fēng)險的M商業(yè)銀行違約風(fēng)險研究[D];南京理工大學(xué);2015年

4 張萍;渭南市信用消費發(fā)展研究[D];西北農(nóng)林科技大學(xué);2015年

5 宋昊澤;信用評級變動與盈余管理的相關(guān)性研究[D];東北財經(jīng)大學(xué);2015年

6 高彩鳳;信用消費中消費者權(quán)益保護法律問題探討[D];江西財經(jīng)大學(xué);2015年

7 黃敏;蒙古族大學(xué)生信用消費問題研究[D];內(nèi)蒙古師范大學(xué);2016年

8 王漪鷗;個人信用消費貸款法律制度研究[D];首都經(jīng)濟貿(mào)易大學(xué);2011年

9 王國棟;我國信用消費倫理研究[D];山西財經(jīng)大學(xué);2012年

10 苗炎;信用的建立與維護——一個法律社會學(xué)的分析[D];吉林大學(xué);2004年



本文編號:2171683

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xxkjbs/2171683.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f5107***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日产精品久久久久久久| 一区二区色| 影音先锋男人av橹橹色| 国产精品久久久久jk制服| VR成人片在线播放网站| 国产亚洲AV片在线观看播放| 亚洲精品自产拍在线观看动漫| 在线色网| 快播色图| 伊人干综合| 陈宝莲三a级做爰片| 亚洲免费| 91 久久| 91插插插插插| 亚洲avav天堂av在线网爱情| 亚洲国产精品VA在线观看麻豆| 强开小婷嫩苞又嫩又紧视频| 男人扒女人添高潮视频| 91精品久久久久久久99蜜桃| 九色丨9lpony丨国产| 第九色| 99热6| 欧美白人最猛性xxxxx69交 | 樱花草www日本在线观看| 永久免费的啪啪网站免费观看| 亚洲av无码男人的天堂在线 | 国产精品国产三级国快看| 亚洲国产福利一区二区三区 | 日韩加勒比无码人妻系列| 欧美特黄特色三级视频在线观看| 制服丝袜有码中文字幕在线| 精品无码日韩一区二区三区不卡| 狠狠躁日日躁夜夜躁2020| 寻乌县| 亚洲另类精品无码专区| 99久久国产综合精品成人影院| 一本一本久久A久久综合精品| 在线观看免费播放AV片| 久久精品女人的天堂av| 国产免费午夜a无码v视频| 中文无码精品A∨在线观看不卡|