a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

當(dāng)前位置:主頁 > 管理論文 > 統(tǒng)計學(xué)論文 >

微博會員流失預(yù)測

發(fā)布時間:2020-09-29 06:30
   隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,中國已經(jīng)進入到互聯(lián)網(wǎng)時代,各個互聯(lián)網(wǎng)公司、企業(yè)已經(jīng)積累了TB級甚至PB級的用戶數(shù)據(jù),這些數(shù)據(jù)作為互聯(lián)網(wǎng)公司的巨大財富,加以利用,可以給公司有效節(jié)約成本、增加收入。因此如何挖掘出隱藏在數(shù)據(jù)中的某種規(guī)律,顯得十分重要。數(shù)據(jù)挖掘技術(shù)是是通過數(shù)學(xué)模型方法對數(shù)據(jù)進行擬合,利用計算機技術(shù)去實現(xiàn)模型,最后反饋到業(yè)務(wù)實施建議上的技術(shù)。在客戶流失預(yù)測方面,有很多數(shù)據(jù)挖掘的分類算法可以有用武之地。本文針對國內(nèi)社交平臺新浪微博的會員數(shù)據(jù),利用數(shù)據(jù)挖掘中的分類預(yù)測算法,對會員流失進行預(yù)測。基于2015年4月2日至8日會員身份即將到期的26171位微博會員用戶的數(shù)據(jù),首先利用k-means聚類,選用用戶屬性和主動行為數(shù)據(jù)作為特征,對用戶進行細(xì)分,找出了價值較高的用戶群體。對于本文的不平衡樣本集,對樣本量較少的類別采用有放回重復(fù)抽樣的方法。然后選用70%的樣本作為訓(xùn)練集,利用邏輯回歸、決策樹C5.0、神經(jīng)網(wǎng)絡(luò)分類預(yù)測模型,對會員是否流失做出預(yù)測,其中邏輯回歸在ROC曲線和提升圖上均表現(xiàn)地比決策樹C5.0要好。之后引入代價敏感學(xué)習(xí),對于將流失用戶預(yù)測為非流失會員用戶加大了代價,改進決策樹C5.0,預(yù)測出了流失用戶名單,用于企業(yè)挽留措施的目標(biāo)群體。
【學(xué)位單位】:北京理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2017
【中圖分類】:C81
【部分圖文】:

曲線,曲線,因變量,連接函數(shù)


因變量一般是連續(xù)變量,那么當(dāng)因變量是二?logistic 回歸就是這樣一個分類模型。性模型,一般不能應(yīng)用于分類問題上,二分設(shè)函數(shù)表達(dá)式為 ( ) = 數(shù)。值也是在( )范圍上的。那么怎么才能連接函數(shù),稱為 logistic 函數(shù),因其函數(shù)圖像tic 函數(shù)的表達(dá)式為: ( ) =

空值,數(shù)據(jù)質(zhì)量,對相,短信


北京理工大學(xué)碩士學(xué)位論文續(xù)表 3.5變量名 變量類型 變量說明 變量取值累計使用特權(quán)種類 離散 累計使用特權(quán)的種類 0~4短信特別關(guān)注人數(shù) 連續(xù) 短信特別關(guān)注人數(shù) 0~18是否使用短信特別關(guān)注 連續(xù) 短信特別關(guān)注人數(shù)不為 0 為使用,1 為使用 0,13.3 數(shù)據(jù)清洗從業(yè)務(wù)部門獲得的數(shù)據(jù)往往是一些臟數(shù)據(jù),對于建模還需對離群值、缺失值、極值等等進行處理才能達(dá)到建模要求的數(shù)據(jù)質(zhì)量和形式。對于 26171 個會員數(shù)據(jù),先來看看數(shù)據(jù)質(zhì)量如何,spss modeler 里添加數(shù)據(jù)審核,得到完整字段的比例為 76.36%,完整記錄的比例為 68.95%。以三個標(biāo)準(zhǔn)差為離群值的話,有很多離群值和極值,且有很多缺失空值。

餅圖,樣本分布,餅圖


圖 3.2 樣本分布餅圖大部分樣本均為流失會員用戶,是一個不平衡樣本,這樣的樣本在采用欠抽樣或者過抽樣來減少樣本量差異對結(jié)果的影響。用戶的其他變量,可按照連續(xù)變量和離散變量來分析。續(xù)性變量的探索性分析大部分的變量均屬于連續(xù)型變量,如用戶的發(fā)博數(shù)、轉(zhuǎn)發(fā)數(shù)、評論可以先看一下這些會員的登陸情況,這樣可以反映他們上微博的活更好的直觀效果,30 天前的登陸天數(shù)每 5 天歸為一個登陸區(qū)間,

【參考文獻】

相關(guān)期刊論文 前5條

1 羅彬;邵培基;羅盡堯;劉獨玉;夏國恩;;基于多分類器動態(tài)集成的電信客戶流失預(yù)測[J];系統(tǒng)工程學(xué)報;2010年05期

2 肖進;賀昌政;;基于動態(tài)分類器集成的客戶流失預(yù)測模型研究[J];預(yù)測;2010年05期

3 夏國恩;;基于核主成分分析特征提取的客戶流失預(yù)測[J];計算機應(yīng)用;2008年01期

4 應(yīng)維云;覃正;趙宇;李兵;李秀;;SVM方法及其在客戶流失預(yù)測中的應(yīng)用研究[J];系統(tǒng)工程理論與實踐;2007年07期

5 葉進,程澤凱,林士敏;基于貝葉斯網(wǎng)絡(luò)的電信客戶流失預(yù)測分析[J];計算機工程與應(yīng)用;2005年14期

相關(guān)碩士學(xué)位論文 前5條

1 趙冬偉;基于數(shù)據(jù)挖掘的客戶流失預(yù)測研究[D];湘潭大學(xué);2012年

2 劉孝會;基于決策樹算法的IT行業(yè)客戶流失預(yù)測技術(shù)研究[D];江西理工大學(xué);2011年

3 司學(xué)峰;基于數(shù)據(jù)挖掘的客戶流失預(yù)測實證研究[D];北京工業(yè)大學(xué);2009年

4 羅巧玲;面向客戶流失預(yù)測的關(guān)聯(lián)規(guī)則挖掘算法應(yīng)用研究[D];河北工業(yè)大學(xué);2007年

5 程程;商業(yè)銀行高端個人客戶流失預(yù)測[D];清華大學(xué);2007年



本文編號:2829366

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2829366.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶daaca***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日韩精品在线一区二区| 亚洲av永久纯肉无码精品动漫 | 亚洲熟妇av一区二区三区宅男 | 东阿县| 97超碰| 国产中文区二幕区20223| 加勒比无码专区中文字幕| 天天碰免费上传视频| 国产精品香港三级国产AV| 国产综合久久久久鬼色| 黑人大战欲求不满人妻| 国产精品爽爽ⅤA在线观看| 五月丁香六月综合缴清无码| 波多野结衣高潮喷水在线观看| 91丨九色丨国产熟女1| 精品无码人妻一区二区三| 国产A∨国片精品青草视频| 精品久久久久国产免费| 乱人伦中文无码视频在线观看| 日本乱人伦片中文三区| 亚洲狠狠婷婷综合久久久久| 久久综合婷婷丁香五月中文字幕| 亚洲精品乱码久久久久蜜桃 | jizzjizz国产精品久久| 亚洲制服丝袜中文字幕自拍| 少妇无码太爽了在线播放| 成年肉动漫在线观看无码中文 | 扎鲁特旗| 少妇喷水| 欧美av另类交| 国产精品久久久久久岛国| 中文字幕内射| 六十路垂乳熟女田舍交尾| 精品久久久久久久免费人妻| 97人人看| 国产精品久久久久久精品毛片| 日韩成人av在线| 少妇做爰18p极品少妇| 欧亚色图| 亚洲一级精品| 久久久大片|