a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

缺失的分類數(shù)據(jù)填補方法研究

發(fā)布時間:2021-02-01 16:29
  缺失數(shù)據(jù)的處理是數(shù)據(jù)預處理中很重要的一部分.缺失數(shù)據(jù)的存在對模型的估計,模型的檢驗等造成了影響,研究如何有效的處理缺失數(shù)據(jù)具有很重要的意義.該文主要是探討對分類數(shù)據(jù)的缺失填補方法的研究.假設(shè)分類屬性數(shù)據(jù)是由一個潛在的服從標準正態(tài)分布的連續(xù)變量決定的,然后分別討論了兩類情況,一類是沒有因變量的數(shù)據(jù)集,另一類是含有因變量的數(shù)據(jù)集(這里僅對一個因變量的情況討論).對于無因變量的情況,考慮樣本之間的相似性,結(jié)合數(shù)據(jù)集轉(zhuǎn)化的思想提出了一種新的填補算法(TKNN填補算法).對于有一個因變量的情況,數(shù)據(jù)集轉(zhuǎn)化后再用回歸方程估計缺失值,即改進的回歸填補算法(TReg填補算法).文中用均方根誤差RMSE作為評價指標,可以看到將數(shù)據(jù)集轉(zhuǎn)化后的填補算法在一定程度上的有效性.本文主要結(jié)論是:1.在缺失比例較小時,用完全個體分析就能得到較好的結(jié)果.2.TReg和TKNN填充算法在一定程度上比直接在原始數(shù)據(jù)集上做填充的效果好.希望本文對之后學者研究缺失數(shù)據(jù)及數(shù)據(jù)分析時有一定的借鑒意義. 

【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:41 頁

【學位級別】:碩士

【部分圖文】:

缺失的分類數(shù)據(jù)填補方法研究


圖2.1缺失模式??

數(shù)據(jù)集


.本文一開始假設(shè)分類變量是由潛在的服從連續(xù)分布的變量決定的,正態(tài)分是連續(xù)分布的一種,現(xiàn)實生活中許多數(shù)據(jù)可以看成是來自于正態(tài)分布,正態(tài)分又常叫做高斯分布,是一個在概率上很重要的分布.所以接下來的一節(jié)內(nèi)容將紹分類變量和服從標準正態(tài)分布的變量以及潛變量表達式三者之間的轉(zhuǎn)化.??2.4.1服從一元正態(tài)分布變量的轉(zhuǎn)化??二元變量的轉(zhuǎn)化??下圖表明了一個服從標準正態(tài)分布隨機變量Z與一個服從伯努利分布的散屬性變量具有兩個值0或1)之間的轉(zhuǎn)化,當Pps:?=?1)?=?0.2,_PpS:=〇)?=P。=?1?—仍=?0.8時,求得g?=疒Ypo)?=?0.8416212,當潛在變量Z是取值于g值時取值為0,當Z取值大于等于值時,X取值為1.??

條件期望,均值,事例,缺失數(shù)據(jù)


圖3.1條件期望填補和均值填補??TKNN填補算法??一節(jié)將介紹改進的近鄰算法,這里定義為TKNN(Translated?KNN算法填補缺失數(shù)據(jù)步驟如下:??首先根據(jù)前面一章對數(shù)據(jù)集的轉(zhuǎn)化的內(nèi)容,將分類數(shù)據(jù)%轉(zhuǎn)化為對于每一個缺失數(shù)據(jù),計算它與其他事例之間的相似度.??s(Xi,Xj)?=?WjS_1Uj??d(xi,Xj)?=?exp(—s(xi,Xj))??根據(jù)計算得到的距離從小到大的順序,選取前k個事例??因為這里考慮的是分類數(shù)據(jù),所以以選取的k個事例的最大類進

【參考文獻】:
期刊論文
[1]基于數(shù)據(jù)集特征的KNN最優(yōu)K值預測方法[J]. 李洪奇,楊中國,朱麗萍,劉薔.  計算機應用與軟件. 2016(06)
[2]基于近鄰噪聲處理的KNN缺失數(shù)據(jù)填補算法[J]. 郝勝軒,宋宏,周曉鋒.  計算機仿真. 2014(07)
[3]二分類Logistic回歸插補法及其應用[J]. 戴明鋒,金勇進,查奇芬,劉寅飛.  數(shù)學的實踐與認識. 2013(21)
[4]基于BP神經(jīng)網(wǎng)絡的不完全測量數(shù)據(jù)處理方法研究[J]. 任云志,賀躍光,吳弘,姬方,戴瀟蕾.  現(xiàn)代測繪. 2013(01)
[5]基于不完備數(shù)據(jù)聚類的缺失數(shù)據(jù)填補方法[J]. 武森,馮小東,單志廣.  計算機學報. 2012(08)
[6]基于EM和貝葉斯網(wǎng)絡的丟失數(shù)據(jù)填充算法[J]. 李宏,阿瑪尼,李平,吳敏.  計算機工程與應用. 2010(05)
[7]基于馬氏距離和灰色分析的缺失值填充算法[J]. 劉星毅.  計算機應用. 2009(09)
[8]列聯(lián)表的對數(shù)線性模型[J]. 孫鳳.  統(tǒng)計與決策. 2006(23)
[9]缺失數(shù)據(jù)處理方法的比較研究[J]. 劉鵬,雷蕾,張雪鳳.  計算機科學. 2004(10)
[10]高屬性維稀疏數(shù)據(jù)聚類回歸邏輯神經(jīng)網(wǎng)絡模型及學習算法[J]. 周永權(quán),焦李成.  電子學報. 2004(08)



本文編號:3013081

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/3013081.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶535c1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
精品久久人人妻人人做精品| 豆国产96在线 | 亚洲| 久久久久国产精品免费免费搜索 | 欧美日韩色图| 朋友的妈妈在线播放| 国产99视频精品免视看9| 国产精品久久婷婷六月丁香| 无码人妻aⅴ一区二区三区蜜桃| 成人做爰www免费直播| 伊人狠狠操| 特级精品毛片免费观看| 欧美牲交A欧美牲交aⅴ久久| 我和子发生了性关系视频| 色欲色香天天天综合网站| 国产人成午夜免电影费观看| 惠安县| 精品人妻一区二区三区久久夜夜嗨 | 亚洲国产区男人本色| 亚洲欧美日韩久久精品| 日韩国产成人精品视频| 国产区在线观看成人精品| 午夜福利一区二区| 亚洲涩涩涩| 99综合| 日韩一区二区三区| 亚洲精品aa片在线观看国产| 亚洲国产精品无码第一区二区三区| 国内自拍视频一区二区三区| 国产精品中文久久久久久久| 在线成人a毛片免费播放| 亚洲精品国产欧美一二区| 精品国产sm最大网站| 色噜噜久久综合伊人超碰| 少妇凸bbwbbw高潮喷水图| 附近寂寞少妇| 亚洲av杨幂性猛交xxx| 国产精品777| 中文字幕婷婷| 少妇高潮毛片| 国产精品2| 日本中文在线|