基于兩層特征投票法的二手車標價研究
發(fā)布時間:2024-01-23 14:00
隨著我國經(jīng)濟的持續(xù)發(fā)展,以及“互聯(lián)網(wǎng)+”經(jīng)濟形態(tài)逐步滲入二手汽車市場,使得消費者在網(wǎng)絡(luò)上就可以實現(xiàn)二手車的線上交易,便捷的交易方式促使二手車市場得到空前的繁榮發(fā)展。大數(shù)據(jù)的應(yīng)用也使得平臺上的二手車信息復(fù)雜多樣,如何從這些良莠不齊的二手車特征中尋找出影響其標價的重要因素,并利用它們構(gòu)建精確的預(yù)測模型顯得十分重要。傳統(tǒng)的二手車價格評估方法需要評估人對整個市場有長期的了解和相關(guān)經(jīng)驗的積累。近年來許多學(xué)者把機器學(xué)習(xí)中的算法應(yīng)用在二手車交易領(lǐng)域,形成了相關(guān)的價格預(yù)測模型,從數(shù)據(jù)挖掘的科學(xué)角度為買賣雙方的交易價格進行合理預(yù)測,降低了對二手車估價的專業(yè)門檻,極大地提高了二手車標價的科學(xué)性。本文的數(shù)據(jù)來源于Python爬取汽車之家平臺上的二手車詳情資料。對數(shù)據(jù)進行預(yù)處理后采用兩層投票法進行特征篩選,第一層分別采用方差選擇法、相關(guān)系數(shù)法、最大信息系數(shù)法、基于1L范數(shù)的Lasso選擇法和基于樹模型的GBDT選擇法進行特征選擇;第二層依據(jù)第一層的選擇結(jié)果再次投票,最終產(chǎn)生三個新的特征子集。另外使用主成分降維的方法作為對照,選取累計方差貢獻率前80%的12個主成分生成新的對照數(shù)據(jù)集。本文...
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
本文編號:3882791
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
圖1-12017-2021年中國汽車轉(zhuǎn)移登記業(yè)務(wù)柱形圖(單位:萬筆)
圖1-2技術(shù)路線圖
圖3-1投票機制流程圖
圖4-1汽車之家二手車頁面
本文編號:3882791
本文鏈接:http://www.wukwdryxk.cn/gongshangguanlilunwen/3882791.html
最近更新
教材專著