釣魚網(wǎng)頁聯(lián)合特征與智能檢測算法研究與實現(xiàn)
發(fā)布時間:2020-11-12 19:10
釣魚網(wǎng)頁欺詐是現(xiàn)代網(wǎng)絡犯罪的主要手段。近幾年,釣魚網(wǎng)頁攻擊發(fā)生的次數(shù)顯著上升,并在2017年創(chuàng)下歷史新高。釣魚網(wǎng)頁攻擊可以讓詐騙方用最低的成本進行網(wǎng)頁攻擊部署,使其在短時間內(nèi)進行大規(guī)模傳播。為了保護互聯(lián)網(wǎng)用戶的信息安全免遭泄露,研究確定更加準確和有效的基于機器學習技術的自動網(wǎng)頁檢測方法來抵抗這種快節(jié)奏的網(wǎng)絡攻擊就顯得至關重要。本文主要研究使用多來源的特征訓練出能夠有效檢測釣魚網(wǎng)頁的分類模型。其中,分別從URL鏈接、網(wǎng)頁內(nèi)容元素和第三方網(wǎng)頁相關信息這三個來源派生特征,對其進行特征提取、特征選擇和特征重要度計算,得到基礎特征。為了使分類模型表達出對網(wǎng)頁更加豐富的細粒度的描述,引入聯(lián)合特征率R(0R=1)對基礎特征進行特征擴充和組合。在此基礎上,使用多種常用的分類模型,系統(tǒng)地對比了利用不同維度特征訓練出的分類模型在檢測釣魚網(wǎng)頁方面的效果。首先,分別通過對各種分類模型的主要參數(shù)進行參數(shù)調(diào)整,訓練出各自模型的最優(yōu)參數(shù)模型,從各自最優(yōu)參數(shù)模型中對比確定唯一的最優(yōu)分類模型。其次,對比了基于不同聯(lián)合特征率擴充所訓練出的最優(yōu)參數(shù)模型的分類效果。最后,將最優(yōu)參數(shù)模型與已有相關研究成果進行對比,隨機森林和神經(jīng)網(wǎng)絡模型檢測效果優(yōu)異,并且隨著R的提升,分類模型對釣魚網(wǎng)頁的檢測能力持續(xù)增強。本文還提出了一種改進的半監(jiān)督學習自訓練方法。該方法基于分治思想,將訓練集中大規(guī)模未標記數(shù)據(jù)平均拆分為多個子數(shù)據(jù)集,依次在這些子數(shù)據(jù)集上對分類模型進行遞歸訓練,得到最終分類模型。本文通過對比了多種分類模型在改進自訓練方法中的分類效果和運行時間,與傳統(tǒng)自訓練方法相比,改進的自訓練方法能夠有效地檢測釣魚網(wǎng)頁,并在保證分類效果與傳統(tǒng)自訓練方法持平的基礎上,方法運行時間相比于傳統(tǒng)自訓練平均降低50%以上,實現(xiàn)了更優(yōu)的方法時效性,為缺少大規(guī)?煽繕擞洈(shù)據(jù)和在線檢測等場景提供了一種新的研究思路。
【學位單位】:西安工業(yè)大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP393.092
【部分圖文】:
并在網(wǎng)頁上呈現(xiàn)出請求用戶私密信息的輸入字段,如登錄個人網(wǎng)上銀行賬戶的詳細信息。網(wǎng)頁釣魚的攻擊過程如圖1.1 所示,攻擊者首先攻擊網(wǎng)頁服務器,通過注冊新域名等方式建立釣魚網(wǎng)頁,利用黑客技術和社會工程學對用戶進行誘騙,使用戶在釣魚網(wǎng)頁上留下私密信息。圖 1.1 攻擊者通過釣魚網(wǎng)頁進行釣魚攻擊的流程圖 1.2 展示了阿里巴巴公司的個人登錄頁面以及其相對應的偽造網(wǎng)頁,圖 1.2(a)為攻擊者偽造的釣魚網(wǎng)頁,圖 1.2(b)為合法的登錄頁面。從圖中可以看出釣魚網(wǎng)頁在整體布局和形式上與真實網(wǎng)頁都比較相似,除了專業(yè)人員能夠根據(jù) URL 判斷出兩個網(wǎng)頁的異常外,普通用戶難以從頁面識別出哪個是釣魚網(wǎng)頁。因此攻擊者可以輕而易舉地獲取用戶在輸入框中提交的郵箱和密碼信息?
3(b)真實的阿里巴巴個人登錄頁面圖 1.2 仿照阿里巴巴個人登錄頁面的釣魚網(wǎng)頁和真實頁面絡釣魚的危害釣魚攻擊者通過建立偽裝的合法網(wǎng)頁騙取用戶提供敏感信息。為了完常侵入網(wǎng)絡托管和電子郵件帳戶。他們破壞受害者的信用評級、欺騙千萬美元的資金。據(jù)《中國互聯(lián)網(wǎng)發(fā)展狀況與安全報告》統(tǒng)計,僅在 網(wǎng)站數(shù)量已經(jīng)遠超 2014 年的 9.3 萬個,同比增長 49.4%。據(jù)中國電子,截至目前我國因網(wǎng)絡釣魚受騙網(wǎng)民數(shù)量已達 6000 多萬,年經(jīng)濟損失圖 1.3 所示,在 APWG 發(fā)布的 2016 年全球網(wǎng)絡釣魚調(diào)查報告中,由這
西安工業(yè)大學碩士學位論文看出網(wǎng)絡釣魚攻擊仍然是如今互聯(lián)網(wǎng)的一個重大威脅。在全球范圍內(nèi),存5 次獨立的網(wǎng)絡釣魚攻擊。同比 2015 年發(fā)現(xiàn)的 230,280 次攻擊增加了超過攻擊被定義為針對特定品牌或?qū)嶓w的釣魚網(wǎng)頁[4]。據(jù)最新統(tǒng)計顯示,僅在 ,釣魚攻擊次數(shù)就高達 291096 次。在如今數(shù)字經(jīng)濟時代,網(wǎng)絡釣魚詐騙的個人用戶乃至整個互聯(lián)網(wǎng)都帶來了非常大的危害。
【參考文獻】
本文編號:2881122
【學位單位】:西安工業(yè)大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP393.092
【部分圖文】:
并在網(wǎng)頁上呈現(xiàn)出請求用戶私密信息的輸入字段,如登錄個人網(wǎng)上銀行賬戶的詳細信息。網(wǎng)頁釣魚的攻擊過程如圖1.1 所示,攻擊者首先攻擊網(wǎng)頁服務器,通過注冊新域名等方式建立釣魚網(wǎng)頁,利用黑客技術和社會工程學對用戶進行誘騙,使用戶在釣魚網(wǎng)頁上留下私密信息。圖 1.1 攻擊者通過釣魚網(wǎng)頁進行釣魚攻擊的流程圖 1.2 展示了阿里巴巴公司的個人登錄頁面以及其相對應的偽造網(wǎng)頁,圖 1.2(a)為攻擊者偽造的釣魚網(wǎng)頁,圖 1.2(b)為合法的登錄頁面。從圖中可以看出釣魚網(wǎng)頁在整體布局和形式上與真實網(wǎng)頁都比較相似,除了專業(yè)人員能夠根據(jù) URL 判斷出兩個網(wǎng)頁的異常外,普通用戶難以從頁面識別出哪個是釣魚網(wǎng)頁。因此攻擊者可以輕而易舉地獲取用戶在輸入框中提交的郵箱和密碼信息?
3(b)真實的阿里巴巴個人登錄頁面圖 1.2 仿照阿里巴巴個人登錄頁面的釣魚網(wǎng)頁和真實頁面絡釣魚的危害釣魚攻擊者通過建立偽裝的合法網(wǎng)頁騙取用戶提供敏感信息。為了完常侵入網(wǎng)絡托管和電子郵件帳戶。他們破壞受害者的信用評級、欺騙千萬美元的資金。據(jù)《中國互聯(lián)網(wǎng)發(fā)展狀況與安全報告》統(tǒng)計,僅在 網(wǎng)站數(shù)量已經(jīng)遠超 2014 年的 9.3 萬個,同比增長 49.4%。據(jù)中國電子,截至目前我國因網(wǎng)絡釣魚受騙網(wǎng)民數(shù)量已達 6000 多萬,年經(jīng)濟損失圖 1.3 所示,在 APWG 發(fā)布的 2016 年全球網(wǎng)絡釣魚調(diào)查報告中,由這
西安工業(yè)大學碩士學位論文看出網(wǎng)絡釣魚攻擊仍然是如今互聯(lián)網(wǎng)的一個重大威脅。在全球范圍內(nèi),存5 次獨立的網(wǎng)絡釣魚攻擊。同比 2015 年發(fā)現(xiàn)的 230,280 次攻擊增加了超過攻擊被定義為針對特定品牌或?qū)嶓w的釣魚網(wǎng)頁[4]。據(jù)最新統(tǒng)計顯示,僅在 ,釣魚攻擊次數(shù)就高達 291096 次。在如今數(shù)字經(jīng)濟時代,網(wǎng)絡釣魚詐騙的個人用戶乃至整個互聯(lián)網(wǎng)都帶來了非常大的危害。
【參考文獻】
相關期刊論文 前3條
1 黃華軍;錢亮;王耀鈞;;基于異常特征的釣魚網(wǎng)站URL檢測技術[J];信息網(wǎng)絡安全;2012年01期
2 張衛(wèi)豐;周毓明;許蕾;徐寶文;;基于匈牙利匹配算法的釣魚網(wǎng)頁檢測方法[J];計算機學報;2010年10期
3 曹玖新;毛波;羅軍舟;劉波;;基于嵌套EMD的釣魚網(wǎng)頁檢測算法[J];計算機學報;2009年05期
本文編號:2881122
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/ydhl/2881122.html
最近更新
教材專著