基于深度學習的釣魚網(wǎng)頁檢測方法研究
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
圖4.6釣魚網(wǎng)頁示例
4基于表征學習的釣魚網(wǎng)頁檢測37樣,將“https://www.google.com”分割得到的單詞進行編碼并轉換為one-hot編碼矩陣,然后表征到低維向量空間,過程如圖4.5所示。URL單詞矩陣表示0.51455805,0.61036707,0.94602879,0.1377....
圖4.7網(wǎng)頁標簽實例
4基于表征學習的釣魚網(wǎng)頁檢測39HTML文本內容,但本質結構卻會有很大差異。HTML網(wǎng)頁的主要組成部分為文本內容、標簽以及組件信息,其中文本內容負責網(wǎng)頁信息的展示,標簽則為所展示網(wǎng)頁內容的控制符號。將HTML源碼進行解析,得到網(wǎng)頁標簽信息,可將其構造成HTML網(wǎng)頁DOM樹型結構。....
圖4.11URL字符串TSNE可視化
西安科技大學全日制工程碩士學位論文48從圖4.10可以看出,當URL字符串、DOM結構以及HTML文本內容均表示為128維向量時,MICBA模型在Accuracy和F1優(yōu)于其他向量維度表示,DOM結構以和HTML文本內容在Precision更優(yōu),URL字符串和DOM結構的TPR效....
圖4.12DOM結構TSNE可視化
4基于表征學習的釣魚網(wǎng)頁檢測49FPR上有著更好的結果。②DOM結構圖4.12為DOM樹結構向量化映射在二維平面上,可以發(fā)現(xiàn)head標簽跟body距離更近,tr和td為表格標簽也聚集在一起。這樣證明網(wǎng)頁DOM樹結構包含著深層次語義特征信息,能夠支持采用表征學習技術對其進行表示。圖....
本文編號:3902650
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xixikjs/3902650.html