基于注意力機制的視頻哈希檢索方法研究
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1哈希學(xué)習(xí)思想示例W??哈希學(xué)習(xí)可以將文本、圖像、視頻等類型的數(shù)據(jù)映射成一段較短的哈希碼,??
?山東大學(xué)碩士學(xué)位論文???第2章相關(guān)技術(shù)介紹??在本章中,首先對哈希學(xué)習(xí)進行簡單的介紹。然后詳細介紹本文方法中所使??用的各種相關(guān)技術(shù),包括卷積神經(jīng)網(wǎng)絡(luò),長短期記憶神經(jīng)網(wǎng)絡(luò)和注意力機制。??2.1哈希學(xué)習(xí)??隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,海量的數(shù)據(jù)被互聯(lián)網(wǎng)用戶上傳到互聯(lián)網(wǎng)上,其中尤??....
圖2-2VGG-16?(?
?山東大學(xué)碩士學(xué)位論文???在本方法中,我們使用VGG網(wǎng)絡(luò)來提取視頻中每一幀的特征。VGG網(wǎng)絡(luò)結(jié)??構(gòu)相對比較簡單,通過卷積層的疊加來學(xué)習(xí)圖像的高級特征,VGG-16和VGG-??19的網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2-2?(a)和圖2-2?(b)所示。??(?(?"1??224*224?圖像?....
圖2-3長短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??長短期記憶神經(jīng)網(wǎng)絡(luò)包括一個輸入門,一個輸出門,一個遺忘門和兩個狀態(tài)??
列中的長期依賴信息。梯度消失問題與梯度爆炸問題是??由于權(quán)重矩陣循環(huán)相乘導(dǎo)致的。解決梯度爆炸問題可以采用截斷的方式。通過設(shè)??置一個臨界值,將大于臨界值的梯度的值截斷為該臨界值。然而,該方法會在一??定程度上改變梯度的方向。梯度消失問題無法使用截斷的方式來進行處理。如果??采用截....
圖2*4圖像中的注意力機制[541??2.4.2自然語言處理中的注意力機制??
?山東大學(xué)碩士學(xué)位論文???的位置。如圖2-4所示,圖像中紅色的區(qū)域表示注意力集中地地方,而藍色的區(qū)??域代表人類的注意力不在這個位置。當(dāng)人類看到圖2-4左上角圖像時,會自動將??注意力集中在圖像中的狗身上,因此紅色區(qū)域主要集中在狗身上;同樣地,當(dāng)人??類看到圖2*4右上角的圖像....
本文編號:4051924
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xixikjs/4051924.html
下一篇:沒有了