a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

一種基于GPU的高性能稀疏卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化

發(fā)布時(shí)間:2024-05-27 05:57
  卷積神經(jīng)網(wǎng)絡(luò)CNN目前作為神經(jīng)網(wǎng)絡(luò)的一個(gè)重要分支,相比于其他神經(jīng)網(wǎng)絡(luò)方法更適合應(yīng)用于圖像特征的學(xué)習(xí)和表達(dá)。隨著CNN的不斷發(fā)展,CNN將面臨更多的挑戰(zhàn)。CNN參數(shù)規(guī)模變得越來(lái)越大,這使得CNN對(duì)計(jì)算的需求量變得非常大。因此,目前產(chǎn)生了許多種方式對(duì)CNN的規(guī)模進(jìn)行壓縮。然而壓縮后的CNN模型往往產(chǎn)生了許多稀疏的數(shù)據(jù)結(jié)構(gòu),這種稀疏結(jié)構(gòu)會(huì)影響CNN在GPU上的性能。為了解決該問(wèn)題,采用直接稀疏卷積算法,來(lái)加速GPU處理稀疏數(shù)據(jù)。根據(jù)其算法特點(diǎn)將卷積運(yùn)算轉(zhuǎn)換為稀疏向量與稠密向量?jī)?nèi)積運(yùn)算,并將其在GPU平臺(tái)上實(shí)現(xiàn)。本文的優(yōu)化方案充分利用數(shù)據(jù)稀疏性和網(wǎng)絡(luò)結(jié)構(gòu)來(lái)分配線程進(jìn)行任務(wù)調(diào)度,利用數(shù)據(jù)局部性來(lái)管理內(nèi)存替換,使得在稀疏卷積神經(jīng)網(wǎng)絡(luò)SCNN中的GPU仍能夠高效地處理卷積層運(yùn)算。相比cuBLAS的實(shí)現(xiàn),在AlexNet、GoogleNet、ResNet上的性能提升分別達(dá)到1.07×~1.23×、1.17×~3.51×、1.32×~5.00×的加速比。相比cuSPARSE的實(shí)現(xiàn),在AlexNet、GoogleNet、ResNet上的性能提升分別達(dá)到1.31×~1.42×、1.09×~2.00×、1.0...

【文章頁(yè)數(shù)】:9 頁(yè)

【部分圖文】:

圖1降維展開(kāi)方式實(shí)現(xiàn)卷積運(yùn)算Figure1Loweringmethodperformsconvolutionoperation

圖1降維展開(kāi)方式實(shí)現(xiàn)卷積運(yùn)算Figure1Loweringmethodperformsconvolutionoperation

Figure1Loweringmethodperformsconvolutionoperation圖1降維展開(kāi)方式實(shí)現(xiàn)卷積運(yùn)算Table1Descriptionofconvolutionparameters表1卷積參數(shù)描述參數(shù)描述N三維輸入特征矩陣批處理任務(wù)的batchsizeM....


圖2直接稀疏卷積Figure2Directsparseconvolution

圖2直接稀疏卷積Figure2Directsparseconvolution

接稀疏卷積去除了輸入特征矩陣中的數(shù)據(jù)重復(fù)復(fù)制。該算法將卷積核矩陣的規(guī)模擴(kuò)展到輸入矩陣的相同大小。對(duì)于延展后的卷積核行展開(kāi)生成向量Wm,其長(zhǎng)度為C×H×W。由于有M個(gè)卷積核,對(duì)每一個(gè)卷積核進(jìn)行延展后得到了M×(C×H×W)的權(quán)重矩陣。對(duì)于該批次任務(wù)下的輸入矩陣以行展開(kāi)的方式形成列向....


圖3行壓縮存儲(chǔ)格式Figure3CSRformat

圖3行壓縮存儲(chǔ)格式Figure3CSRformat

Figure3CSRformat圖3行壓縮存儲(chǔ)格式的行列指針。相比降維方式,直接稀疏卷積更適合在GPU上實(shí)現(xiàn)SCNN。3設(shè)計(jì)與實(shí)現(xiàn)本節(jié)介紹本文所提方法的具體實(shí)現(xiàn)和優(yōu)化。由于權(quán)重刪減后SCNN產(chǎn)生了大量稀疏數(shù)據(jù)結(jié)構(gòu),而傳統(tǒng)的降維方式并不能保證稀疏矩陣卷積的計(jì)算性能,本文采用全新的直....


圖4權(quán)重延展Figure4Weightstretched

圖4權(quán)重延展Figure4Weightstretched

的降維方式并不能保證稀疏矩陣卷積的計(jì)算性能,本文采用全新的直接稀疏卷積來(lái)替代降維方式,彌補(bǔ)性能損失。除此以外,GPU的體系結(jié)構(gòu)特征需要在實(shí)現(xiàn)過(guò)程中對(duì)線程映射、任務(wù)分配以及內(nèi)存管理進(jìn)行更多的考慮和優(yōu)化。3.1概述直接稀疏卷積的實(shí)現(xiàn)主要由兩部分組成:(1)數(shù)據(jù)預(yù)處理,主要完成對(duì)卷積核....



本文編號(hào):3982862

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/kejilunwen/zidonghuakongzhilunwen/3982862.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bbfd4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
伊人久久大香线蕉AV仙人| 国产精品久久久福利| 中文字幕精品一二三四五六七八| 日韩免费黄片| 久久无码高潮喷水抽搐| 亚洲精品无码午夜福利中文字幕 | 亚洲国产精品久久久久制服| 91久久人澡人人添人人爽欧美| 国产一区二区三区四区五区| 精品国产精品人成电影| 国产三级久久精品三级| 免费人成视频X8X8日本| 老熟女chese老熟女| 夜色av| 国产激情综合| 精品一区二区三区| 精品成在人线AV无码免费看| 伊人久久大香线蕉亚洲五月天| 桑日县| 超碰97在线免费观看| 欧美白嫩嫩hd4kav| 亚洲成在人线AV| 麻豆精产国品一二三产区区别免费 | 国产传媒国色天香| 亚洲国产成人aV毛片大全a| 无码人妻精一区二区三区| 久久97人人超人人超碰超国产| 亚洲综合日韩| 国语自产偷拍精品视频偷拍图片| 国产l精品国产亚洲区| 亚洲日韩精品无码专区网址| 97久久天天综合色天天综合色hd | 日日摸夜夜添AA夜夜添高潮出水| 国产精品久久久久久亚洲av| 先锋资源男人站| 久久电影院| 亚洲欧洲一区二区三区网久久 | 无码a级毛片日韩精品| 国产午夜福利在线播放| 久久精品亚洲一区二区| 伊人干|