基于圖像拼接的助視算法研究和軟件設計
發(fā)布時間:2020-05-17 13:00
【摘要】:電子助視系統(tǒng)是一種運用實時圖像處理技術來提高低視力患者閱讀能力的儀器。由于傳統(tǒng)助視器功能單一,且采用單攝像頭采集圖像,采集視角較小,圖像分辨率較低。在使用時只有移動助視設備或者目標書籍才能閱讀完整篇章,用戶體驗不佳。針對上述問題,本文首先采用雙攝像頭采集圖像并進行拼接,可獲得廣視角、高分辨率的圖像。然后對拼接后的圖像使用布局分析,以分割文檔圖像中不同段落的信息。最后對分割后的圖像采用OCR識別,實現(xiàn)字符無失真放大和變色的功能。主要工作內容如下:(1)基于圖像拼接的助視系統(tǒng)的整體設計。對不同的圖像拼接算法、布局分析算法、OCR算法進行對比,確定算法的設計需求,確定本系統(tǒng)開發(fā)的軟硬件環(huán)境。(2)提出了適用于助視系統(tǒng)的文檔圖像拼接算法。在圖像配準步驟,提出了針對文檔圖像的區(qū)域特征描述方法,提取單個文字區(qū)域作為特征區(qū)域,其質心作為特征點,通過描述特征區(qū)域的紋理信息完成特征點的描述,提高了特征匹配效率。在圖像融合步驟,采用了利用文檔圖像字符間隙的最優(yōu)拼接縫搜索算法,消除了拼接鬼影。構建多尺度的圖像金字塔,使用多分辨率融合算法,抑制了融合圖像的曝光差異。(3)研究了版面分析算法和OCR算法的原理。針對算法應用到助視系統(tǒng)存在的問題,提出了復雜文本的分割優(yōu)化策略,并且使用了置信度對版面分析和OCR識別的結果進行分析,剔除錯誤識別,提高了識別的準確率。此外,介紹了兩種訓練數(shù)據(jù)制作方法,三種訓練模式,可以適應于不同情況的模型訓練。(4)設計了基于Qt的助視GUI軟件。該軟件實現(xiàn)了視頻的拼接功能,對不同分辨率的拼接性能進行測試。結果表明該軟件能夠滿足實時的需求。同時,該軟件實現(xiàn)了對單字符分割、行布局分割以及段布局分割的功能。實現(xiàn)了針對不同分割模式的OCR識別功能。實現(xiàn)了對識別結果進行字符的無失真放大和變色功能。
【圖文】:
本文章節(jié)安排示意圖
圖 2-1 算法流程圖軟件設計方面,本文設計的助視軟件主要適用于低視力人群的閱讀。軟件功電子助視系統(tǒng)的放縮、變色和存儲等基礎功能。針對多攝像頭拼接的方案,,局分析、字符識別等功能。整個過程包含了大量的圖像處理算法,且該軟件平臺上實現(xiàn),因此對嵌入式平臺的性能和軟件的性能要求較高。像拼接算法設計像拼接的方法很多,一般包括圖像配準和圖像融合兩個步驟。圖像配準是確的相對關系,目的是為了獲取在同一坐標系下的變換關系的單應矩陣。圖像定圖像融合的效果,而現(xiàn)有精度較高的配準算法的計算量一般較大,因此圖發(fā)展主要取決于算法效率的提高。圖像融合是將配準后的圖像融合為一種圖
【學位授予單位】:浙江工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP391.41;TH77
本文編號:2668590
【圖文】:
本文章節(jié)安排示意圖
圖 2-1 算法流程圖軟件設計方面,本文設計的助視軟件主要適用于低視力人群的閱讀。軟件功電子助視系統(tǒng)的放縮、變色和存儲等基礎功能。針對多攝像頭拼接的方案,,局分析、字符識別等功能。整個過程包含了大量的圖像處理算法,且該軟件平臺上實現(xiàn),因此對嵌入式平臺的性能和軟件的性能要求較高。像拼接算法設計像拼接的方法很多,一般包括圖像配準和圖像融合兩個步驟。圖像配準是確的相對關系,目的是為了獲取在同一坐標系下的變換關系的單應矩陣。圖像定圖像融合的效果,而現(xiàn)有精度較高的配準算法的計算量一般較大,因此圖發(fā)展主要取決于算法效率的提高。圖像融合是將配準后的圖像融合為一種圖
【學位授予單位】:浙江工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP391.41;TH77
【參考文獻】
相關期刊論文 前10條
1 金繁;崔培雷;;嵌入式Qt中信號與槽機制的研究[J];電子設計工程;2014年24期
2 李亮;顧國華;錢惟賢;陳錢;任建樂;;基于特征點和泊松融合的紅外序列圖像拼接[J];紅外與激光工程;2013年09期
3 張建光;李永霞;;基于區(qū)域的圖像分割[J];科技資訊;2011年26期
4 楊海鋼;孫嘉斌;王慰;;FPGA器件設計技術發(fā)展綜述[J];電子與信息學報;2010年03期
5 陳方昕;;基于區(qū)域生長法的圖像分割技術[J];科技信息(科學教研);2008年15期
6 王蘊平;;講述電子助視器的視界[J];中國殘疾人;2007年07期
7 單欣;王耀明;董建萍;;基于RANSAC算法的基本矩陣估計的匹配方法[J];上海電機學院學報;2006年04期
8 陳光;助視器的發(fā)展[J];中國殘疾人;2004年06期
9 趙向陽,杜利民;一種全自動穩(wěn)健的圖像拼接融合算法[J];中國圖象圖形學報;2004年04期
10 陳明;丁曉青;吳佑壽;;多層次可信度指導下的自底向上的版面分析算法[J];模式識別與人工智能;2003年02期
本文編號:2668590
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/sousuoyinqinglunwen/2668590.html
最近更新
教材專著