国产91免费_国产精品电影一区_日本s色大片在线观看_中文在线免费看视频

您現在的位置: 通信界 >> 接入系統 >> 技術正文  
 
基于SoPC的嵌入式文字識別系統設計[圖]
[ 通信界 / 《電子技術應用》2011年第9期 / m.6611o.com / 2011/12/6 11:10:45 ]
 

摘要:設計了一種基于SoPC的嵌入式文字識別系統。在FPGA平臺下,基于SoPC框架搭建軟硬件協同系統,設計硬件電路完成文字圖像的采集和預處理,嵌入Linux系統,使用其下的識別引擎完成文字圖像的識別。采用Altera公司的SoPC builder構建系統框架,Quartus II完成硬件電路的設計,在宿主機Linux環境下完成了軟件部分的交叉編譯并嵌入到FPGA平臺。整體設計在DE2-70開發板上完成了系統驗證。

計算機文字識別也被稱為光學文字識別[1]OCR(Optical Character Recognition),在智能計算機和辦公自動化領域有著極其重要的應用。文字識別的基本原理是通過諸如照相機、掃描儀等圖像輸入設備獲取文字圖片,經過圖像處理后使用光學模式判別等算法分析文字圖片,最后將判斷出的文字編碼儲存起來從而完成文字識別。

文字識別設備對識別速度要求較高,因此圖像采集和預處理的速度十分關鍵。同時對識別率要求高,識別字體種類多,因此選用帶學習功能的軟件引擎非常重要。另外系統需要交互界面和大量外圍設備的驅動,因此需要引入操作系統以方便設計開發。

1 SoPC系統設計

系統功能設計的整體方案如圖1所示。各部分功能介紹如下:

基于SoPC的嵌入式文字識別系統設計

(1)圖像采集功能,通過外接的攝像頭模塊完成圖像的采集;
     (2)由硬件模塊完成文字圖像預處理功能,能夠對采集的文字圖像進行傾斜糾正[2]、圖像分割[3]、二值化[4]等處理,保證系統的性能和速度,以提高后續的文字識別率;
     (3)文字圖像識別功能,能夠將文字圖像中的文字識別出來并保存在TXT中;
     (4)識別結果的存儲和發送功能,能夠將識別結果文件存入SD卡或U盤中,或者通過網絡發送給上位機;
     (5)交互界面功能:能夠通過LCD模塊或者外接的VGA設備等輸出設備以及鍵盤、觸摸屏或者鼠標等輸入設備與使用者交互。

整個系統由一塊FPGA和攝像采集、輸入輸出等外圍設備組成。FPGA硬件模塊完成攝像采集控制和圖像預處理,CPU作為系統主控控制外設和硬件模塊的數據流。文字識別模塊和外圍設備驅動在Linux平臺上進行開發或移植。

本文采用Altera Cyclone2系列的FPGA,通過Altera提供的SoPC技術,可以將Nios Ⅱ軟核處理器和外圍設備接口IP通過Avalon總線連接起來,并集成在一塊FPGA上。圖2是系統的SoPC設計。

基于SoPC的嵌入式文字識別系統設計

2 系統硬件設計

文字識別硬件設計主要包括文字圖像的采集控制和文字圖像的預處理。文字圖像的預處理又分為邊緣檢測、傾斜糾正、文字區域提取、二值化。硬件模塊總體設計圖如圖3所示。

基于SoPC的嵌入式文字識別系統設計

對于待識別的文字圖像,影響文字識別準確率的不僅僅是后端引擎的性能,更重要的是文字圖像的質量和實際使用的文字圖像,除了光照不均勻且有傾斜外,還會有不少干擾信息。因此,本設計選取傾斜糾正、文字圖像分割、二值化等預處理方法來減少干擾因素,保證后續文字識別的質量。本設計的處理方法概括如下:

(1)圖像邊緣就是圖像中灰度發生急劇變化的地方。本設計采用一階導數的Sobel算子的邊緣檢測算法可以滿足設計的需要。本設計中將最后得到的梯度值簡化為水平方向梯度絕對值和垂直方向梯度絕對值之和。求出梯度后采用基本全局門限:當某像素點(x,y)的梯度值大于或等于設定的門限T時,規定該點的像素值為1,反之則為0。

(2)文字圖像傾斜糾正包括傾斜角計算和圖像旋轉,即將拍攝中獲取的傾斜圖像根據傾斜角度進行旋轉,最后得到校正后的圖像。本設計采用基于Hough的變換來計算傾斜角;驹硎峭ㄟ^找出圖像中通過最多點的直線,即為圖像的傾斜角。變換中,將二維圖像中的點通過極坐標系表示,而平面坐標系中一條直線上的所有點對應的極坐標系曲線交于極坐標系中唯一一點(ρ,θ),因此,只需要尋找極坐標系中最大值即可。

(3)文字圖像的分割可以提取文字信息區域以減少背景等干擾,同時,由于圖像區域的減少,對于光照不均勻也有一定的改善。本設計根據文字圖像的具體特點設計分割方法,首先將經過傾斜糾正的文字圖像通過邊緣檢測算法得到邊緣檢測圖片;后通過逐行和逐列掃描確定行和列的閾值;接著對所有符合閾值的區域進行分析,相隔較近的區域進行聯通,從而確定最終的分割區域。最后根據分割區域對原圖進行圖像分割。

(4)經過傾斜糾正和圖像分割后得到的文字圖像仍有光照不均勻和噪聲的影響,因此需要進行二值化處理。對圖像進行二值化不僅能提高文字識別的精度,對后端引擎的識別速度也有不少的幫助?紤]到實際拍攝的圖片光照不均勻的程度較高,使用全局或者混合二值化的效果都不理想,且考慮到硬件實現等因素,本設計采取局部閾值二值化。

3 系統軟件設計

本設計軟件部分基于嵌入式Linux。首先在NiosⅡ處理器中植入嵌入式Linux;然后在Linux內核中配置外圍設備驅動并加入一些自定義的設備驅動;最后基于Linux移植或者開發交互界面、文字識別引擎等。另外,還需要移植bootloader,系統啟動后,bootloader將Linux內核搬到SDRAM中運行,從而實現系統開機自啟動的功能。

整體流程是:首先將bootloader和Linux內核下載進入Flash,同時設定復位地址為Flash中內核bootloader的入口地址。系統啟動時先啟動bootloader,初始化外圍設備,并通過串口打印輸出信息,同時將Linux內核搬運到SDRAM進行解壓。Linux內核解壓完成后內核啟動。只是Linux初始化所有的外圍硬件設備,啟動nano-X圖形接口和nano-wm窗口管理器和基于FLTK的交互界面。交互界面上是各種的按鈕選擇,包括圖片瀏覽、圖像采集、文本瀏覽編輯、網絡連接及文字識別等應用程序的按鈕。當按鍵選擇各種功能后會進入相應的功能模塊。當程序運行完成后通過選擇返回按鈕再次進入到交互界面的按鍵選擇部分。

4 系統功能驗證

將硬件信息配置進入FPGA,同時通過Flashprogrammer將bootloader和Linux下載到Flash。Linux內核啟動完成后,調用交互界面程序,系統可以通過鼠標鍵盤進行輸入操作,通過VGA輸出交互界面。此外,可通過串口對系統進行調試并看到打印出來的系統信息

本設計通過NiosⅡ控制圖像采集模塊,通過DE2-70開發板上的開關可以調節曝光,采集回的圖像通過NiosⅡ寫入SD卡,用來驗證圖像采集模塊的功能。開發板和攝像頭通過支架固定在文字識別區域上方。實際采集的效果滿足應用需求。

由于受DE2-70開發板上SDRAM大小的限制,本設計Tesseract引擎的數據文件不能太大。因此先使用默認引擎進行英文的識別,然后用拍攝的幾幅文字圖像對引擎進行訓練;再使用經過訓練的引擎對圖像進行識別。最終的圖像識別結果存入SD卡中。文字識別的效果圖如圖4所示。

基于SoPC的嵌入式文字識別系統設計

圖4(a)是默認引擎的識別效果圖,圖4(b)是經過訓練的引擎識別效果圖。通過對比可以看出,未經訓練的識別效果錯誤率高達18.59%,而經過訓練的引擎識別效果明顯好于默認引擎識別的結果,錯誤率僅為7.7%。但是在一些圖像偽影和不連續處,兩個引擎都出現了不同程度的錯誤。其原因在于目前的文字識別理論還尚未成熟,難以達到百分之百的文字識別精確度。

本文通過硬件電路完成文字圖像采集和文字圖像預處理,嵌入式軟件完成文字識別,實現了一種基于SoPC的嵌入式文字識別系統。此設計中構建了完整的SoPC系統,嵌入了Linux操作系統,通過軟硬件協同充分發揮各自的優點,達到了較好的文字識別效果。

參考文獻

[1] 盛蹇,劉偉.計算機文字識別的發展及應用[J].科技信息,2008(13).
     [2] 王希常,劉江.一種掃描文檔圖像的快速糾偏算法設計[A].2010 Third International Conference on Education  Technology and Training,2010.
     [3] 瞿燕慧.圖像分割常用算法優缺點探析[J].科教新報(教育科研),2010(3).
     [4] GUPATAMR,JACOBSONMR,GARCIAEK.舊式文本的OCR二值化和圖像預處理研究[J].章晟(譯).圖像識別與自動化,2007(1).

 

作者:《電子技術應用》2011年第9期 合作媒體:《電子技術應用》2011年第9期 編輯:顧北

 

 

 
 熱點技術
普通技術 “5G”,真的來了!牛在哪里?
普通技術 5G,是偽命題嗎?
普通技術 云視頻會議關鍵技術淺析
普通技術 運營商語音能力開放集中管理方案分析
普通技術 5G網絡商用需要“無憂”心
普通技術 面向5G應運而生的邊緣計算
普通技術 簡析5G時代四大關鍵趨勢
普通技術 國家網信辦就《數據安全管理辦法》公開征求意見
普通技術 《車聯網(智能網聯汽車)直連通信使用5905-5925MHz頻段管理規定(
普通技術 中興通訊混合云解決方案,滿足5G多元業務需求
普通技術 大規模MIMO將帶來更多無線信道,但也使無線信道易受攻擊
普通技術 蜂窩車聯網的標準及關鍵技術及網絡架構的研究
普通技術 4G與5G融合組網及互操作技術研究
普通技術 5G中CU-DU架構、設備實現及應用探討
普通技術 無源光網絡承載5G前傳信號可行性的研究概述
普通技術 面向5G中傳和回傳網絡承載解決方案
普通技術 數據中心布線系統可靠性探討
普通技術 家庭互聯網終端價值研究
普通技術 鎏信科技CEO劉舟:從連接層構建IoT云生態,聚焦CMP是關鍵
普通技術 SCEF引入需求分析及部署應用
  版權與免責聲明: ① 凡本網注明“合作媒體:通信界”的所有作品,版權均屬于通信界,未經本網授權不得轉載、摘編或利用其它方式使用。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:通信界”。違反上述聲明者,本網將追究其相關法律責任。 ② 凡本網注明“合作媒體:XXX(非通信界)”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。 ③ 如因作品內容、版權和其它問題需要同本網聯系的,請在一月內進行。
通信視界
華為余承東:Mate30總體銷量將會超過兩千萬部
趙隨意:媒體融合需積極求變
普通對話 苗圩:建設新一代信息基礎設施 加快制造業數字
普通對話 華為余承東:Mate30總體銷量將會超過兩千萬部
普通對話 趙隨意:媒體融合需積極求變
普通對話 韋樂平:5G給光纖、光模塊、WDM光器件帶來新機
普通對話 安筱鵬:工業互聯網——通向知識分工2.0之路
普通對話 庫克:蘋果不是壟斷者
普通對話 華為何剛:挑戰越大,成就越大
普通對話 華為董事長梁華:盡管遇到外部壓力,5G在商業
普通對話 網易董事局主席丁磊:中國正在引領全球消費趨
普通對話 李彥宏:無人乘用車時代即將到來 智能交通前景
普通對話 中國聯通研究院院長張云勇:雙輪驅動下,工業
普通對話 “段子手”楊元慶:人工智能金句頻出,他能否
普通對話 高通任命克里斯蒂安諾·阿蒙為公司總裁
普通對話 保利威視謝曉昉:深耕視頻技術 助力在線教育
普通對話 九州云副總裁李開:幫助客戶構建自己的云平臺
通信前瞻
楊元慶:中國制造高質量發展的未來是智能制造
對話亞信科技CTO歐陽曄博士:甘為橋梁,攜"電
普通對話 楊元慶:中國制造高質量發展的未來是智能制造
普通對話 對話亞信科技CTO歐陽曄博士:甘為橋梁,攜"電
普通對話 對話倪光南:“中國芯”突圍要發揮綜合優勢
普通對話 黃宇紅:5G給運營商帶來新價值
普通對話 雷軍:小米所有OLED屏幕手機均已支持息屏顯示
普通對話 馬云:我挑戰失敗心服口服,他們才是雙11背后
普通對話 2018年大數據產業發展試點示范項目名單出爐 2
普通對話 陳志剛:提速又降費,中國移動的兩面精彩
普通對話 專訪華為終端何剛:第三代nova已成為爭奪全球
普通對話 中國普天陶雄強:物聯網等新經濟是最大機遇
普通對話 人人車李。航衲臧l力金融 拓展汽車后市場
普通對話 華為萬飚:三代出貴族,PC產品已走在正確道路
普通對話 共享退潮單車入冬 智享單車卻走向盈利
普通對話 Achronix發布新品單元塊 推動eFPGA升級
普通對話 金柚網COO邱燕:天吳系統2.0真正形成了社保管