久久九九国产无码高清_人人做人人澡人人人爽_日本一区二区三区中文字幕_日韩无码性爱免费

基于圖像的OMR技術(shù)的實(shí)現(xiàn)

時間:2024-07-22 12:01:21 理工畢業(yè)論文 我要投稿
  • 相關(guān)推薦

基于圖像的OMR技術(shù)的實(shí)現(xiàn)

摘要:在分析OMR與OCR的應(yīng)用特點(diǎn)后,提出了基于圖像的OMR方式。詳細(xì)討論了該方法的硬件設(shè)計和工作原理,并在軟件處理方面著重介紹了傾斜校正和圖像分割。它具有對紙張質(zhì)量要求低和識別準(zhǔn)確度高等特點(diǎn)。

目前,許多文檔是以紙質(zhì)文檔的形式存在,例如銀行票據(jù)、稅務(wù)報表、標(biāo)準(zhǔn)化考試中的機(jī)讀卡、人口普查表、彩標(biāo)投注單、選票、定貨單等。而紙質(zhì)文檔不便于保存、檢索、統(tǒng)計和修改。將這些信息錄入計算機(jī)是一件非常繁瑣的事情。長期以來人們通過鍵盤手工輸入,不但費(fèi)時費(fèi)力且容易出錯。在實(shí)時性要求較高的場合(如選舉中的統(tǒng)計選票)自動、快速、準(zhǔn)確地處理文檔顯得尤為重要。因此,對這些文檔進(jìn)行計算機(jī)自動錄入具有重要的實(shí)現(xiàn)意義。

計算機(jī)自動錄入是解決這個同瓶頸的關(guān)鍵所在。其中,光學(xué)字符識別OCR(Optical Character Recognition)和光學(xué)標(biāo)記識別OMR(Optical Mark Recognition)是解決信號自動錄入的有效方法。它們利用光學(xué)方法將信息錄入到計算機(jī)并進(jìn)行識別處理,能極大地提高數(shù)據(jù)信息的采集速度,便于計算機(jī)存儲、管理與檢索。

1 OCR與OMR

(1)OCR的工作原理

OCR首先將要識別的文字和圖像掃描進(jìn)計算機(jī),然后進(jìn)行圖像的預(yù)處理,再抽取字符特片進(jìn)行識別,轉(zhuǎn)變?yōu)橛嬎銠C(jī)能夠識別的字符信息。圖像預(yù)處理包括去除噪聲、歪斜校畫龍點(diǎn)睛、圖像分割、平滑及規(guī)范化等。其中圖像分割是一個重要的步驟,它的作用是將要識別的單個字符的圖像找到并分割出來。OCR技術(shù)主要應(yīng)用于文字圖像識別及處理,例如用于印刷體和限制手寫體字符的識別。OCR技術(shù)已成為大規(guī)模數(shù)據(jù)錄入的首選方案,它將隨著計算機(jī)技術(shù)的發(fā)展而更加成熟。

(2)OMR的工作原理

OMR識別“涂點(diǎn)”上有無標(biāo)記兩種狀態(tài)。“涂點(diǎn)”就是信息卡上可以涂寫標(biāo)記的地址!巴奎c(diǎn)”所代表的含義可以事先定義,可以代表一個阿拉伯?dāng)?shù)字,也可以表示一個英文字母或符號。OMR技術(shù)快速簡單,識別率高且成本低,廣泛應(yīng)用于標(biāo)準(zhǔn)化考慮自動閱卷、各類調(diào)查問卷的統(tǒng)計、選舉結(jié)果的統(tǒng)計等,是自動識別領(lǐng)域中應(yīng)用較多的一種方法。

2 基于圖像的OMR技術(shù)

目前OMR一般采用光電對管閱讀技術(shù)。識別用的器件是半導(dǎo)體發(fā)光管及光敏管。發(fā)光管是光源器件,由它發(fā)出的光照射到“涂點(diǎn)”上。光敏管是接收器件,接收來自“涂點(diǎn)”位置的反射光。因?yàn)橥坑袠?biāo)記的地方反光弱,未涂標(biāo)記的地方反光強(qiáng),所以光敏管接收到的光信號強(qiáng)度不同。不同強(qiáng)度的光信號可以代表有無標(biāo)記兩種狀態(tài)。將“涂點(diǎn)”位置處的發(fā)光管和光敏這組成一只電眼,可識別一個涂點(diǎn)。若干個電眼排列起來組成光電頭可完成對一排涂點(diǎn)的識別。

該方法實(shí)現(xiàn)應(yīng)用中有如下限制:信息卡上的“涂點(diǎn)”要與電眼完全對齊,即信息卡在錄入時不能傾斜;信息卡不能折皺;紙張質(zhì)量、印刷技術(shù)要求高;填寫標(biāo)記要規(guī)范,否則就要影響識別結(jié)果。實(shí)際應(yīng)用中,信息卡在錄入時由于走紙機(jī)構(gòu)機(jī)械誤差而略有傾斜,會造成識別出錯。

OCR由于采用了圖像處理技術(shù),信息卡在錄入時的傾斜能自動校正,保證錄入的高精度,也能處理略有折皺的信息卡。因此,OCR對所用紙張的質(zhì)量、印刷技術(shù)要求不高,降低了運(yùn)行成本。同時可以保留填寫的原始圖像備查,進(jìn)行復(fù)核或重新識別。

在借鑒OCR優(yōu)點(diǎn)的基礎(chǔ)上,筆者在課題《彩標(biāo)閱讀及識別系統(tǒng)》中采用了基于圖像的OMR技術(shù)。所謂基于圖像的OMR技術(shù),就是將信息卡經(jīng)光電變換,形成二值化圖像;再經(jīng)歪斜校正、圖像分割,對分割出的小塊圖像(含“涂點(diǎn)”)中的黑點(diǎn)數(shù)進(jìn)行計數(shù)。若大于某個值,就認(rèn)為有標(biāo)記,否則就沒有標(biāo)記,從而完成了標(biāo)記識別。相對OCR而言,它省去了最耗時的字符特征抽取步驟。

3 硬件組成

本系統(tǒng)框圖如圖1所示。

(1)圖像傳感器

采用國產(chǎn)的CIS(Contact Image Sensor)圖像傳感器,其光學(xué)分辨率比CCD略低,但是其驅(qū)動電路、光學(xué)系統(tǒng)和機(jī)械結(jié)構(gòu)卻比CCD簡單。光學(xué)系統(tǒng)中采用特殊光源實(shí)現(xiàn)光學(xué)濾波,消除或減輕了信息卡背景信息對分割、識別的影響。工作時,由CPLD(Complex Programable Logic Device)產(chǎn)生一個周期性的同步脈沖SYN引導(dǎo)每次掃描,時鐘信號CLK在移動寄存器的作用下,對CIS內(nèi)的像元依次進(jìn)行掃描,像元上的光電信號串行輸出。

(2)走紙控制

輸入的信息卡通過光學(xué)系統(tǒng)成像在圖像傳感器的光敏面上,在CPLD器件產(chǎn)生的掃描信號的驅(qū)動下,圖像傳感器對信息卡進(jìn)行橫向自掃描;步進(jìn)電機(jī)驅(qū)動輸紙機(jī)構(gòu)使信息卡縱向運(yùn)行,從而實(shí)現(xiàn)了信息卡的二維掃描。

(3)模擬信號處理

模擬信號處理要考慮信息卡顏色的深淺、字跡的輕重和光強(qiáng)均勻度的變化等引起的脈沖幅度的變化。在光電變換中,對信號幅值影響較大的是:光束照射在光敏面上,光強(qiáng)的不均勻性及波動影響表現(xiàn)為白電平浮動對比度的變化也會引起信號幅值的較大起伏。處理的好壞直接影響到采集圖像的質(zhì)量。其過程為:CIS圖像傳感器攝取的原始圖像信號,經(jīng)放大、采樣保持及濾波、對消、浮動值及二值化等一系列處理,消除或減輕了信息卡背景明暗變化、光源變化、開關(guān)噪聲、高低頻干擾等對系統(tǒng)的影響,獲得高質(zhì)量的二值化信號。

(4)數(shù)字信號處理

采用A、B兩塊大容量的SRAM輪流工作在讀或?qū)憼顟B(tài)。合并二值化的信號,同時為了加快數(shù)據(jù)采集的速度,每次將16位的串行信號轉(zhuǎn)換為2個字節(jié)的并行數(shù)據(jù)。在標(biāo)志寄存器的控制下,將信號暫時寫入A中,同時計算機(jī)通過16位ISA總線從B中取數(shù)據(jù)。在下一周期,二值化信號寫入B中,計算機(jī)通過16位ISA總線從A中取數(shù)據(jù)。這樣就保證數(shù)據(jù)傳輸?shù)母咝浴?/P>

(5)邏輯控制

整個系統(tǒng)的邏輯控制采用La

【基于圖像的OMR技術(shù)的實(shí)現(xiàn)】相關(guān)文章:

基于GPRS網(wǎng)絡(luò)的圖像傳輸自適應(yīng)算法及實(shí)現(xiàn)03-07

基于顏色特征的藏毯圖像檢索研究與實(shí)現(xiàn)03-21

一種基于混沌和小波理論的圖像加密技術(shù)的實(shí)現(xiàn)03-07

基于內(nèi)容的模糊圖像檢索技術(shù)研究03-18

圖像拼接算法及實(shí)現(xiàn)03-03

基于HTML5技術(shù)的大壩安全監(jiān)測圖像繪制技術(shù)03-21

一種基于改進(jìn)自商圖像的人臉圖像光照補(bǔ)償算法及其實(shí)現(xiàn)11-22

基于COM技術(shù)的公式計算組件的開發(fā)與實(shí)現(xiàn)11-23

基于圖像處理技術(shù)的織物組織自動識別03-07