瀏覽單個文章
MIGHTY MOUSE
Junior Member
 
MIGHTY MOUSE的大頭照
 

加入日期: Oct 2000
文章: 850
OCR調教方法

想要提高OCR的辨識率並不難,

先了解掃瞄器的工作.
對掃瞄器而言,不論放在平台上的是什麼稿件,都是.
沒錯,即使是文字稿件,對掃瞄器而言,也是.
OCR的工作便是將這些圖中,一個一個跟文字長的相像的辨識成文字

1.解析度不要高,約150dpi就夠了.
為什麼呢?不是解析度越高越好嗎?
沒錯,解析度越高,越清楚.可是,掃得太清楚,連稿件上的印刷雜點,墨跡都掃出來了,
那只會增加OCR的便是困難度.所以,150dpi就夠了.

2.要採用模式掃描.
上一點有提到,掃瞄文字稿作辨識用,只要150dpi就夠了.有清楚就好.
所以,掃描模式也要達到清楚即可.用2位元的色彩,非黑即白,就夠了.
試想,你要做的工作,是將文字辨識出來,那麼,文字式什麼顏色,自然不是重點,不是嗎?

3.調整對比度.
文字稿件掃瞄好後,先放大稿件來調整對比度.
將對比度調整到文字的線條細細的但是不斷線的程度即可.

4.稿件放在平台上要對準基準點.
也就是說,稿件要放好,不要歪歪斜斜的.
字寫的歪歪的,人類肉眼都不容易辨識了,更何況掃出來歪歪的文字,軟體是不認識那些歪歪的文字的.

以上數點活用後,不論稿件來源是報紙還是雜誌,都可得心應手.
有使用掃描器的朋友,試看看上述幾點,小弟保證你的辨識率大幅提升.

PS:OCR=OPTICAL CHARACTER RECONITION.光學物件辨識.
第三個英文字忘記拼法了,若有錯,請不吝指正.
舊 2004-02-07, 03:33 AM #6
回應時引用此文章
MIGHTY MOUSE離線中