瀏覽單個文章
schnaufer
*停權中*
 
schnaufer的大頭照
 

加入日期: Feb 2001
文章: 650
引用:
Originally posted by 阿明
......
可以請問一下你是做了哪些調教辨識率怎會如此高!
謝謝


  因為之前蠻常掃描書本,所以累積了小小的經驗,就在此獻醜一下吧!。

  第一個當然是要文件要放正,稍微偏斜雖然可以用角度校正,但是浪費時間,對於字體的辨識也不太有利﹔第二則是調整明亮與對比,許多預設設定通常都過黑,所以掃出來的字體常常會有些黑點,因此會影響字型的辨識,當然也不能調太淺,太淺的話字體就會不太完整(這裡只能靠經驗,多試幾次看看,千萬不要用預設值。)﹔第三是 OCR 之前先用繪圖軟體編修,把掃描出來的黑邊陰影等去除,順便也刪除一些不想跑 OCR 的物件,不過若在 scan 之前先做好規劃,幾乎可以不要處理黑邊的問題,不過書本中間的黑影通常很難避免,適當處理就不會得出亂碼。

  通常我都會把以上的動作弄成標準化,把幾十個檔案編輯完後,就把全部檔案拿來跑 OCR,這需要一段時間,剩下的就只是校對了。

  以我的狀況來說,以上的做法比打字快上許多,所以我還是會選擇用 OCR 來處理大量文字的輸入。也許其他人親自輸入會比較快,那就不適宜用 OCR 了!
舊 2003-01-10, 08:28 PM #6
回應時引用此文章
schnaufer離線中