瀏覽單個文章
angp
Major Member
 

加入日期: Dec 2001
文章: 108
引用:
Originally posted by briankuo


你是指由subrip的第一選項嗎? 英文字母就那幾個,比較快

簡體中文就會遇到轉成圖檔時丹青沒辦法很成功的辯識出來,

所以簡體中文只能慢慢key......


嗯,看樣子圖解仍不夠清楚,害大家白浪費許多時間,真是對不住..
其實這幾個步驟都是經過我幾天幾夜用不同的軟體及選項後才得出最後的結論,
其中關鍵的幾個地方,
1. 用SubRip輸出時,需要輸出成白底黑字無框的bmp檔.
2.丹青的辨識字集須設為簡體字集.其餘設為自動分析即可.
如果這兩點掌握的話,辦識可達90%以上.再讓它學習一些字之後,幾乎可到99%.
之前我提到每行的最後一個字會辦識錯誤的問題,經過這兩天的測試之後,我發現可能
是因為SubRip把bmp切得太邊邊了,以至於丹青無法辦識,這問題我己經想辦法在解決,
另外一個丹青無法一次批次辦識200張圖檔的問題,我發現可以用開啟舊檔的方式,一次
可開啟500張,分幾次開啟把所有的圖檔都讀入之後,再一次讓它自動辨識,這方法我已
經成功過,不過會發生系統資源不足的問題,即使把丹青關掉後都一樣,系統很多icon都
出不來,非得要重新開機不可

我已經認真在找ocr方面的東東來看了,不過以前沒修過影像處理,所以有點困難,真希
望能寫出一個專用的程式,這樣大家以後就不用這麼麻煩了..

對了,不知道有人知道vob的檔案結構嗎? 我想自己把字幕取出來,這樣大家用起來就可
以更方便些了...
舊 2002-03-23, 03:33 AM #15
回應時引用此文章
angp離線中