Major Member
|
經驗分享
SeanLin 大哥提供的這個解決方案確實省卻了許多字幕處理的困擾,真是讓人由衷感謝。小弟嘗試處理幾部電影的字幕後,覺得效果還不錯,有些心得和建議提供給各位版上的弟兄∼∼
目前小弟嘗試使用「丹青 5.0」來辨識掃瞄出來的字幕,發現最前面有些文字容易和註記用的 # 字號混在一起,造成辨識完的文件要組合時會發現少字幕,建議 SeanLin 大哥是不是可以把 # 字註記的設置和正文間的空白間距增大,讓 # 字標記不會被 OCR 軟體和正文混淆在一起。
以繁體中文的掃瞄狀況,丹青的表現不錯,但是錯誤仍然不少,小弟試過大陸發展的清華文通 OCR 9.0 的辨識率,比起丹青更好,但是清華文通的文字間的空格偵測就不太理想了,在字幕不上標點符號的情況下,以空格來表現停頓的語氣,是國內字幕製作常見的用法,但是清華文通會把所有的空格合併起來,校正的功能視窗也不如丹青來的人性,果然是有一好沒兩好.....。
處理完的 SRT 文件,通常都還是要校稿,我一般不會在 OCR 的視窗下做,因為常常點選個不好,前後變的亂七八糟,不知道大家在校稿上有沒有便利一點的方法.....
不知道版上的各位弟兄都用什麼樣的辨識軟體,辨識率如何?大家來討論一下吧!
|