![]() |
PCDVD數位科技討論區
(https://www.pcdvd.com.tw/index.php)
- 七嘴八舌異言堂
(https://www.pcdvd.com.tw/forumdisplay.php?f=12)
- - 將書籍數位化的軟硬體選擇?
(https://www.pcdvd.com.tw/showthread.php?t=943694)
|
|---|
我有認識一位長者,
需要將早期的信件轉成電子檔, 但信紙每張大小都不一樣, 用掃瞄的適合嗎? 目前想到是用照像的, 不知道怎麼照比較快, 因為信件高達數千封以上, 可否提供一些意見? 電子化後最大的問題是要怎麼辯識信裡面的文字, 全部是手寫的, 目前想到的是用語音辦識,用唸的比較快... |
引用:
大小不一樣但應該仍然可以分出幾種 先把相同大小的分類 再去買自動進紙的機種會比較方便 或是用一般的掃描機, 通常都會有自動偵測紙張大小的功能 |
有些人很在意容量問題而做OCR
我的建議是, 除非你的文件是海量, 不然直接存JPG就好 以一本書200頁, 一頁500KB來算, 一本書也才100MB 1TB可以存一萬本, 更何況一頁500KB是高估的狀況, 所謂的海量文件, 個人定義是超過千萬頁以上 :p 省下OCR和更正的時間心力吧~ 那些時間拿來賺錢買硬碟, 少說可以買上好幾TB :laugh: 另外說到時間, 要做文件電子化, 就不要考慮沒有自動進紙功能的掃描器了 掃描器一頁3秒很快, 但顧在旁邊翻頁的時間絕對不只一頁三秒 假設真的是神手, 拿書、翻頁、放回去、按鈕可以三秒內完成好了, 200頁就整整有600秒也就是10分鐘在做這動作...... 零邊距什麼的真的很雞肋, 因為一般來說做電子化都會OVERSCAN再裁回來, 軟體辨識也很準了, 沒什麼邊距問題 1.別做OCR 2.自動進紙 3.多買硬碟 :laugh: |
引用:
那種機器3秒一頁是不可能的, 以目前市面上最貴的機種 opticbook 4800來說 官方數據3.6秒/頁, 是掃描的時間,不含傳到電腦和手工的的時間 基本上一分鐘6-8頁算快了,3-4頁也算正常 掃一小時200頁算很多了,除非你的書真的是百年古籍, 別浪費錢和時間。 |
有些學術單位使用的影印機都有掃描-送信功能
直接掃成PDF檔送出到信箱 至少中研院的文科各所及其圖書館都有此功能,很方便,速度也快,亦可到600DPI |
如果手頭上已經有不錯的相機,搞個翻拍架來用拍的最快啦。
喀擦一下就是一頁,書本跨頁的陰影可以用打光技巧消除,又不用裁書,多好啊。 :D |
影印也許是最快方法,但我想你可能是想做成電子書那種格式.:laugh:
如果你肯拆書,掃描器不是太大問題,問體是辨識軟體的辨識成功率跟自動校正. 繁體OCR我建議是放棄,根本不用考慮,一般人手打也許都還比較快. 英文的話沒什問題,錯誤非常少,幾乎無視於存在. 簡體的話沒試過,不過直接到對岸的網站找現成的可能較快. |
|
"書如果可以拆開scan應該也行的"問題就是在這邊!拆開....
引用:
|
引用:
BOOK SAVER 像這種用照的 中間不會有圖形扭曲的問題嗎? :confused: |
| 所有的時間均為GMT +8。 現在的時間是01:14 PM. |
vBulletin Version 3.0.1
powered_by_vbulletin 2025。