PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   七嘴八舌異言堂 (https://www.pcdvd.com.tw/forumdisplay.php?f=12)
-   -   將書籍數位化的軟硬體選擇? (https://www.pcdvd.com.tw/showthread.php?t=943694)

stingo 2011-10-01 08:47 PM

我有認識一位長者,
需要將早期的信件轉成電子檔,
但信紙每張大小都不一樣,
用掃瞄的適合嗎?
目前想到是用照像的,
不知道怎麼照比較快,
因為信件高達數千封以上,
可否提供一些意見?
電子化後最大的問題是要怎麼辯識信裡面的文字,
全部是手寫的,
目前想到的是用語音辦識,用唸的比較快...

oScARSh 2011-10-01 08:49 PM

引用:
作者stingo
我有認識一位長者,
需要將早期的信件轉成電子檔,
但信紙每張大小都不一樣,
用掃瞄的適合嗎?
目前想到是用照像的,
不知道怎麼照比較快,
因為信件高達數千封以上,
可否提供一些意見?
電子化後最大的問題是要怎麼辯識信裡面的文字,
全部是手寫的,
目前想到的是用語音辦識,用唸的比較快...

大小不一樣但應該仍然可以分出幾種
先把相同大小的分類
再去買自動進紙的機種會比較方便

或是用一般的掃描機, 通常都會有自動偵測紙張大小的功能

PM 2011-10-01 09:23 PM

有些人很在意容量問題而做OCR

我的建議是, 除非你的文件是海量, 不然直接存JPG就好
以一本書200頁, 一頁500KB來算, 一本書也才100MB
1TB可以存一萬本, 更何況一頁500KB是高估的狀況,

所謂的海量文件, 個人定義是超過千萬頁以上 :p
省下OCR和更正的時間心力吧~
那些時間拿來賺錢買硬碟, 少說可以買上好幾TB :laugh:

另外說到時間, 要做文件電子化, 就不要考慮沒有自動進紙功能的掃描器了
掃描器一頁3秒很快, 但顧在旁邊翻頁的時間絕對不只一頁三秒
假設真的是神手, 拿書、翻頁、放回去、按鈕可以三秒內完成好了,
200頁就整整有600秒也就是10分鐘在做這動作......

零邊距什麼的真的很雞肋, 因為一般來說做電子化都會OVERSCAN再裁回來,
軟體辨識也很準了, 沒什麼邊距問題

1.別做OCR
2.自動進紙
3.多買硬碟 :laugh:

牧羊少年 2011-10-01 09:46 PM

引用:
作者PM
有些人很在意容量問題而做OCR

我的建議是, 除非你的文件是海量, 不然直接存JPG就好
以一本書200頁, 一頁500KB來算, 一本書也才100MB
1TB可以存一萬本, 更何況一頁500KB是高估的狀況,

所謂的海量文件, 個人定義是超過千萬頁以上 :p
省下OCR和更正的時間心力吧~
那些時間拿來賺錢買硬碟, 少說可以買上好幾TB :laugh:

另外說到時間, 要做文件電子化, 就不要考慮沒有自動進紙功能的掃描器了
掃描器一頁3秒很快, 但顧在旁邊翻頁的時間絕對不只一頁三秒
假設真的是神手, 拿書、翻頁、放回去、按鈕可以三秒內完成好了,
200頁就整整有600秒也就是10分鐘在做這動作......

零邊距什麼的真的很雞肋, 因為一般來說做電子化都會OVERSCAN再裁回來,
軟體辨識也很準了, 沒什麼邊距問題

1.別做OCR
2.自動進紙
3.多買硬碟 :laugh:


那種機器3秒一頁是不可能的,

以目前市面上最貴的機種

opticbook 4800來說 官方數據3.6秒/頁,

是掃描的時間,不含傳到電腦和手工的的時間

基本上一分鐘6-8頁算快了,3-4頁也算正常

掃一小時200頁算很多了,除非你的書真的是百年古籍,

別浪費錢和時間。

yssy 2011-10-01 10:16 PM

有些學術單位使用的影印機都有掃描-送信功能
直接掃成PDF檔送出到信箱

至少中研院的文科各所及其圖書館都有此功能,很方便,速度也快,亦可到600DPI

sandstorm 2011-10-02 05:23 AM

如果手頭上已經有不錯的相機,搞個翻拍架來用拍的最快啦。

喀擦一下就是一頁,書本跨頁的陰影可以用打光技巧消除,又不用裁書,多好啊。 :D

dts0069 2011-10-02 11:21 PM

影印也許是最快方法,但我想你可能是想做成電子書那種格式.:laugh:

如果你肯拆書,掃描器不是太大問題,問體是辨識軟體的辨識成功率跟自動校正.

繁體OCR我建議是放棄,根本不用考慮,一般人手打也許都還比較快.

英文的話沒什問題,錯誤非常少,幾乎無視於存在.

簡體的話沒試過,不過直接到對岸的網站找現成的可能較快.

surn 2011-10-03 12:30 AM

無意間發現的這教學~

點進去大概就知道我是怎麼發現的了~ :laugh: :laugh: :laugh:

eric625 2011-10-03 01:17 AM

"書如果可以拆開scan應該也行的"問題就是在這邊!拆開....
引用:
作者APPLEKID
Fujitsu ScanSnap系列
裡面已經有附上acrobat了,全部掃成pdf剛好
文件ok,書如果可以拆開scan應該也行的

yaohoung2 2011-10-03 06:09 AM

引用:
作者boster
ION Audio Book Saver
http://www.youtube.com/watch?v=annC...player_embedded
這個是用照的。
其它的,可能就書本掃瞄器了吧。
[/url]

BOOK SAVER
像這種用照的
中間不會有圖形扭曲的問題嗎? :confused:


所有的時間均為GMT +8。 現在的時間是01:14 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。