PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 其他群組 > 七嘴八舌異言堂
帳戶
密碼
 

  回應
 
主題工具
buzzbee
New Member
 

加入日期: Dec 2010
文章: 3
引用:
作者Yungas
另請教一個問題,裁完掃描後的書後續您都如何處理?先跟您說聲謝謝


我的書大部分是課本、專論和手冊,分門別類放在雲端,隨時可以用手機、平板、電腦來查看,還算方便。
     
      
舊 2022-05-11, 11:03 AM #61
回應時引用此文章
buzzbee離線中  
Yungas
Basic Member
 

加入日期: May 2013
文章: 12
引用:
作者buzzbee
我的書大部分是課本、專論和手冊,分門別類放在雲端,隨時可以用手機、平板、電腦來查看,還算方便。


抱歉,問題沒說清楚,我指的不是已經掃描成PDF的電子書,是指裁切過後的實體書
 
舊 2022-05-11, 11:06 AM #62
回應時引用此文章
Yungas離線中  
GCVincent
*停權中*
 

加入日期: Nov 2018
文章: 1,088
自炊要速度快,只有裁書送雙面自動饋紙掃描器。
現代書籍大多是膠裝?裁了一定短少幾mm,要費工再膠合。
日本代客炊,除非顧客要求(而且附回郵),一般是送回收。

舊的文字類書籍已經很多網路資源,新的可能較少?

不想毀掉書籍只能慢慢手動翻拍。
(大開本書、畫冊、圖集之類裁掉很可惜…)

自動化裁切轉正、OCR 比較麻煩。
舊 2022-05-11, 12:28 PM #63
回應時引用此文章
GCVincent離線中  
buzzbee
New Member
 

加入日期: Dec 2010
文章: 3
引用:
作者Yungas
抱歉,問題沒說清楚,我指的不是已經掃描成PDF的電子書,是指裁切過後的實體書


哈哈,真的誤會了,很歹勢!

大部分的書在掃描後就送回收了,反正已經有電子檔,看著空空的書架,心中很喜悅。我孩子有非常多樂譜,已經快幫他掃完了,其中大部分都有老師講授時的親筆改譜記號,這些就捨不得丟棄了。
舊 2022-05-11, 01:42 PM #64
回應時引用此文章
buzzbee離線中  
buzzbee
New Member
 

加入日期: Dec 2010
文章: 3
引用:
作者GCVincent
OCR 比較麻煩。


OCR是最麻煩的!!!速度慢不打緊,辨識率還不太高。OCR完的校稿就更傷腦筋,我試過幾本,吃到苦頭後直接投降,不敢再OCR了。
舊 2022-05-11, 01:47 PM #65
回應時引用此文章
buzzbee離線中  
Double Q
Advance Member
 
Double Q的大頭照
 

加入日期: Aug 2000
文章: 490
請問OCR是轉成文字檔嗎?

我以為掃描成PDF檔就好了

是為了日後方便搜尋??
舊 2022-05-11, 02:54 PM #66
回應時引用此文章
Double Q離線中  
Yungas
Basic Member
 

加入日期: May 2013
文章: 12
引用:
作者buzzbee
哈哈,真的誤會了,很歹勢!

大部分的書在掃描後就送回收了,反正已經有電子檔,看著空空的書架,心中很喜悅。我孩子有非常多樂譜,已經快幫他掃完了,其中大部分都有老師講授時的親筆改譜記號,這些就捨不得丟棄了。


該說抱歉的是我,提問沒把問題說清楚。

我現在數位化的東西,如相片、電子筆記、帳單這些的,在我第一次接收到時,就是以數位化型態存在,不存在實體的東西,與我過往的生活沒有任何連結。但書本卻不同,從小到大的有些書本,跟我的成長有密不可分的連結,拿起一本書,會讓我想到當年閱讀這本書時的情境,就如同你所說的,樂譜有老師講授的親筆改譜記號,捨不得丟。當我把這本書掃完變電子檔時,書本的內容得到了保存,但電子檔的書與我的生命卻沒有任何的連結,有連結的是實體書本。這幾年買的書就沒有這種問題,因為都是買電子書,都市房子吋土吋金,住的空間都不夠,也就沒地方可以放實體書

當然不是每本書都如此,但要丟掉部份在生命中有某些意義的書籍這一點目前還是做不太到,不過隨著年紀愈來愈大,我想這個問題會自然解決,因為能留在身邊的東西會愈來愈少。
舊 2022-05-11, 02:56 PM #67
回應時引用此文章
Yungas離線中  
buzzbee
New Member
 

加入日期: Dec 2010
文章: 3
引用:
作者Double Q
請問OCR是轉成文字檔嗎?
我以為掃描成PDF檔就好了
是為了日後方便搜尋??


掃書得到的是pdf檔,在電子書閱讀器中只能一頁一頁讀,要放大也是以頁為單位整個放大。放大以後,文件超出螢幕的部分,還要自己挪移視窗來看,很不方便。如果是使用電子紙閱讀器,放大頁面已經慢到令人氣絕,挪移視窗更牛步到想要揍人。

我將pdf做OCR的目的,是產生txt檔,然後再轉成epub檔的電子書。放進電子紙閱讀器中,放大字體時,會自動重排版面,完全沒有超出螢幕的問題,讀起來賞心悅目。
舊 2022-05-11, 03:25 PM #68
回應時引用此文章
buzzbee離線中  
GCVincent
*停權中*
 

加入日期: Nov 2018
文章: 1,088
Ptt book 版 自炊
https://www.ptt.cc/bbs/book/search?q=%E8%87%AA%E7%82%8A

看過比較清楚的說明
https://roulesophy.github.io/%E6%88...90%86%E8%A1%93/

https://eternallogger.com/post/18-0...me-brew-ebooks/
這一篇提到

引用:

輸出PDF到電腦

處理好的PDF傳到電腦或雲端,接下來要用電腦處理文件。

如果你使用Google Drive,它本身就配備很強的文字辨識功能,只要選擇用Google Docs開啟PDF檔,就會自動辨識。掃描品質夠好的話,漢字的辨識結果也令人驚喜。不過,全形標點符號往往辨識為半形,分段的辨識也相當差,我用它釀了一本書,發現後續的處理相當耗時,有必要針對整本書進行細校,畢竟連分段都一塌糊塗,決定棄用。

文字辨識:ABBYY FineReader

試用了幾個方案

,最後選擇ABBYY的FineReader,不便宜,但最省事。匯入排好的PDF後,原本拍攝的跨頁會自動被切割為左右頁(所以說一開始就拍跨頁)。我用來辨識繁體中文縱排的小說,文字辨識比起Google Drive看來要更好一些,至少沒有一眼就看出來的明顯錯誤,而且分段都確實找出來了。我讓它分析文本後,剔除天地的眉標和頁碼,再讓它進行文字識別程序。

識別好的成果輸出為純文字檔,並勾選「以一空行區隔段落」,就變成Markdown的分段格式,正合我意。由於我最後將會由Markdown純文字檔轉為EPUB,可以說到這裡已經很接近完成了,FineReader的完成度之高,出乎我意料之外,Mac App Store上也有賣。覺得貴的話不妨去下載試用版把玩看看。


以前在對岸網站看過一篇自炊,有開源文字辨識,忘記關鍵字找不到…

https://web.casio.jp/bookturner/
卡西歐這台自動翻頁機從沒看過實機……當年大概10萬隻羊?!
(耗材 一卷 tape /20冊,翻頁手臂/1000冊?)

要 OCR 才能大幅縮小文字檔案大小,高解析度圖片檔案會很大。
還有文字檔搜尋才會快。
舊 2022-05-11, 03:34 PM #69
回應時引用此文章
GCVincent離線中  
Double Q
Advance Member
 
Double Q的大頭照
 

加入日期: Aug 2000
文章: 490
引用:
作者Yungas
這幾年買的書就沒有這種問題,因為都是買電子書,都市房子吋土吋金,住的空間都不夠,也就沒地方可以放實體書


現在買的書也盡量找電子書籍
但小孩工具書沒出電子的,只好繼續買進疊起來

引用:
作者buzzbee
掃書得到的是pdf檔,在電子書閱讀器中只能一頁一頁讀,要放大也是以頁為單位整個放大。放大以後,文件超出螢幕的部分,還要自己挪移視窗來看,很不方便。如果是使用電子紙閱讀器,放大頁面已經慢到令人氣絕,挪移視窗更牛步到想要揍人。

我將pdf做OCR的目的,是產生txt檔,然後再轉成epub檔的電子書。放進電子紙閱讀器中,放大字體時,會自動重排版面,完全沒有超出螢幕的問題,讀起來賞心悅目。


原來如此,謝謝分享
舊 2022-05-13, 09:26 AM #70
回應時引用此文章
Double Q離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是02:27 AM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。