PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   七嘴八舌異言堂 (https://www.pcdvd.com.tw/forumdisplay.php?f=12)
-   -   請網上大大幫忙推薦 收納書本的方式 (https://www.pcdvd.com.tw/showthread.php?t=1194992)

buzzbee 2022-05-11 11:03 AM

引用:
作者Yungas
另請教一個問題,裁完掃描後的書後續您都如何處理?先跟您說聲謝謝


我的書大部分是課本、專論和手冊,分門別類放在雲端,隨時可以用手機、平板、電腦來查看,還算方便。

Yungas 2022-05-11 11:06 AM

引用:
作者buzzbee
我的書大部分是課本、專論和手冊,分門別類放在雲端,隨時可以用手機、平板、電腦來查看,還算方便。


抱歉,問題沒說清楚,我指的不是已經掃描成PDF的電子書,是指裁切過後的實體書

GCVincent 2022-05-11 12:28 PM

自炊要速度快,只有裁書送雙面自動饋紙掃描器。
現代書籍大多是膠裝?裁了一定短少幾mm,要費工再膠合。
日本代客炊,除非顧客要求(而且附回郵),一般是送回收。

舊的文字類書籍已經很多網路資源,新的可能較少?

不想毀掉書籍只能慢慢手動翻拍。
(大開本書、畫冊、圖集之類裁掉很可惜…)

自動化裁切轉正、OCR 比較麻煩。

buzzbee 2022-05-11 01:42 PM

引用:
作者Yungas
抱歉,問題沒說清楚,我指的不是已經掃描成PDF的電子書,是指裁切過後的實體書


哈哈,真的誤會了,很歹勢!

大部分的書在掃描後就送回收了,反正已經有電子檔,看著空空的書架,心中很喜悅。我孩子有非常多樂譜,已經快幫他掃完了,其中大部分都有老師講授時的親筆改譜記號,這些就捨不得丟棄了。

buzzbee 2022-05-11 01:47 PM

引用:
作者GCVincent
OCR 比較麻煩。


OCR是最麻煩的!!!速度慢不打緊,辨識率還不太高。OCR完的校稿就更傷腦筋,我試過幾本,吃到苦頭後直接投降,不敢再OCR了。
:jolin: :jolin: :jolin:

Double Q 2022-05-11 02:54 PM

請問OCR是轉成文字檔嗎?

我以為掃描成PDF檔就好了

是為了日後方便搜尋??

Yungas 2022-05-11 02:56 PM

引用:
作者buzzbee
哈哈,真的誤會了,很歹勢!

大部分的書在掃描後就送回收了,反正已經有電子檔,看著空空的書架,心中很喜悅。我孩子有非常多樂譜,已經快幫他掃完了,其中大部分都有老師講授時的親筆改譜記號,這些就捨不得丟棄了。


該說抱歉的是我,提問沒把問題說清楚。

我現在數位化的東西,如相片、電子筆記、帳單這些的,在我第一次接收到時,就是以數位化型態存在,不存在實體的東西,與我過往的生活沒有任何連結。但書本卻不同,從小到大的有些書本,跟我的成長有密不可分的連結,拿起一本書,會讓我想到當年閱讀這本書時的情境,就如同你所說的,樂譜有老師講授的親筆改譜記號,捨不得丟。當我把這本書掃完變電子檔時,書本的內容得到了保存,但電子檔的書與我的生命卻沒有任何的連結,有連結的是實體書本。這幾年買的書就沒有這種問題,因為都是買電子書,都市房子吋土吋金,住的空間都不夠,也就沒地方可以放實體書

當然不是每本書都如此,但要丟掉部份在生命中有某些意義的書籍這一點目前還是做不太到,不過隨著年紀愈來愈大,我想這個問題會自然解決,因為能留在身邊的東西會愈來愈少。

buzzbee 2022-05-11 03:25 PM

引用:
作者Double Q
請問OCR是轉成文字檔嗎?
我以為掃描成PDF檔就好了
是為了日後方便搜尋??


掃書得到的是pdf檔,在電子書閱讀器中只能一頁一頁讀,要放大也是以頁為單位整個放大。放大以後,文件超出螢幕的部分,還要自己挪移視窗來看,很不方便。如果是使用電子紙閱讀器,放大頁面已經慢到令人氣絕,挪移視窗更牛步到想要揍人。

我將pdf做OCR的目的,是產生txt檔,然後再轉成epub檔的電子書。放進電子紙閱讀器中,放大字體時,會自動重排版面,完全沒有超出螢幕的問題,讀起來賞心悅目。

GCVincent 2022-05-11 03:34 PM

Ptt book 版 自炊
https://www.ptt.cc/bbs/book/search?q=%E8%87%AA%E7%82%8A

看過比較清楚的說明
https://roulesophy.github.io/%E6%88...90%86%E8%A1%93/

https://eternallogger.com/post/18-0...me-brew-ebooks/
這一篇提到

引用:

輸出PDF到電腦

處理好的PDF傳到電腦或雲端,接下來要用電腦處理文件。

如果你使用Google Drive,它本身就配備很強的文字辨識功能,只要選擇用Google Docs開啟PDF檔,就會自動辨識。掃描品質夠好的話,漢字的辨識結果也令人驚喜。不過,全形標點符號往往辨識為半形,分段的辨識也相當差,我用它釀了一本書,發現後續的處理相當耗時,有必要針對整本書進行細校,畢竟連分段都一塌糊塗,決定棄用。

文字辨識:ABBYY FineReader

試用了幾個方案

,最後選擇ABBYY的FineReader,不便宜,但最省事。匯入排好的PDF後,原本拍攝的跨頁會自動被切割為左右頁(所以說一開始就拍跨頁)。我用來辨識繁體中文縱排的小說,文字辨識比起Google Drive看來要更好一些,至少沒有一眼就看出來的明顯錯誤,而且分段都確實找出來了。我讓它分析文本後,剔除天地的眉標和頁碼,再讓它進行文字識別程序。

識別好的成果輸出為純文字檔,並勾選「以一空行區隔段落」,就變成Markdown的分段格式,正合我意。由於我最後將會由Markdown純文字檔轉為EPUB,可以說到這裡已經很接近完成了,FineReader的完成度之高,出乎我意料之外,Mac App Store上也有賣。覺得貴的話不妨去下載試用版把玩看看。


以前在對岸網站看過一篇自炊,有開源文字辨識,忘記關鍵字找不到…

https://web.casio.jp/bookturner/
卡西歐這台自動翻頁機從沒看過實機……當年大概10萬隻羊?!
(耗材 一卷 tape /20冊,翻頁手臂/1000冊?)

要 OCR 才能大幅縮小文字檔案大小,高解析度圖片檔案會很大。
還有文字檔搜尋才會快。

Double Q 2022-05-13 09:26 AM

引用:
作者Yungas
這幾年買的書就沒有這種問題,因為都是買電子書,都市房子吋土吋金,住的空間都不夠,也就沒地方可以放實體書


現在買的書也盡量找電子書籍
但小孩工具書沒出電子的,只好繼續買進疊起來

引用:
作者buzzbee
掃書得到的是pdf檔,在電子書閱讀器中只能一頁一頁讀,要放大也是以頁為單位整個放大。放大以後,文件超出螢幕的部分,還要自己挪移視窗來看,很不方便。如果是使用電子紙閱讀器,放大頁面已經慢到令人氣絕,挪移視窗更牛步到想要揍人。

我將pdf做OCR的目的,是產生txt檔,然後再轉成epub檔的電子書。放進電子紙閱讀器中,放大字體時,會自動重排版面,完全沒有超出螢幕的問題,讀起來賞心悅目。


原來如此,謝謝分享


所有的時間均為GMT +8。 現在的時間是04:29 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。