PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   疑難雜症區 (https://www.pcdvd.com.tw/forumdisplay.php?f=34)
-   -   PDF檔的問題? (https://www.pcdvd.com.tw/showthread.php?t=1146976)

joe3970 2018-05-22 10:30 AM

PDF檔的問題?
 
工作上有1萬多個PDF檔
理頭有整個是圖檔和整個是文字檔兩種格式
請問有沒有什麼方法可快速的分成兩類?
就是整個是圖檔一個資料夾
整個是文字檔另一個資料夾
謝謝大家.

莫爺 2018-05-22 03:12 PM

找pdf最常出現的文字來搜尋。
像是「,、。」常用的符號。

文字檔格式的pdf是可以搜尋,反之圖檔一定搜尋不到。

oversky. 2018-05-22 04:15 PM

有沒有既有文字又有圖檔的 pdf ?

joe3970 2018-05-22 05:12 PM

也有文圖並存的
但只要內有文字就歸類成文字那一邊

除了二樓所講的
純圖檔的PDF會有什麼特性可抓出來用的嗎?

目前只想到用按鍵精靈控制
開檔-->檢查,.'-->關檔-->搬移
是可行但處理一個檔案要30秒左右
30*10000=300000/60/60=83.3333小時
這還是電腦不出錯的狀態
有人有更好的方法嗎?
謝謝囉

莫爺 2018-05-23 09:39 AM

為啥要用一個一個開啟方式搜尋?
應該有搜尋整個目錄裡的pdf方式吧!

https://help.adobe.com/zh_TW/acroba...5ff-7c47.w.html

http://blog.gaaiho.com/2017/01/pdf.html


joe3970 2018-05-23 08:49 PM

謝謝莫爺的講解
之前還真的不知道pdf可以用資料夾來做搜尋
真是長常識了
今天下班前交差了
雖然不是用您的方法
不過還是謝謝您.

oversky. 2018-05-23 09:18 PM

請問最後是用什麼方法?

joe3970 2018-05-24 03:41 PM

把多個pdf版本的純圖檔和文圖檔用notepad+開起來比較第一行大概就知道差異
然後用程式抓第一行前面一些文字根據差異來做比較
再用程式分類就可以了

不然也可以用莫爺提供的方法找出全部文字檔的檔名
然後再看你要怎麼處理分類就怎麼處理
這方面我沒想
反正交差啦
也不想想了


所有的時間均為GMT +8。 現在的時間是03:28 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2024。