一千萬個為什麽

搜索

高分辨率小尺寸PDF



archive.org上的PDF格式高分辨率,但尺寸相對較小。例如,這本書。該書的分辨率為500 ppi,大小為46 Mb。

我所做的是我使用Adobe Acrobat來提取頁面,並使用ppi 500進行壓縮,使用PNGGauntlet進行壓縮並從中取出150頁,並使用Acrobat將它們組合在一起。我得到的是107 Mb PDF文件。這太荒謬了,因為它的頁面要少得多,而且要大2.5倍。

如何制作一個像原來的小pdf?

轉載註明原文: 高分辨率小尺寸PDF

一共有 3 個回答:

PDF文件的大小取決於該文件的內容。 PDF文件是一組流,主要是壓縮數據。

如果您從例如生成PDF文件一個Word或OpenOffice文檔,這些文件往往比較小,特別是如果您不包含字體信息並依賴系統提供的字體或字體替換。 將圖像添加到文本會使文件更大。

由於PDF是支持多個圖像的少數圖像文件格式之一,因此通常(錯誤)用於存儲多個圖像,例如,來自掃描。這些掃描通常已經被壓縮成JPEG圖像,PDF文件只能作為一個容器(沒有,或者進一步壓縮是可能的)。對於這些類型的PDF文件,根據圖像的像素大小(掃描分辨率x紙張格式)以及有損壓縮(JPEG)壓縮質量,尺寸可能非常大。

如果將這些有損圖像文件提取為像PNG這樣的無損格式,則會立即將每幅圖像炸開一個數量級。所以你的結果並不奇怪。

將文件的各個頁面提取到單獨的PDF文件並僅重新組合您需要的頁面將會好得多。無需解壓包含圖像的流即可完成此操作通過像 pdftk 這樣的程序。如果您選擇一本書的一半頁面,則最終可以平均縮小文檔大小(平均)。

它們很小,因為它們的內容大部分只是純文本(包括方程式)。

由於它們是直接從源文件(例如LaTeX或Microsoft Word文檔)生成的,因此文本就像 .pdf 中的一串字符串一樣嵌入。

如果您將文檔掃描到 .pdf ,那麽pdf每頁只包含一個大圖像。比較所需磁盤空間的效率要低得多。

它可能是你選擇的圖像格式; PNG文件的運行通常比jpg文件大一點。可能值得嘗試導出為JPG格式。