优化PDF
通过删除未使用的对象并重建文件来清理和优化 PDF 结构。
在线优化 PDF 文件 - 免费工具
PDF 优化通过清理内部文件结构并对图像重新编码,来减小文件大小、提升文档兼容性。该工具采用与压缩工具相同的两阶段 pipeline,并额外增加了一项关键功能:输出文件会进行线性化处理(linearization),即重新整理 PDF 结构,使第一页在整个文件下载完成之前就能显示。这让线性化 PDF 在浏览器和网页查看器中打开速度更快。你的文件在服务器内存中处理,结果返回后立即删除,从不写入磁盘。
三种优化级别的区别
每个级别控制图像降采样(downsampling)和重新编码的力度。文本和字体不受任何级别影响。
| 低 | 中 | 高 | |
|---|---|---|---|
| 图像降采样 | 无 | 150 DPI 双三次插值 | 96 DPI 双三次插值 |
| 单色图像降采样 | 无 | 150 DPI | 120 DPI |
| JPEG 质量 | 80 | 70 | 52 |
| 适合场景 | 印刷级文件、作品集 | 报告、网页发布 | 最大化压缩体积 |
处理完成后,工具会比较所有候选输出,返回体积最小的那个。如果 PDF 已经过充分优化,可能会直接返回原始文件,不做任何更改。
优化有效和无效的情况
文件体积的缩减幅度取决于 PDF 的内容:
- 图像较多的 PDF 缩减幅度最大,因为图像降采样和 JPEG 重新编码能去除最多数据。
- 扫描文档 以页面图像形式存储,在中和高级别下压缩效果较好,但在 96 DPI 时文字清晰度会有所下降。
- 纯文本 PDF 体积缩减有限,但仍能受益于线性化处理,从而提升在网页查看器中的加载速度。
- 已优化的 PDF 可能无法进一步缩减体积,此时工具会返回原始文件。
如果优化后文件仍然太大,可以使用 拆分工具 将其分割成更小的部分。如需在重新优化前提取并删除不必要的图像,可以使用 图像提取工具。
如何优化 PDF
- 上传文件:点击上传区域或直接拖放你的 PDF 文件。文件通过加密连接发送至服务器。
- 选择优化级别:根据是否需要保留图像质量或最小化文件大小,选择低、中或高。
- 移除元数据(可选):勾选"移除文档元数据",可从输出文件中清除作者、标题、创建者、生产者等字段。
- 下载结果:服务器会返回它所能生成的最小输出文件。文件在响应发送后立即从服务器内存中删除。
常见问题
PDF 优化会从文件结构中移除未使用的对象和冗余数据,根据所选预设以较低质量对图像重新编码,并对输出进行线性化处理。线性化会重新整理 PDF 结构,使第一页及其资源位于文件开头,让网页查看器和浏览器在整个文件下载完成之前就能显示第一页。文本和字体不受影响。
两个工具使用相同的图像降采样和重新编码 pipeline。优化工具额外对输出文件进行线性化处理,使第一页在完整文件下载完成前就能显示,从而提升在浏览器和网页 PDF 查看器中的加载速度。对于不需要考虑加载速度的离线使用场景,两个工具的处理结果相同。对于发布在网站上或通过网页链接分享的 PDF,优化工具是更好的选择。
线性化是一种组织 PDF 文件内部结构的方式,使第一页及其资源出现在文件开头。未线性化的 PDF 以任意顺序存储对象,浏览器或网页查看器必须下载完整个文件才能显示任何页面。线性化的 PDF 允许查看器在文件其余部分继续在后台加载时,立即渲染第一页。这在某些 PDF 工具中也被称为"快速 Web 查看"(fast web view)。
如果 PDF 在上传前已经过压缩,工具就无法通过图像重新编码进一步缩减体积。纯文本 PDF 也几乎没有体积缩减空间,因为没有可供降采样的图像。工具会比较所有输出候选,如果原始文件已经是最小的,则直接返回原始文件。尝试更高的优化级别可能会得到更小的结果,但代价是图像质量下降。无论体积是否减小,文件都会进行线性化处理。
不会。PDF 中的文本以矢量轮廓或字体数据形式存储,而非像素,因此不受图像降采样影响。只有光栅图像(raster image)会被重新编码。对于扫描文档,由于每页都是一张光栅图像,较高的优化级别会降低文字清晰度,因为文字是页面图像的一部分,而非单独存储的矢量图层。
可以。工具提供"移除文档元数据"选项,可清除存储在 PDF info 字典和 XMP stream 中的作者、标题、创建者、生产者等字段。在优化前勾选该选项即可。元数据会在优化完成后从最终输出文件中移除。
不会。文件完全在服务器 RAM 中处理,优化结果返回到你的浏览器后立即删除。文件从不写入磁盘,不存储在数据库中,请求完成后也不会保留任何数据。
图像较多的 PDF,如演示文稿、宣传册和设计导出文件,体积缩减幅度最大。扫描文档压缩效果好,因为每页都是光栅图像。纯文本 PDF 体积缩减有限,但在线发布时可受益于线性化处理。通过网页链接分享或嵌入网站的 PDF,无论体积是否缩减,都能从优化中获益,因为线性化可以提升感知加载速度。
可以。扫描 PDF 以光栅图像形式存储每一页,非常适合进行体积缩减。高级别会将页面图像降采样至 96 DPI,并以 JPEG 质量 52 重新编码。代价是文字清晰度下降,因为文字是页面图像的一部分。如果需要从扫描 PDF 中提取文字,请在优化前先使用 OCR 工具。