跳到主要内容
隐私 April 05, 2026 8 分钟阅读

分享前如何从PDF中删除元数据

您发送的每个PDF都包含隐藏数据——作者姓名、编辑历史、软件版本等等。了解如何在文件到达错误人手之前找到并删除这些元数据。

每个PDF内部的隐藏层

当您保存PDF时,保存的内容远不止可见内容。文件中悄悄嵌入了一层元数据,可能包括您的全名、所在组织、使用的软件、文档首次编辑的日期,有时还有数月的修订历史。

对于大多数内部工作流程而言,这无关紧要。但当您与客户共享PDF、将其发布到网站,或作为竞标或法律程序的一部分提交时,这些隐藏数据就会成为风险。本指南将详细说明PDF元数据包含哪些内容、为何要清除它,以及如何在文件离开您手中之前完成清理。

PDF中存储了哪些元数据?

PDF在两个地方存储元数据:文档信息字典(旧式键值存储)和XMP流(Adobe推出并被大多数现代应用程序使用的基于XML的格式)。两者合计可能包含:

身份字段

  • • 作者(通常是操作系统账户名)
  • • 创建应用程序及版本
  • • PDF生成程序(如"Acrobat Distiller 24.0")
  • • 组织或公司名称

时间戳字段

  • • 创建日期和时间
  • • 最后修改日期
  • • 最后打印日期(部分应用程序)
  • • XMP历史时间戳

文档字段

  • • 标题、主题和关键词
  • • 文档描述
  • • 语言设置
  • • 自定义应用程序属性

结构性数据

  • • 嵌入字体和ICC颜色配置文件
  • • PDF版本和合规级别
  • • 带标签PDF的无障碍结构
  • • 数字签名证书(如已签名)

为何重要:现实中的隐私风险

元数据揭露的信息远超大多数发送者的预期。作者字段通常反映系统账户名,而非您的专业名称。生成程序字段可能暴露您所在组织使用的内部软件的确切版本。修订历史可能显示文档的实际创建时间,与其官方日期不符。

第一步 — 审查已有内容

在删除任何内容之前,您需要了解面对的是什么。使用 PDFCheck元数据查看器 立即获取文档每个字段的完整列表。处理完全在您的浏览器中进行,因此文件内容始终留在您的设备上。

第二步 — 选择删除方法

选项A:Adobe Acrobat(清理文档)

Acrobat Pro提供清理文档功能(工具 → 编辑 → 清理文档),可通过单个操作删除元数据、隐藏图层、嵌入内容和脚本。

选项B:打印为PDF

简便方法:在任意查看器中打开PDF并打印到虚拟PDF打印机。生成的文件是全新渲染版本,不包含任何原始元数据。

选项C:LibreOffice / 开源工具

ExifTool是用于精确删除特定字段的强大命令行解决方案:

exiftool -all= -overwrite_original document.pdf

第三步 — 验证结果

应用所选删除方法后,再次通过元数据查看器运行文件。确认所有敏感字段现在均为空或不存在。

关键要点

  • 每个PDF都包含可能暴露作者身份、软件版本和修订时间戳的元数据
  • 先用元数据查看器进行审计——您无法清除看不见的内容
  • 在签名前删除元数据——签名后删除会使数字签名失效
  • 将元数据卫生纳入工作流程——设置中性默认值,在发布管道中自动化清理
  • 数字签名和PDF/A合规性等特定元素无法在不破坏文档完整性的情况下删除

查看您的PDF隐藏着什么元数据

立即检查PDF中的每个元数据字段——作者、软件、时间戳等——无需上传任何文件到服务器。

检查PDF元数据
P

PDFCheck Team

我们开发工具,让每个人都能轻松使用PDF分析。