Kaip pašalinti metaduomenis iš PDF prieš dalijantis
Kiekvienas jūsų siunčiamas PDF turi paslėptų duomenų — autoriaus vardą, redagavimo istoriją, programinės įrangos versiją ir dar daugiau. Sužinokite, kaip rasti ir pašalinti tuos metaduomenis prieš failui pasiekiant nepageidaujamas akis.
Paslėptas kiekvieno PDF sluoksnis
Kai išsaugote PDF, išsaugote kur kas daugiau nei matomą turinį. Faile tyliai įterptas metaduomenų sluoksnis gali apimti jūsų vardą ir pavardę, organizaciją, naudotą programinę įrangą, pirmą dokumento redagavimo datą ir kartais kelių mėnesių revizijų istoriją.
Daugumai vidinių darbo procesų tai nekenksminga. Tačiau kai dalijatės PDF su klientu, skelbiote jį savo svetainėje arba pateikiate kaip dalį konkurso ar teisinio proceso, tie paslėpti duomenys tampa rizika. Šis vadovas tiksliai paaiškina, ką PDF metaduomenys turi, kodėl svarbu juos pašalinti ir kaip išvalyti failą, kol jis nepalieka jūsų rankų.
Kokie metaduomenys saugomi PDF?
PDF saugo metaduomenis dviejose vietose: dokumento informacijos žodyne (pasenęs rakto-vertės saugykla) ir XMP sraute (XML pagrįstas formatas, kurį pristatė Adobe ir kurį naudoja dauguma šiuolaikinių programų). Kartu jie gali apimti:
Tapatybės laukai
- • Autorius (dažnai OS paskyros vardas)
- • Kūrimo programa ir versija
- • PDF gamintojas (pvz. "Acrobat Distiller 24.0")
- • Organizacija arba įmonės pavadinimas
Laiko žymų laukai
- • Sukūrimo data ir laikas
- • Paskutinio keitimo data
- • Paskutinio spausdinimo data (kai kuriose programose)
- • XMP istorijos laiko žymos
Dokumento laukai
- • Pavadinimas, tema ir raktiniai žodžiai
- • Dokumento aprašymas
- • Kalbos nustatymai
- • Pasirinktinės programų savybės
Struktūriniai duomenys
- • Įdėtieji šriftai ir ICC spalvų profiliai
- • PDF versija ir atitikties lygis
- • Pažymėto PDF prieinamumo struktūra
- • Skaitmeninio parašo sertifikatai (jei pasirašyta)
Kodėl tai svarbu: realios privatumo rizikos
Metaduomenys atskleidžia daugiau, nei dauguma siuntėjų suvokia. Autoriaus laukas dažnai atspindi sistemos paskyros vardą, o ne jūsų profesionalų vardą. Gamintojo laukas gali atskleisti tikslią jūsų organizacijos naudojamos vidinės programinės įrangos versiją. Revizijų istorijos gali rodyti, kada dokumentas iš tikrųjų buvo parengtas, palyginti su jo oficialia data.
1 žingsnis — Patikrinkite, kas jau yra
Prieš pašalindami ką nors, turite žinoti, su kuo susiduriate. Naudokite PDFCheck metaduomenų peržiūrą, kad akimirksniu gautumėte išsamų kiekvieno dokumento lauko sąrašą. Apdorojimas vyksta visiškai jūsų naršyklėje, todėl failo turinys lieka jūsų įrenginyje.
2 žingsnis — Pasirinkite pašalinimo metodą
Parinktis A: Adobe Acrobat (Dezinfekuoti dokumentą)
Acrobat Pro turi Dezinfekuoti dokumentą funkciją (Priemonės → Redaguoti → Dezinfekuoti dokumentą), kuri vienu veiksmu pašalina metaduomenis, paslėptus sluoksnius, įdėtą turinį ir skriptus.
Parinktis B: Spausdinti į PDF
Paprastas būdas: atidarykite PDF bet kurioje peržiūros programoje ir spausdinkite į virtualų PDF spausdintuvą. Gautas failas yra naujas vaizdavimas be jokių originalių metaduomenų.
Parinktis C: LibreOffice / Atvirojo kodo įrankiai
ExifTool yra galingas komandinės eilutės sprendimas konkrečių laukų chirurginiam pašalinimui:
exiftool -all= -overwrite_original document.pdf
3 žingsnis — Patikrinkite rezultatą
Pritaikę pasirinktą pašalinimo metodą, vėl paleiskite failą per metaduomenų peržiūrą. Patvirtinkite, kad visi jautrūs laukai dabar yra tušti arba jų nėra.
Pagrindinės išvados
- Kiekvienas PDF turi metaduomenis, kurie gali atskleisti autoriaus tapatybę, programinės įrangos versijas ir revizijų laiko žymes
- Pirmiausia atlikite auditą su metaduomenų peržiūra — negalite išvalyti to, ko nematėte
- Pašalinkite metaduomenis prieš pasirašydami — pašalinimas po to panaikina skaitmeninius parašus
- Įtraukite metaduomenų higieną į savo darbo eigą — nustatykite neutralius numatytuosius parametrus ir automatizuokite valymą leidybos srautuose
- Tam tikri elementai, tokie kaip skaitmeniniai parašai ir PDF/A atitiktis, negali būti pašalinti nesunaikinant dokumento vientisumo
Peržiūrėkite, ką slepia jūsų PDF metaduomenys
Akimirksniu patikrinkite kiekvieną metaduomenų lauką savo PDF — autorių, programinę įrangą, laiko žymes ir dar daugiau — neįkeldami nieko į serverį.
Tikrinti PDF metaduomenisPDFCheck Team
Kuriame įrankius, kad PDF analizė būtų prieinama visiems.