Archívní formát PDF/A

Představení PDF/A

Každý z nás zcela určitě ví, co je to dokument ve formátu PDF. Setkáváme se s ním při práci na počítači každý den. PDF nám slouží jako formát pro výměnu „oficiálních“ informací (např. výpisy, vyúčtování, právní dokumenty, faktury, …). U tohoto formátu se předpokládá, že každý bude schopen si jej otevřít a přečíst. Otázkou je, jak to bude s možností přečíst tento dokument za několik let. Samotné PDF se totiž vyskytuje již v několika verzích a je předpoklad, že se bude vyvíjet i dále. A proto je tu formát PDF/A, který přináší standardizaci do této oblasti a zajišťuje možnost čtení dokumentu i v dlouhodobém horizontu. Standard sám je definován v ISO normách 19005-1:2005 a ISO 19005-2:2011.

Proč potřebujeme PDF/A?

Právě velké možnosti vkládaného obsahu do PDF způsobují potíže při jeho dlouhodobém uchování. Některé jeho vlastnosti jsou dokonce v rozporu s požadavky na dlouhodobé uchování. PDF dokumenty nemusí být nutně soběstačné. Mohou používat např. systémové fonty a další externí obsah. Zde pak samozřejmě není zaručena dostupnost těchto externích prvků v čase a tím pádem může dojít ke ztrátě informace. Právě PDF/A je navrženo tak, aby dokumenty zůstaly čitelné, přístupné a byly schopny poskytnout svůj obsah v dlouhodobém horizontu.

Rozdíl mezi PDF a PDF/A

PDF/A standardy jsou založeny na verzích Adobe PDF a určují, jaké podmnožina prvků jsou vhodné pro dlouhodobou archivaci. PDF si klade za cíl chránit vzhled elektronických dokumentů v průběhu času a podporovat budoucí přístup k nim a potřeby jejich budoucí konverze. Norma poskytuje rámec pro vkládání metadat do elektronických dokumentů a definuje jejich logickou strukturu a sémantické vlastnosti. Výsledkem je souborový formát, založený na PDF, který je vhodnější pro dlouhodobé uchování. PDF/A soubory jsou tedy více soběstačné, samo popisující a více nezávislé než tradiční PDF soubory. Tento standard ale nedefinuje strategii archivace nebo cíle archivního systému, ale zaručuje jeho stejnou reprodukci v průběhu let. Standard pro archivaci se jmenuje PAdES (PDF Advanced Electronic Signatures) a je to sada omezení a rozšíření formátu PDF.

Verze PDF/A

V současné době existují tři verze formátu a to PDF/A-1 (ISO 19005-1:2005), PDF/A-2 (ISO 19005-2:2011) a PDF/A-3 (ISO 19005-3:2012).

Specifikace PDF/A-1 byla vydána v roce 2005 a je založena na specifikaci PDF 1.4. PDF/A-1 specifikuje dvě úrovně PDF souborů:

  • PDF/A-1 Level "B" (PDF/A-1b) – vyžaduje přesnou vizuální reprodukci.
  • PDF/A-1 Level "A" (PDF/A-1a) – obsahuje Level B a rozšiřuje jej o další požadavky. Vyžaduje přesnou vizuální reprodukci doplněnou o povinné namapovaní textu na standard Unicode a přesnou deklaraci a popis logické struktury dokumentu 

Specifikace PDF/A-2 byla vydána v roce 2011 a je založena na specifikacích PDF 1.5., 1.6. a 1.7. PDF/A-2 se liší od PDF/A-1 podporou mnoha nových funkcionalit Soubory PDF/A-1 jsou kompatibilní s PDF/A-2, ale na druhou stranu ne všechny soubory PDF/A-2 musí být kompatibilní s PDF/A-1.

Specifikace PDF/A-3 byla vydána v roce 2012 a je založena na specifikací PDF 1.7. Tato umožňuje vkládání libovolných formátů (např. XML, CSV, CAD, word dokumentů, tabulkových dokumentů a dalších) do formátu PDF/A a jejich archivování jako kompletního objektu.

Vlastnosti PDF/A

Audio a video obsah není v normě povolen stejně jako JavaScript a spustitelné soubory. Všechny fonty musí být vloženy do souboru a musí se jednat o legálně vložitelné fonty pro neomezené a univerzální zobrazení. Týká se to třeba fontů z rodiny PostScript, jako je Times nebo Helvetica. Specifikace barev musí být definována nezávisle na použitém zařízení. V dokumentech je zakázáno šifrování a odkazy na externí objekty. Vyžadováno je naopak použití standardizovaných metadat. LZW a JPEG2000 jsou sice zakázány v PDF/A-1, ale komprese JPEG 2000 je dovolena v PDF/A-2. Stejně tak transparentní objekty a vrstvy jsou zakázány v PDF/A-1, ale jsou podporovány v PDF/A-2. Prostředky pro digitální podpisy v souladu s normou PAdES jsou podporovány od verze PDF/A-2. Vložené soubory nejsou ve verzi PDF/A-1. Ve verzi PDF/A-2 se již možnost připojit další PDF/A soubory a uložit je jako jeden PDF/A soubor. K tomu verze PDF/A-3 přidává možnost použití dalších formátů (XML, CSV, …).

Závěrem

Popularita tohoto formátu je u nás (ČR) zatím nízká. Je ovšem jisté, že s postupujícím časem nabyde i tento formát na svém významu. Již v zákoně č. 499/2004 Sb. (Zákon o archivnictví a spisové službě ve znění pozdějších předpisů) se hovoří jako o podmínce uchování dokumentu v digitální podobě o nutnosti zajištění čitelnosti tohoto dokumentu. Jednou z možností je právě využití formátu PDF/A.

Máte dotaz? Potřebujete poradit? Napište nám!

Děkujeme za Váš dotaz. Brzy se Vám ozveme.

Kontaktní informace

O nás

Jsme skupinou, která se zabývá problematikou důvěryhodné archivace dokumentů v elekronické podobě. Zabýváme se elekronickým zpracováním dokumentů tak, aby byly naplněny evropské a státní legislativní normy a zákony. Konečně lze říci, že dokument v elektronické podobě má stejnou hodnotu jako v papírové! Čtěte více zde!