Archívní formát PDF/A
Představení PDF/A
Každý z nás zcela určitě ví, co je to dokument ve formátu PDF. Setkáváme se s ním při práci na počítači každý den. PDF nám slouží jako formát pro výměnu „oficiálních“ informací (např. výpisy, vyúčtování, právní dokumenty, faktury, …). U tohoto formátu se předpokládá, že každý bude schopen si jej otevřít a přečíst. Otázkou je, jak to bude s možností přečíst tento dokument za několik let. Samotné PDF se totiž vyskytuje již v několika verzích a je předpoklad, že se bude vyvíjet i dále. A proto je tu formát PDF/A, který přináší standardizaci do této oblasti a zajišťuje možnost čtení dokumentu i v dlouhodobém horizontu. Standard sám je definován v ISO normách 19005-1:2005 a ISO 19005-2:2011.
Proč potřebujeme PDF/A?
Právě velké možnosti vkládaného obsahu do PDF způsobují potíže při jeho dlouhodobém uchování. Některé jeho vlastnosti jsou dokonce v rozporu s požadavky na dlouhodobé uchování. PDF dokumenty nemusí být nutně soběstačné. Mohou používat např. systémové fonty a další externí obsah. Zde pak samozřejmě není zaručena dostupnost těchto externích prvků v čase a tím pádem může dojít ke ztrátě informace. Právě PDF/A je navrženo tak, aby dokumenty zůstaly čitelné, přístupné a byly schopny poskytnout svůj obsah v dlouhodobém horizontu.
Rozdíl mezi PDF a PDF/A
PDF/A standardy jsou založeny na verzích Adobe PDF a určují, jaké podmnožina prvků jsou vhodné pro dlouhodobou archivaci. PDF si klade za cíl chránit vzhled elektronických dokumentů v průběhu času a podporovat budoucí přístup k nim a potřeby jejich budoucí konverze. Norma poskytuje rámec pro vkládání metadat do elektronických dokumentů a definuje jejich logickou strukturu a sémantické vlastnosti. Výsledkem je souborový formát, založený na PDF, který je vhodnější pro dlouhodobé uchování. PDF/A soubory jsou tedy více soběstačné, samo popisující a více nezávislé než tradiční PDF soubory. Tento standard ale nedefinuje strategii archivace nebo cíle archivního systému, ale zaručuje jeho stejnou reprodukci v průběhu let. Standard pro archivaci se jmenuje PAdES (PDF Advanced Electronic Signatures) a je to sada omezení a rozšíření formátu PDF.
Verze PDF/A
V současné době existují tři verze formátu a to PDF/A-1 (ISO 19005-1:2005), PDF/A-2 (ISO 19005-2:2011) a PDF/A-3 (ISO 19005-3:2012).
Specifikace PDF/A-1 byla vydána v roce 2005 a je založena na specifikaci PDF 1.4. PDF/A-1 specifikuje dvě úrovně PDF souborů:
- PDF/A-1 Level "B" (PDF/A-1b) – vyžaduje přesnou vizuální reprodukci.
- PDF/A-1 Level "A" (PDF/A-1a) – obsahuje Level B a rozšiřuje jej o další požadavky. Vyžaduje přesnou vizuální reprodukci doplněnou o povinné namapovaní textu na standard Unicode a přesnou deklaraci a popis logické struktury dokumentu
Specifikace PDF/A-2 byla vydána v roce 2011 a je založena na specifikacích PDF 1.5., 1.6. a 1.7. PDF/A-2 se liší od PDF/A-1 podporou mnoha nových funkcionalit Soubory PDF/A-1 jsou kompatibilní s PDF/A-2, ale na druhou stranu ne všechny soubory PDF/A-2 musí být kompatibilní s PDF/A-1.
Specifikace PDF/A-3 byla vydána v roce 2012 a je založena na specifikací PDF 1.7. Tato umožňuje vkládání libovolných formátů (např. XML, CSV, CAD, word dokumentů, tabulkových dokumentů a dalších) do formátu PDF/A a jejich archivování jako kompletního objektu.
Vlastnosti PDF/A
Audio a video obsah není v normě povolen stejně jako JavaScript a spustitelné soubory. Všechny fonty musí být vloženy do souboru a musí se jednat o legálně vložitelné fonty pro neomezené a univerzální zobrazení. Týká se to třeba fontů z rodiny PostScript, jako je Times nebo Helvetica. Specifikace barev musí být definována nezávisle na použitém zařízení. V dokumentech je zakázáno šifrování a odkazy na externí objekty. Vyžadováno je naopak použití standardizovaných metadat. LZW a JPEG2000 jsou sice zakázány v PDF/A-1, ale komprese JPEG 2000 je dovolena v PDF/A-2. Stejně tak transparentní objekty a vrstvy jsou zakázány v PDF/A-1, ale jsou podporovány v PDF/A-2. Prostředky pro digitální podpisy v souladu s normou PAdES jsou podporovány od verze PDF/A-2. Vložené soubory nejsou ve verzi PDF/A-1. Ve verzi PDF/A-2 se již možnost připojit další PDF/A soubory a uložit je jako jeden PDF/A soubor. K tomu verze PDF/A-3 přidává možnost použití dalších formátů (XML, CSV, …).
Závěrem
Popularita tohoto formátu je u nás (ČR) zatím nízká. Je ovšem jisté, že s postupujícím časem nabyde i tento formát na svém významu. Již v zákoně č. 499/2004 Sb. (Zákon o archivnictví a spisové službě ve znění pozdějších předpisů) se hovoří jako o podmínce uchování dokumentu v digitální podobě o nutnosti zajištění čitelnosti tohoto dokumentu. Jednou z možností je právě využití formátu PDF/A.