Что такое PDF/A? Объясняем стандарт архивирования

Стопка архивных документов со щитом и часами, символизирующая долгосрочное хранение PDF

Если ты когда-нибудь пытался открыть архивный PDF десятилетней давности и обнаруживал сломанную вёрстку, отсутствующие шрифты или нечитаемый текст - ты на собственном опыте столкнулся с той самой проблемой, которую призван решать PDF/A. Так что же такое PDF/A? Если коротко - это версия формата PDF, стандартизированная по ISO и созданная специально для долгосрочного цифрового архивирования. В отличие от обычного PDF, который может зависеть от внешних ресурсов, шифрования или проприетарных элементов, которые могут исчезнуть в будущем, PDF/A встраивает всё необходимое для корректного отображения документа прямо в файл. Для команд, работающих с документами соответствия, юридическими договорами или финансовой отчётностью, понимание этого формата - не опция, а необходимость.

Главное:

  • PDF/A - это стандартизированный по ISO формат архивирования (ISO 19005), гарантирующий читаемость документов на протяжении десятилетий.
  • Обычные PDF могут «сломаться» со временем из-за зависимостей от шрифтов, шифрования и внешнего контента - PDF/A устраняет эти риски.
  • Существует три основных версии (PDF/A-1, PDF/A-2, PDF/A-3), каждая из которых подходит для разных задач архивирования и уровней сложности.
  • Проверить и конвертировать файлы в формат PDF/A можно быстро с помощью онлайн-инструментов, таких как PDFDeal, - без установки какого-либо программного обеспечения.

Почему был создан PDF/A

Формат PDF был представлен компанией Adobe в начале 1990-х как способ надёжно обмениваться документами между разными системами. Для повседневного использования он работал отлично, однако архивирование - совершенно иная задача. Государственные органы, суды, больницы и финансовые учреждения нуждались в формате, который оставался бы полностью читаемым через 25, 50 и даже 100 лет - вне зависимости от того, какое программное или аппаратное обеспечение будет существовать в тот момент.

Чтобы решить эту проблему, Международная организация по стандартизации (ISO) опубликовала ISO 19005 в 2005 году, официально определив PDF/A как самодостаточный, ориентированный на долгосрочное хранение вариант PDF. Буква «A» означает «archiving» (архивирование). С тех пор стандарт неоднократно обновлялся, чтобы учитывать новые требования.

Проблемы обычных PDF для архивирования

С точки зрения долгосрочного хранения обычный PDF удивительно ненадёжен. Вот ключевые проблемы, из-за которых стандартный PDF плохо подходит в роли формата для архивирования документов:

  • Зависимость от шрифтов: обычный PDF может ссылаться на шрифты, установленные в системе создателя, но не встроенные в файл. Если этот шрифт окажется недоступен при открытии документа спустя годы, программа просмотра подставит другой - и вёрстка изменится или текст станет нечитаемым.
  • Шифрование и DRM: PDF-файлы, защищённые паролем или ограничениями управления цифровыми правами (DRM), могут стать недоступными, если ключ дешифрования или соответствующее программное обеспечение перестанут существовать.
  • Внешний контент: обычные PDF могут содержать ссылки на внешние URL, видеопотоки или JavaScript-действия. Всё это может перестать работать или исчезнуть со временем.
  • Проблемы цветового пространства: без заданных цветовых профилей цвета документа могут отображаться по-разному на разных устройствах или в будущих технологиях отображения.
  • Проприетарные метаданные: некоторые PDF содержат метаданные в форматах, привязанных к конкретным версиям программного обеспечения, которые могут оказаться нечитаемыми для будущих систем.

Конкретный пример: представь юридическую фирму, которая в 2008 году сохраняла подписанные договоры в виде обычных PDF. В документах использовался нестандартный проприетарный шрифт, а валидация подписей была реализована через JavaScript. К 2020 году шрифт был снят с поддержки, а скрипт валидации перестал работать в современных программах просмотра PDF. Файлы выглядели повреждёнными, хотя технически были целы. Если бы эти файлы сохранили в формате PDF/A, все шрифты были бы встроены, а JavaScript - запрещён, и документы по сей день оставались бы полностью читаемыми.

Стандарты PDF/A: PDF/A-1, PDF/A-2, PDF/A-3

Стандарт ISO 19005 прошёл через три основные версии, каждая из которых развивает предыдущую. Прежде чем конвертировать или создавать архивные документы, важно понять, какая версия подходит для твоих задач.

PDF/A-1 (ISO 19005-1, опубликован в 2005 году)

Исходный стандарт. Включает два уровня соответствия:

  • PDF/A-1a (уровень A): полное соответствие требованиям доступности. Требует тегированного контента, правильного порядка чтения и маппинга символов Unicode. Оптимален для документов, которые должны быть машиночитаемыми и доступными для вспомогательных технологий.
  • PDF/A-1b (уровень B): базовое соответствие. Обеспечивает воспроизводимость визуального представления, но не требует полного тегирования. Подходит для сканированных документов или файлов, где доступность не является приоритетом.

PDF/A-2 (ISO 19005-2, опубликован в 2011 году)

Основан на PDF 1.7. В этой версии добавлена поддержка сжатия JPEG 2000, цифровых подписей (на основе PAdES), прозрачности и опционального контента (слоёв). Введён третий уровень соответствия:

  • PDF/A-2u (уровень U): требует маппинга Unicode, но не полного тегирования - промежуточный вариант между 2a и 2b.

PDF/A-2 - хороший выбор для современных рабочих процессов архивирования со сложной графикой или необходимостью поддержки цифровых подписей.

PDF/A-3 (ISO 19005-3, опубликован в 2012 году)

Наиболее гибкая версия. Позволяет встраивать файлы произвольных форматов (XML, таблицы, исходные файлы) в качестве вложений внутри контейнера PDF/A. Это особенно удобно в таких отраслях, как производство или финансы, где исходные данные (например, XML-счёт-фактура) должны сопровождать отрендеренный документ. При этом сами вложенные файлы не обязаны соответствовать стандарту PDF/A.

Кто использует PDF/A?

Соответствие стандарту PDF/A - это не просто техническое предпочтение. Во многих отраслях это нормативное требование или договорное обязательство.

  • Государственные органы: национальные архивы и ведомства по управлению публичными записями в США, ЕС и других странах обязывают использовать PDF/A для долгосрочного хранения документов. Национальный архив США, например, принимает PDF/A как предпочтительный формат для электронных записей.
  • Юридическая сфера: суды во многих странах требуют подачи документов в формате PDF/A, чтобы гарантировать их читаемость на протяжении всего судебного процесса, который может длиться десятилетиями.
  • Здравоохранение: медицинские карты, документация клинических испытаний и регуляторные заявки нередко должны храниться от 10 до 30 лет. PDF/A гарантирует, что эти записи останутся целостными и доступными.
  • Финансовый сектор: банки, аудиторы и финансовые регуляторы хранят записи о транзакциях, аудиторские следы и отчёты о соответствии в формате PDF/A, чтобы выполнять требования по срокам хранения в рамках таких регуляторных фреймворков, как SOX или MiFID II.
  • Операционные команды: внутренняя документация по процессам, записи системы менеджмента качества и договоры с поставщиками выигрывают от использования PDF/A, когда требуется долгосрочная прослеживаемость.

PDF/A против обычного PDF - ключевые технические отличия

Сравнивая PDF/A и обычный PDF, важно понимать: различия не косметические. Они отражают принципиально разную философию проектирования - «работает сейчас» против «работает всегда».

Характеристика Обычный PDF PDF/A
Встраивание шрифтов Необязательно Обязательно
Шифрование Разрешено Запрещено
JavaScript Разрешён Запрещён
Ссылки на внешний контент Разрешены Запрещены
Цветовые профили (ICC) Необязательны Обязательны
Аудио и видео Разрешены Запрещены
XMP-метаданные Необязательны Обязательны
Вложения файлов Разрешены Только в PDF/A-3

Ограничения в PDF/A введены намеренно. Каждая запрещённая функция - это то, что потенциально могло бы помешать корректному отображению документа в будущем. Стандарт жертвует гибкостью ради долговечности.

Как проверить соответствие PDF стандарту PDF/A

Не каждый PDF, помеченный как «PDF/A», действительно соответствует стандарту. Вот как правильно проверить соответствие PDF/A:

  1. Проверь метаданные документа: открой PDF в Adobe Acrobat или аналогичной программе просмотра и перейди в раздел «Файл - Свойства - Описание». Найди запись «PDF/A» в разделе стандартов. Это быстрая первичная проверка, но она лишь показывает, что заявляет сам файл.
  2. Используй специализированный валидатор: veraPDF (открытый валидатор) может выполнить полную проверку соответствия и сообщить о конкретных нарушениях.
  3. Найди идентификатор PDF/A в файле: корректный PDF/A-файл содержит блок XMP-метаданных, в котором объявлен уровень соответствия (например, PDF/A-1b или PDF/A-2a). Если этот блок отсутствует или повреждён, файл не является соответствующим стандарту.
  4. Используй онлайн-конвертер с проверкой: некоторые онлайн-инструменты позволяют одновременно проверить и конвертировать файл, что является наиболее эффективным подходом для команд, работающих с большими объёмами документов.

Если ты также работаешь со сканированными документами, которые нужно сделать доступными для поиска перед архивированием, ознакомься с нашим руководством о том, что такое OCR и как извлечь текст из сканированных PDF - это часто необходимый предварительный шаг перед конвертацией в PDF/A.

Как конвертировать PDF в PDF/A онлайн

Конвертировать существующий PDF в формат PDF/A не требует дорогостоящего настольного программного обеспечения. Вот практичный пошаговый подход с использованием онлайн-инструмента:

  1. Подготовь файл: убедись, что PDF не содержит контент, который принципиально невозможно сохранить, - например, рабочие веб-ссылки, которые должны оставаться активными, или встроенное видео. Эти элементы будут удалены или отмечены в процессе конвертации.
  2. Выбери подходящий уровень соответствия: если не уверен, PDF/A-2b - безопасный вариант по умолчанию для большинства деловых документов. Используй PDF/A-1a или PDF/A-2a, если требуется доступность и полное извлечение текста.
  3. Загрузи и конвертируй: используй онлайн-конвертер PDFDeal, чтобы загрузить свой PDF и выбрать вывод в формате PDF/A. Инструмент автоматически встраивает шрифты, назначает цветовые профили и добавляет метаданные.
  4. Скачай и проверь: после конвертации скачай файл и выполни быструю проверку, как описано в предыдущем разделе, чтобы подтвердить соответствие стандарту.
  5. Храни правильно: сохрани PDF/A-файл в надёжном месте с резервным копированием и контролем доступа. Формат обеспечивает читаемость, а правильное хранение гарантирует доступность.

Если ты хочешь лучше разобраться в том, как работают различные сценарии конвертации PDF, наше полное руководство по конвертации PDF охватывает весь спектр вариантов форматов и объясняет, когда каждый из них имеет смысл.

Если тебя беспокоит загрузка конфиденциальных документов в онлайн-инструменты, мы подробно рассмотрели этот вопрос в нашей статье о безопасности онлайн-инструментов для работы с PDF.

Заключение

PDF/A - это не просто технический чекбокс. Это практическое обязательство перед долговечностью документов. Для операционных команд, юридических отделов и специалистов по соответствию требованиям правильный выбор формата архивирования сегодня предотвращает дорогостоящие проблемы с доступом к документам в будущем. Стандарт устраняет все элементы, которые могут привести к «поломке» документа со временем, и заменяет неопределённость чёткой, поддающейся проверке гарантией. Независимо от того, работаешь ли ты с несколькими договорами или тысячами записей, конвертация в PDF/A - это простой шаг с долгосрочной отдачей. Начни с наиболее критичных документов и постепенно расширяй охват.

Конвертировать PDF в PDF/A онлайн с помощью PDFDeal - бесплатно и без установки

Конвертируй документы в PDF/A - бесплатно и онлайн

Преврати любой PDF в полностью соответствующий стандарту файл PDF/A мгновенно. Не нужно ничего устанавливать и регистрироваться - просто загрузи и конвертируй.

Попробовать конвертер PDFDeal →

Часто задаваемые вопросы

PDF/A - это стандартизированная по ISO версия PDF (ISO 19005), разработанная для долгосрочного архивирования. В отличие от обычного PDF, он требует встраивания всех шрифтов, запрещает шифрование и JavaScript, а также обязывает использовать цветовые профили и XMP-метаданные - это гарантирует, что документ будет отображаться одинаково вне зависимости от того, когда и где его откроют.

PDF/A-2b - наиболее практичный выбор для большинства задач делового архивирования. Он поддерживает современное сжатие, цифровые подписи и прозрачность при сохранении строгого соответствия стандарту. Используй PDF/A-1b для максимальной совместимости со старыми системами или PDF/A-3, если нужно встраивать исходные файлы - например, XML-счета-фактуры - вместе с отрендеренным документом.

Напрямую - нет. PDF/A запрещает шифрование, поэтому сначала необходимо снять защиту паролем. Для этого понадобится пароль для разблокировки файла, после чего незашифрованную версию можно конвертировать в PDF/A. Это сделано намеренно: шифрование несовместимо с долгосрочным архивированием, поскольку будущий доступ к зашифрованному файлу не может быть гарантирован.

Это зависит от отрасли и юрисдикции. Многие государственные органы, судебные системы и регулируемые отрасли (здравоохранение, финансы) либо требуют, либо настоятельно рекомендуют PDF/A для хранения записей. Проверь конкретные нормативные требования, применимые к твоей организации, - такие фреймворки, как SOX, MiFID II или национальное законодательство об архивировании, нередко прямо ссылаются на этот формат.

Проверь XMP-метаданные файла на наличие декларации соответствия PDF/A, затем прогони его через валидатор - например, veraPDF или онлайн-инструмент с полной проверкой соответствия. Простого наличия метки PDF/A в имени файла или панели свойств недостаточно - только полноценная проверка валидатором даёт надёжное подтверждение.