четверг, 3 апреля 2014 г.

Архивные стандарты: Интервью с представителем Национальных Архивов США (NARA)


Данный материал, подготовленный Даффом Джонсоном (Duff Johnson) был выложен на его блоге 21 марта 2014 года.

Очевидно, что стабильное, надежное делопроизводство имеет важное значение для деловой деятельности, государственного управления и для общества в целом. В те времена, когда бумага и ее двоюродный сестра микроплёнка были единственными носителями документов, мир был куда проще.

За последние полвека государственные учреждения заменили шкафы для хранения дел на сервера, а печатные документы - на PDF-файлы. Ситуация стала несколько сложнее.

Более десяти лет Национальные Архивы США (The US National Archives and Records Administration, NARA) активно участвуют в развитии формата PDF/A - архивного подмножества формате PDF. Национальные Архивы выпускают правила, которыми федеральные органы исполнительной власти руководствуются при передаче своих документов на постоянное архивное хранение.

В феврале 2014 года я взял интервью у Кевина де Ворси (Kevin L. De Vorsey), ведущего специалиста Национальных Архивов по форматам электронных документов. Темой беседы были первые с 2004 года изменения, внесенные в установленный Национальными Архивами порядок передачи документов на архивное хранение (Revised Format Guidance for the Transfer of Permanent Electronic Records, http://www.archives.gov/records-mgmt/bulletins/2014/2014-04.html , о нём также см. пост на моём блоге http://rusrim.blogspot.ru/2014/02/blog-post_6.html - Н.Х.).

Д.Дж.: Национальные Архивы впервые с 2004 года выпустили новую редакцию руководства по передаче документов на архивное хранение. Можете ли вы рассказать о том, как изменились приоритеты?

К.де В.: Я бы сказал, что это не столько смена приоритетов, столько эволюция, отражающая изменения в применяемых федеральными органами исполнительной власти методах создания и использования электронных документов и в имеющихся у Национальных Архивов возможностях по управлению документами, которым установлен постоянный срок хранения. Национальные Архивы всегда подчеркивали важность независимости электронных документов от систем и платформ, и новое руководство разработано на основе этого же ключевого принципа.

Электронные файлы всё чаще рассматриваются как «официальные» документы. Если в прошлом государственный орган обычно устанавливал постоянный срок хранения бумажной стенограмме встречи, то сейчас для документирования таких событий часто используется видеозапись. Учитывая изменения такого рода, наше руководство по передаче документов на постоянное архивное хранение теперь включает разделы, описывающие соответствующие цифровые форматы аудио- и видеофайлов, а также новые разделы – например, раздел, касающийся файлов, создаваемых в системах автоматизированного проектирования (САПР).

Д.Дж.: Я вижу, что в руководстве упоминаются форматы семейства Open XML (DOCX , XLSX , PPTX). Они не являются специализированными форматами для архивного хранения, так почему же они были включены?


К.де В.: Одной из самых серьёзных проблем, с которыми мы сталкиваемся, является разброс в возрасте передаваемых нам электронных документов. Имейте в виду, что документы передаются в Национальные Архивы лишь тогда, когда они перестают активно использоваться. Ряд учреждений до сих пор продолжает передавать электронные документы, созданные на старых электронных вычислительных машинах в кодировке EBCDIC, в то время. как другие государственные органы используют самые современные форматы, такие как форматы Open XML, продвигаемые компанией Microsoft.

В отличие от предыдущих форматов Word, семейство форматов OOXML стандартизовано в ECMA и в Международной организации по стандартизации (ISO), и эти форматы основаны на XML. Как Вы сами отметили, это само по себе не делает их «архивными», однако наличие подробных технических спецификаций является важным фактором, который поможет сообществу специалистов, занимающихся обеспечением долговременной сохранности электронных документов и информации, принимать решения о том, когда и какие действия следует предпринять в будущем для обеспечения постоянной доступности контента этих файлов.

Д.Дж.: Предвидите ли Вы возможность того, что PDF, как формат для представления готовых электронных документов, столкнется с конкуренцией?

К.де В.: Это интересный вопрос, на который сложно дать ответ. PDF, безусловно, очень распространенный формат, используемый в многообразных областях применения, и трудно представить себе что-либо подобное с точки зрения способности формата хранить широкий спектр типов данных. PDF является превосходной «упаковкой» для таких традиционных объектов, как формы и текстовые документы, но мы также видим, что он используется для САПР-документов и геопространственных документов, создаваемых на выходе соответствующих систем.

Существует важное различие: одни документы создаются и управляются в виде файлов, хранящихся на жестком диске; в то время, как другие сохраняются в приложениях и для передачи на архивное хранение должны быть выведены из этих приложений. Мои собственные рабочие папки служат тому примером, в них можно найти файлы, созданные при помощи программ форматирования текстов, электронные таблицы, презентации, и, конечно же, PDF-файлы.

Многие системы автоматизированного проектирования, геопространственные системы и облачные средства повышения производительности хранят документы в чём-то вроде баз данных или в виде XML-файлов. Национальные Архивы не могут сохранить все используемые системы, поэтому государственные органы должны быть способны извлекать свои документы в приемлемом формате вместе с соответствующими метаданными, и как раз такой «пакет» передается на архивное хранение.

Д.Дж.: Насколько важны, с точки зрения управления документами, стандартизированные (т.е. открыто опубликованные) форматы?

К.де В.: Федеральные органы исполнительной власти используют широкий спектр систем для удовлетворения своих, часто уникальных деловых потребностей. Если система используется для создания, управления и хранения электронных документов, которым по итогам экспертизы ценности установлен постоянный срок хранения, то эти документы и связанные с ними метаданные необходимо экспортировать таким образом, чтобы их можно было передать в Национальные Архивы.

Мы выводим документы из среды, в которой они были созданы и использовались, и в будущем у нас не будет возможности связаться с людьми, которые с ними работали. Нам нужно захватить достаточно информации о документах, об их создателях и о контексте, в котором они были созданы, с тем, чтобы исследователи понимали, с чем они имеют дело. Открытые и тщательно документированные файловые форматы, и стандарты метаданных помогают нам выполнять нашу задачу по сохранению и обеспечению доступа к документам в будущем. Извлечение данных из проприетарных (коммерческих) форматов может оказаться дорогостоящим делом, особенно в будущем, когда уже будут недоступны необходимое оборудование и программное обеспечение.

Открытые технологии, в том числе стандарты форматов и метаданных, очень важны в управлении документами, особенно когда дело касается документов постоянного хранения, которые должны оставаться доступными в обозримом будущем. Через 20 или 30 лет может быть сложно найти достоверную информацию по многим форматам, - в отличие от тех, что прошли через отлаженный процесс стандартизации. Наличие надёжных спецификаций, безусловно, поможет решать возможные проблемы с обеспечением доступа к информации в определенном вышедшем из употребления формате, - поскольку в этих спецификациях содержатся те инструкций, которым следовали разработчики приложений при создании программного обеспечения для кодирования этих файлов. Альтернативой является «обратное проектирование» программного обеспечения для работы с такими файлами, которые может оказаться весьма дорогостоящим решением.

Д.Дж.: Являются ли проприетарные форматы изначально проблематичными, с архивной точки зрения?

К.де В.: Если выбрать какой-нибудь один тип электронных документов – например, структурированные данные в базах данных, -  то можно быстро составить список из 20-30 коммерческих приложений для работы с базами данных, и для каждого выявить государственные органы, которое их использовали при работе с документами постоянного срока хранения. Национальные Архивы не в состоянии поддерживать лицензии и сохранять опыт и знания для работы с Oracle, Informix, Microsoft SQL Server, Sybase, MySQL, Seibel и другими ныне используемыми системами. Поэтому мы просим государственные органы передавать данные из этих систем в платформенно-независимом формате вместе со всеми кодовыми таблицами, руководствами пользователя, отчетами и иными метаданными и документацией, необходимыми для интерпретации документов вне исходной системы. К сожалению, экспорт документов из системы не всегда просто выполнить, и не все системы способны выводить документы в открытых форматах.

Д.Дж.: Будут ли Национальные Архивы поощрять переход государственных органов на использование стандартизированных форматов?

К.де В.: Государственные органы согласны с тем. что наличие стандартов и четко сформулированных требований в момент создания ими систем – отличный способ обеспечить соблюдение и активную поддержку этих требований. Национальные Архивы является активным участником деятельности ряда организаций, разрабатывающих стандарты в области управления документами и информацией, а также в других областях, взаимосвязанных с электронными документами.

Д.Дж.: Каковы у государственных органов возможности сэкономить за счёт внедрения стандартизованных форматов?

К.де В.: Стандарты не решают всех проблем, связанных с надлежащим хранением и управлением информацией в государственных органах, - но они, безусловно, помогают. Хранение документов постоянного срока хранения в рекомендуемых форматах и/или обеспечение возможности вывода документов из систем в таких форматах позволяют избежать затрат и усилий на миграцию документов перед их передачей на архивное хранение. Помимо этого, государственные органы могут избежать дорогостоящих миграций при переносе данных из одной проприетарной системы в другую.

Ещё один пример, непосредственно не связанный с форматами: Мы наблюдали ситуации, когда облачный сервис для автоматизации коллективной работы над офисными документами поддерживал лишь «поштучное» скачивание файлов. В зависимости от количества файлов, их вывод из системы может оказаться весьма дорогостоящим из-за высоких трудозатрат.

Д.Дж.: Какие проблемы можно решить благодаря использованию стандартизированных форматов?

К.де В.: Стандарты служат единым известным ориентиром. Поскольку передача документов постоянного срока хранения часто проводится спустя длительное время после прекращения их активного использования, стандарты обеспечивают документирование структуры файлов, чего в противном случае не было бы. Вы удивились бы, если бы знали, как порой трудно разыскать спецификации для файловых форматов, которые были широко распространенными всего несколько лет назад. И хотя полезно иметь стандарты в качестве отправной точки, также важно понимать, как электронные документы с ними взаимосвязаны. Сплошь и рядом разработчиков приложений интерпретируют стандарты по-своему, поэтому важно знать, насколько файлы соответствуют тем стандартам, на основе которых они созданы.

Д.Дж.: Каковы существуют препятствия для внедрения технологий, опирающихся на стандарты?

К.де В.: Когда государственные органы разрабатывают требования к системам и технологиям, непосредственные деловые потребности часто имеют приоритет над вопросами управления документами в длительной перспективе и над требованиями к передаче документов на архивное хранение. Как и в примере с облачными сервисами, оперативная потребность обеспечить хранение и коллективную работу над документами берёт верх над более отдалённой задачей передачи документов на архивное хранение. В этом смысле самым большим препятствием является недостаток четкого понимания того, какие стандарты следует принять во внимание при разработке системы, используемой для управления электронными документами. Что касается международных или национальных стандартов, то затраты на приобретение экземпляра стандарта также могут стать препятствием для его внедрения. В ряде случаев могут одновременно существовать несколько конкурирующих стандартов, что не способствует истинной стандартизации.

Д.Дж.: Спасибо за Ваше время, г-н де Ворси!

Дафф Джонсон (Duff Johnson)

Источник: блог Даффа Джонсона
http://duff-johnson.com/2014/03/21/archival-standards-an-interview-with-nara/

Комментариев нет:

Отправка комментария