среда, 8 августа 2007 г.

Требования к «столетнему архиву»: Результаты опроса SNIA


В январе 2007 года международная отраслевая ассоциация в области сетевого хранения данных (Storage Networking Industry Association, SNIA, http://www.snia.org/ ) опубликовала отчет об итогах онлайн-опроса, проводившегося с ноября 2006 по январь 2007 года. В опросе приняли участие представители 276 организаций из различных стран. Среди респондентов преобладали ИТ-специалисты, специалисты по управлению документами и информацией и архивисты. В опросе также участвовали юристы, специалисты в области безопасности и представители деловых подразделений организаций.

Опрос проводился рабочей группой «Столетний архив» (The 100 Year Archive), действующей в рамках форума SNIA по управлению данными.  Целью проведения опроса было установление требований к определению хорошей деловой практики и к разработке решений проблем в области обеспечения долговременной сохранности электронной информации, стоящих перед центрами хранения и обработки данных.

Основные результаты опроса:
  • Результаты опроса недвусмысленно подтвердили, что потребность в долговременном хранении электронной информации существует у многих организаций.

    • 80% респондентов сообщили, что у них есть информация, подлежащая хранению в течение более 50 лет

    • у 68% респондентов имеется информация, срок хранения которой превышает 100 лет.

  • «Длительное хранение», как правило, означает хранение в течение более чем 10-15 лет – когда начинают проводиться многочисленные миграции, и сохранность информации оказывается под угрозой.

  • Считается, что наибольшему риску утраты подвержена информация в базах данных (структурированные данные).

  • Свыше 40% респондентов сохраняют сообщения электронной почты более 10 лет. Таким образом, вопрос сохранения электронной переписки выходит за рамки оперативной работы с информацией.

  • Большую проблему представляет физическая миграция. Только 30% опрошенных сообщили, что они проводят миграцию как положено, с интервалов в 3-5 лет. У остальных респондентов электронная информация оказывается под угрозой.

  • 60% опрошенных «совсем не уверены», что смогут прочесть сохраненную ими информацию через 50 лет.

  • Требуется помощь – имеющиеся методы слишком ориентированы на ручные операции, слишком подвержены ошибкам, чересчур дорого обходятся и не обеспечивают должной координации действий в масштабе организации.

  • Коллективная работа и классификация признаны чрезвычайно важными компонентами, необходимыми для того, чтобы подразделения организации, действуя совместно, смогли разработать единые требования к управлению информацией организации. SNIA считает, что этот результат подтверждает правильность линии ассоциации, направленной на продвижение методов управления информацией на протяжении всего её жизненного цикла (Information Lifecycle Management, ILM).

    • Это подтверждается тем фактом, что только 35% респондентов считают, что службы ИТ и ДОУ в их организации согласовывают требования к срокам хранения и к обеспечению сохранности той информации, которую они защищают.

понедельник, 6 августа 2007 г.

Великобритания: Активный подход к обеспечению длительной сохранности электронных документов


Национальные Архивы Великобритании (The National Archives, TNA) продолжают разработку т.н. «активного» подхода к обеспечению длительной сохранности документов (Active Preservation Framework), и практическую реализацию соответствующе программной системы.

В концепции предусмотрены три основных функциональных блока, образующих замкнутый цикл, причем каждый из блоков опирается на услуги, обеспечиваемые центральным техническим реестром.

Первый функциональный блок анализа характеристик отвечает за определение тех свойств цифровых объектов, которые имеют существенное значение для их долговременной сохранности, и знание которых необходимо для принятия решений на этапе планирования, а также при проверке результатов действий по обеспечению долговременной сохранности.

В рамках данного блока можно выделить три основных процесса, каждый из которых применим как к документу в целом, так и к составляющим его файлам:
  • Идентификация – данный процесс отвечает за точную идентификацию версии файлового формата. По результатам идентификации корректируются метаданные файла. В настоящее время TNA использует в качестве инструментального средства идентификации  программу DROID, а для описания форматов применяются универсальны идентификаторы, используемые в реестре файловых форматов PRONOM. В 2007 году планируется выпустить третью версию  DROID, обеспечивающую большую точность идентификации и повышенную производительность.

  • Контроль соответствия структуры файла спецификациям формата, определенного по итогам идентификации. В реестре PRONOM содержатся сведения об имеющихся средствах контроля, и о форматах, которые они способны проверять. Средство проверки может быть выбрано автоматически на основе результатов процесса идентификации.

  • Определение свойств. В ходе этого процесса определяются существенные с точки зрения обеспечения длительной сохранности свойства цифрового объекта, такие, как:

    • Технические свойства файлов, используемые в дальнейшем на этапе планирования. Основным таким свойством является формат; но это также могут быть и любые свойства, относящиеся к технической реализации объекта, такие, как алгоритм сжатия графического изображения, или же природа макросов в офисном документе.

    • Внутренние свойства, связанные с подлежащими сохранению документами. Эти свойства не зависят от технической реализации. Примером служат продолжительность видеоклипа или содержание текстового документа.
Второй функциональный блок планирования действий по обеспечению долговременной сохранности. Здесь определяется, когда и какие действия должны быть выполнены с цифровыми объектами. Эти действия должны уменьшить неблагоприятное воздействие внутренних или внешних событий, ставящих под угрозу постоянную доступность цифрового объекта. В этой связи TNA разработало метод планирования на основе анализа рисков. Используемая в TNA модель предусматривает возможность хранения нескольких представлений одного документа, которые могут быть по-разному подвержены воздействию неблагоприятных факторов.

В настоящее время учитываются два вида рисков: риски, связанные с определенным форматом, и риски, связанные с индивидуальным цифровым объектом. Риски, связанные с определенным форматом, вычисляются и документируются в реестре PRONOM на основе таких факторов, как число поддерживающих данный формат программных продуктов, открытость формата и т.д. Риски, связанные с конкретным объектом, вычисляются с учетом таких факторов, как наличие макросов в офисном документе или использование алгоритма сжатия в графическом файле.

Если для какого-либо объекта риски, относящиеся к возможности его представления или к долговременной сохранности, превышают установленное пороговое значение, то автоматически инициируется создание соответствующего плана действий, и последующее выполнение процесса миграции (в случае изменений в технологиях, данные в реестре PRONOM уточняются и риски пересчитываются заново).

Окончательным результатом на выходе второго блока является план действий по обеспечению долговременной сохранности, включающий конкретный путь обеспечения долговременной сохранности, точную последовательность выполняемых действий и список обрабатываемых таким образом цифровых объектов. 

Реестр PRONOM используется здесь двояко: для определения наиболее подходящего формата, в который будет осуществляться миграция, а также для получения сведений о программном обеспечении, способном читать и писать в каждом из форматов – что позволяет определить возможные пути миграции. Пути миграции затем тестируются и результаты анализируются (путем контроля определенных существенных свойств). По итогам этих экспериментов определяется предпочтительный путь миграции в конкретных обстоятельствах.

Третий функциональный блок – блок выполнения действий, обеспечивающих долговременную сохранность. Здесь претворяются в жизнь результаты планирования, производятся преобразования цифровых объектов, позволяющие обеспечить их постоянную доступность.

Технический реестр представляет собой базу знаний, поддерживающую работу трёх основных функциональных блоков. Это – ядро всей системы. В настоящее время реестр уже действует и доступен по адресу http://www.nationalarchives.gov.uk/PRONOM/default.htm . Текущая версия PRONOM ориентирована на использование человеком; в настоящее время идет разработка средств, позволяющих реализовать межмашинное взаимодействие.

Программная система разрабатывается на основе сервисно-ориентированной архитектуры, в которой основные функции реализованы в виде веб-сервисов. Для большей гибкости реализована иерархия сервисов. Каждому сервису, как правило, в виде параметров передаются местоположение обрабатываемых файлов и сопровождающих их XML-метаданных. Разработка ведется с использованием Java J2EE, причем так, чтобы была возможность через стандартный интерфейс использовать инструментальные средства, разработанные сторонними организациями. Для запуска сервисов используется workflow-«движок», который отвечает за управление электронными документами, начиная с момента их отбора и передачи на хранение и до предоставления документов пользователям. Разработку workflow-системы планируется завершить к концу 2007 года.

Источники:

четверг, 2 августа 2007 г.

Стандарт ANSI/ARMA 16-2007 «Процесс конверсии электронных документов: Планирование программы, требования, процедуры»


Данный стандарт был разработан Международной ассоциацией специалистов в области управления документами  ARMA International и в марте 2007 года был утвержден Американским национальным институтом стандартов (ANSI).

Стандарт содержит требования, обеспечивающие сохранение подлинности и аутентичности электронных документов при их конверсии из одной электронной системы хранения документов в другую. И хотя стандарт непосредственно не рассматривает вопросы обеспечения длительной сохранности электронных документов, эти вопросы тесно связаны с конверсией, поскольку многие стратегии обеспечения длительной сохранности включают  в себя тот или иной вид конверсии.

В части I стандарта рассматриваются решения, связанные с планированием программы конверсии и с вопросами делопроизводства.

Часть II посвящена обсуждению собственно процесса конверсии. Приложения включают:
  • Таблицы, в которых вместе сведены делопроизводческие требования; движущие силы и риски, связанные с процессом конверсии; меры контроля и управления; и стадии процесса конверсии;

  • Другие материалы в помощь специалистам, отвечающим за конверсию.
Данный стандарт рекомендуется использовать совместно с международным стандартом ISO 14721:2003 “Space data and information transfer systems – Open archival information system – Reference model”, который содержит базовые сведения и контекстуальную информацию, позволяющие лучше понять рассматриваемые в новом стандарте вопросы.

Объём документа 50 страниц, цена (на сайте ARMA http://www.arma.org ) 40 долларов США (при приобретении электронного варианта).

Источник:
http://www.arma.org/bookstore/productdetail2.cfm?ProductID=2228

среда, 1 августа 2007 г.

ГОСТ Р ИСО 15489 и ещё 988 других стандартов выложены в бесплатном доступе на сайте Федерального агентства по техническому регулированию и метрологии


На сайте Федерального агентства по техническому регулированию и метрологии заработала новая система предоставления бесплатного доступа к ГОСТам, в которой на сегодня размещено 989 стандартов, в том числе национальные версии стандартов ИСО.

Стандарты показываются постранично, в виде графических файлов размером 600 x 850 пикселей. Качество изображения, конечно, плохонькое, - но ведь бесплатно, и прочесть текст все-таки можно.

Чтобы воспользоваться данной системой, нужно сначала отправиться на сайт http://www.gost.ru/ .и из выпадающего меню «Новые стандарты» выбрать пункт «Опубликование стандартов» - появится текст условий обслуживания. Его нужно пролистать до конца, и нажать кнопку «Вы согласны с данным положением».

Сразу доступен каталог выложенных стандартов с системой поиска. Для того, чтобы получить доступ к текстам, нужно один раз пройти несложную регистрацию. Для этого следует нажать кнопку «Регистрация» и заполнить регистрационную форму. На указанный почтовый адрес высылается сообщение, содержащее ссылку, после перехода по которой активизируется учетная запись пользователя.

После этого нужно войти в систему, - и можно смотреть документы. Чтобы найти, скажем, ГОСТ Р ИСО 15489, в поле поиска можно указать 15489, сняв при этом «галочку» текущего месяца. Сначала показывается справочная информация о стандарте, а к полному тексту можно перейти, нажав кнопку «Полный текст ГОСТ …».

Источник: сайт Федерального агентства по техническому регулированию и метрологии
http://www.gost.ru/