среда, 26 мая 2021 г.

Управление документами: Веб-сайты, часть 2

(Окончание, начало см. http://rusrim.blogspot.com/2021/05/1.html )

Нужно ли захватывать весь веб-сайт или его части?

Не весь контент, страницы или транзакции на веб-сайтах будут генерировать документы, требующие захвата и последующего хранения в течение установленных сроков.

В то же время некоторые органы исполнительной власти, исходя из практических причин, могут решить, что архивировать веб-сайты целиком им проще, чем отделять контент сиюминутной ценности от важных документов. Захват сайтов целиком, в свою очередь, может оказаться сложным для государственных органов, использующих несколько систем для доставки веб-контента и ведения оперативной деятельности онлайн.

Тем органам исполнительной власти, которые, после проведения функционального анализа своих веб-ресурсов или технического анализа характера своей веб-активности примут решение о захвате только части своих веб-сайтов, будет необходимо решить, какой контент имеет статус документов и где его можно найти. Для полноты веб-документов необходимо, чтобы они включали:

  • Контент документа;

  • Метаданные (информацию о контексте);

  • Сведения об управлении и политиках, указывающие рамки, в которых был создан и публиковался веб-сайт.

Все эти три элемента совершенно необходимы для обеспечения полноты и точности (а также полезности) документов, отражающих деловую активность на веб-сайте.

Насколько часто следует проводить захват веб-документов?

Захват может осуществляться в режиме реального времени по мере создания контента, или же в конце каждой недели или месяца, если агентство сочтет это целесообразным. Проведенная Вами оценка рисков поможет Вам определить, насколько часто следует захватывать посты и сообщения.

Органы исполнительной власти также должны внедрить соответствующие процедуры и процессы для облегчения захвата документов с веб-сайтов.

Какой технический подход следует использовать для захвата веб-документов?


Итоги проведенных Вами оценки рисков и экспертизы ценности документов помогут Вам определить, какой (какие) из подходов следует использовать для захвата документов Вашего веб-сайта. Ниже перечислены некоторые доступные технические подходы к захвату веб-документов.

Вариант 1. Сохранить в системе управления веб-контентом (content management system, CMS)

Данный вариант подходит:

  • В случае, когда документам установлены короткие сроки хранения;

  • Если CMS-система имеет базовые функциональные возможности для управления документами (например, поддерживается захват метаданных), так что захватываются как контент, так и контекст документов.

Вариант 2: Автоматизированный захват в специализированную систему для управления электронными документами и контентом (Electronic Document and Records Management System, EDRMS)

Данный вариант подходит:

  • В случае простого веб-контента, не требующего сохранения всех ссылок;

  • Для веб-контента, требующего долговременного хранения.

Вариант 3. Ручной захват в систему типа EDRMS или в электронное / физическое дело

Данный вариант подходит:

  • Для небольших объемов веб-контента, поскольку данный подход более трудоёмок (требует ручного захвата копии экрана, ручных операций сохранения контента и ввода метаданных);

  • В случае простого веб-контента, не требующего сохранения ссылок;

  • Для веб-контента, требующего долговременного хранения.

Вариант 4: Захват веб-контента (web harvesting) с использованием программного продукта для захвата в веб-браузере и локального сохранения

Данный вариант подходит:

  • Для взаимосвязанного веб-контента, состоящего из небольшого количества веб-объектов;

  • Для веб-сайтов, которые меняются / обновляются не слишком часто для которых характерна низкая скорость веб-транзакций.

Вариант 5: Захват транзакций с использованием программного продукта для захвата HTTP-запросов к веб-серверу и последующих ответов

Данный вариант подходит:

  • Для захвата взаимодействий (того, что было получено от пользователя и отправлено ему), а не всего веб-сайта.

Вариант 6: Захват из серверной части (back-end - система захватывает данные, которые используются для формирования веб-контента)

Данный вариант подходит:

  • Для захвата контента для веб-сайта, а не самого веб-сайта, с использованием средств системы менеджмента веб-контента CMS или делового приложение, взаимодействующего с клиентами через веб-сайт (такая система также должна иметь функциональные возможности для управления документами, чтобы захватывался как контент, так и контекст)

Что делать с выведенными из эксплуатации / устаревшими веб-сайтами?

Определение того, что (и как) архивировать с веб-сайтов, которые уже не используются в оперативной деятельности, представляет собой для хорошего управления документами как логистические, так и практические проблемы.

Имея дело с выведенными из эксплуатации веб-сайтами, органам исполнительной власти следует принять во внимание следующие вопросы управления документами:

  • Какая часть материалов выведенного из эксплуатации сайта была в неизменном виде перемещена на новый сайт (сайты)?

  • В какой степени контент веб-сайта покрывается указаниями по срокам хранения (RDA)?

  • Имеет ли сайт какой-либо логический смысл (и сохраняется ли на нём достаточный контекст для придания ему смысла) в автономной (offline) среде?

Ответы на эти вопросы помогут четко определить минимальный состав документов, которые необходимо захватить до того, как выведенный из эксплуатации сайт станет окончательно недоступным.

В каком формате (форматах) следует сохранять документы с веб-сайтов?

Lля информации, которая должна храниться более семи лет, органам исполнительной власти настоятельно рекомендуется использовать одобренные Управлением PROV форматы для долговременного хранения, даже если эту информацию не нужно передавать на архивное хранение в PROV.

Источник: сайт PROV
https://prov.vic.gov.au/recordkeeping-government/a-z-topics/website

Комментариев нет:

Отправить комментарий