пятница, 19 июня 2020 г.

Китай: Архивация веб-страниц – дело обязательное


Данная заметка, подготовленная агентством «Финансовая информационная сеть» (财讯网) и рассказывающая об опыте работы пекинской компании Guanqun Information Technology Co. Ltd, была опубликована 19 мая 2020 года на сайте «Хардкорные технологии» (派科技).

В соответствии с «Уведомлением секретариата Государственного совета КНР о публикации и распространении руководства по разработке государственных веб-сайтов» (《国务院办公厅关于印发政府网站发展指引的通知》№ 47 от 2017 года, см. http://www.gov.cn/zhengce/content/2017-06/08/content_5200760.htm ) и стандартом DA/T 80-2019 «Руководство по архивации веб-страниц государственных веб-сайтов» ( 政府网站网页归档指南 , самоназвание на английском языке: Guidelines for archiving webpages from government websites, опубликован 16 декабря 2019 года, см. https://www.doc88.com/p-54759402775820.html ), архивация страниц веб-сайтов является обязательной!

Общество с ограниченной ответственностью Guanqun Information Technology Co. профессионально разбирается в технологиях архивации веб-страниц.


Что такое архивация веб-страниц (webpage archiving)?

Архивирование веб-страниц - это процесс отбора, сохранения и использования исторических веб-страниц государственных веб-сайтов. В случае интеграции, миграции, обновления и т.д. государственных веб-сайтов, ценные оригинальные веб-страницы должны быть заархивированы. Заархивированные страницы должны быть доступны и четко помечены на видном месте как «архивные», с указанием времени архивации.

Значение архивации веб-страниц

В эпоху Интернета государственные веб-сайты на всех уровнях являются официальными онлайн-источниками информации государственных ведомств, а их веб-страницы представляют собой документы и свидетельства, отражающие деловую деятельность государственных учреждений. Они являются важным ресурсом для оценки, анализа и проверки деловой информации, раскрываемой, например, интересах обеспечения открытости и прозрачности государственного управления. Эти материалы ценны как доказательства, знания, и они также имеют архивную ценность. Правильное обеспечение долговременной сохранности страниц веб-сайтов имеет большое значение для документирования функциональной деятельности государственных органов и для сохранения общественной памяти.

Архивация веб-страниц в развитых странах

Учитывая, что большинство страниц веб-сайта живёт меньше года, ЮНЕСКО включила их в число важных источников цифрового наследия. Развитые страны мира уже ведут деятельность по архивации страниц веб-сайтов.

В 1996 году Соединенные Штаты создали первый в мире «Интернет-архив», миссия которого заключалась в том, чтобы максимально полно архивировать публичные веб-страницы и относящиеся к культуре материалы в цифровом виде. Уже к июню 2005 года было сохранено 40 миллиардов страниц.

В 1996 году был официально запущен онлайн-архив Национальных архивов Австралии, целью которого было обеспечение долговременной сохранности онлайн-публикаций и веб-сайтов Австралии,  и предоставление общественности доступа к этим материалам.

В 2004 году Великобритания официально запустила первый пилотный проект по архивации веб-материалов, осуществлявшийся консорциумом UKWAC (UK Web Archiving Consortium – Британский консорциум по веб-архивации, в него входили 6 ведущих британских учреждений сферы сохранения культурно-исторического наследия. Консорциум проработал до 2010 года; впоследствии его роль во многом перешла к Британской коалиции по электронной сохранности DPC – Н.Х.), для избирательного сохранения информации на британских веб-сайтах.

Архивация страниц государственных веб-сайтов Китая

Правительство Китая признало важность сохранения в качестве составной части цифрового культурно-исторического наследия веб-страниц сайтов и в настоящее время усиленно работает над практическими мерами в этой области.

3 ноября 2016 года секретариат Центрального комитета Коммунистической партии Китая опубликовал документ под названием «Управление электронными документами в Китае в рамках тринадцатого пятилетнего плана» (《国家电子文件管理 “十三五”规划》, см., например, https://wenku.baidu.com/view/db4b8c16dcccda38376baf1ffc4ffe473368fd8e.html  - Н.Х.), в котором четко предлагалось содействовать размещению электронных документов на государственных веб-сайтах.

В мае 2017 года секретариат Государственного совета КНР опубликовал «Руководство по разработке государственных веб-сайтов», отметив (см. п.3.2.3 – Н.Х.), что архивация веб-страниц - это процесс отбора, сохранения и использования исторических веб-страниц государственных веб-сайтов.

27 декабря 2019 года Государственное архивное управление Китая (国家档案局) опубликовало стандарт DA/T 80-2019 «Руководство по архивации веб-страниц государственных веб-сайтов», отметив тем самым официальное начало работ по архивации веб-страниц государственных веб-сайтов.

Основные китайские технологические компании, занимающиеся вопросами архивации веб-сайтов

Программное решение компании Guanqun Information Technology Co. для архивации с материалов государственных веб-сайтов поддерживает сбор, генерацию, архивацию веб-страниц, управление ими и их использование. Она также осуществляет централизованное хранение, единое управление и поддержку использования электронных файлов веб-страниц в стандартных форматах, с целью обеспечить долговременную сохранность и доступность веб-страниц.

Чтобы удовлетворить потребности партийных органов и государственных ведомств в части архивации их веб-сайтов, приложение способно захватывать станицы веб-сайта и формировать электронные файлы, соответствующие национальным и отраслевым стандартам архивирования. Обеспечивается сохранность существенного контента исходных веб-страниц, такого, как текст, графика, изображения и логика ссылок; и пользователям предоставляется возможность поиска и извлечения заархивированных материалов.

Система архивации веб-страниц компании Guanqun Information Technology Co. включает три подсистемы:

1. Подсистема захвата веб-страниц. Используя оптимизированную технологию веб-сканирования, веб-страницы назначенного веб-сайта собираются и сохраняются непосредственно в виде файлов формата WARC.

2. Система управления веб-контентом. С помощью сервиса преобразования форматов собранные веб-страницы преобразуются в файлы формата OFD, а затем сохраняются в системе управления веб-контентом. В соответствии с общими требованиями к системам управления электронными документами, поддерживаются автоматическая классификация, настройка параметров цикла хранения, экспертиза ценности и уничтожение/передача.

3. Подсистема отображения и использования электронных файлов веб-страниц. Она используется для воспроизведения информации веб-страниц сайта, собранной в разные исторические моменты времени, и предоставляет такие функции, как отображение веб-сайта, тематический показ, поиск по ключевым словам и скачивание, с использованием временной шкалы.

О компании Guanqun Information Technology Co. Ltd.

Компания является одним из участников разработки базовых технологий системы управления архивами веб-страниц сайтов в соответствии с национальными стандартами GB/T 33190-2016 «Форматы для хранения и обмена электронными документами - Документы фиксированной структуры» (电子文件存储与交换格式版式文档, самоназвание на английском языке Electronic files storage and exchange formats - Fixed layout documents, см. http://www.csres.com/detail/289716.html и https://www.doc88.com/p-5354924116081.html - Н.Х.) и DA/T 80-2019 «Руководство по архивации веб-страниц государственных веб-сайтов».

Компания является передовой в части применения ещё одной базовой технологии таких систем, файлового формата для хранения веб-страниц WARC, регламентированного национальным стандартом GB/T 33994-2017 «Информация и документация – файловый формат WARC» («信息和文献 WARC文件格式», Information and documentation - WARC file format, адаптация международного стандарта ISO 28500:2009, см. http://www.csres.com/detail/302010.html и https://www.doc88.com/p-4935081442183.html ).

У компании есть опыт успешных внедрений в Министерстве природных ресурсов, Национальном информационном центре и других учреждениях подобного уровня; она является наиболее опытным разработчиком системы управления архивом веб-страниц в Китае. Компания может быстро построить для государственного органа систему управления архивом веб-страниц как на основе SaaS-модели, так и на основе автономного решения.

Мой комментарий: Как Вы можете догадаться, я публикую данный пост не просто ради информирования читателей о том, что ещё одна, близкая нам по традициям архивного дела страна всерьёз взялась за архивацию интернет-материалов. Само собой, это намёк на, я бы сказала, «активное бездействие» в данном вопросе Росархива и ВНИИДАД.

Источник: сайт «Хардкорные технологии»
http://m.inpai.com.cn/news/redian/2020/0519/052020_47382.html 

Комментариев нет:

Отправить комментарий