понедельник, 28 декабря 2020 г.

Потенциальная роль блокчейна для будущего архивного дела

Данная статья британского специалиста Джареда Келлера (Jared Robert Keller – на фото) была опубликована, по современным мерка, довольно-таки давно – она появилась 19 апреля 2018 года на сайте лондонского «Института открытых данных» (The Open Data Institute, ODI), одним из со-основателей которого был известный пионер интернета сэр Тим Бернерс-Ли (Tim Berners-Lee). Тем не менее, она сохраняет свою актуальность и содержит ряд не очень часто обсуждающихся идей.

Технологии блокчейна и иных распределенных реестров вызвали в последние годы значительный интерес. Этот интерес, как и в случае многих нарождающихся технологий, меняется, похоже, в соответствии с «Циклом ажиотажа» (Hype Cycle) фирмы Gartner (соответствующую диаграмму для блокчейна в версии за июль-октябрь 2019 года см. здесь http://rusrim.blogspot.com/2019/12/blog-post_25.html - Н.Х.). Перед лицом такой шумихи «Институт открытых данных» (ODI) постарался подготовить аргументированное мнение в отношении многочисленных обещаний этих новых технологий.

Практика архивной работы - сбора и хранения документов и иных объектов для потомков - имеет долгую и многообразную историю. Перед современными архивами стоит задача сохранить сегодняшние документы, чтобы будущие поколения смогли их использовать для понимания современного общества. В случае официальных государственных архивов, решается уникальная задача обеспечения долговременной сохранности официальных документов, созданных в результате внутренней деятельности государственных органов.

Документы, которые в настоящее время потенциально являются «чувствительными» - например, те, что в случаях их обнародования сегодня могут поставить под угрозу деятельность государственных органов, но которые при этом будут полезны для изучения истории в будущем, - хранятся в защищённых условиях в течение заранее установленного срока, по истечении которого они становятся доступными для широкой публики. Пока они находятся на закрытом хранении, только архивисты с соответствующим допуском могут получить к ним доступ с целью обеспечить надлежащее сохранение объектов.

Сегодня изучением функционирования архивов и решением многих проблем современной архивной практики занимается целая область академических исследований и многочисленные научно-исследовательские учреждения. Одной из ключевых проблем для архивов является переход от управления главным образом физическими объектами к работе с преимущественно цифровыми объектами. Организационные практики в органах правительства и за их пределами все чаще смещаются от физических объектов к цифровым - от бумажных заметок к электронным письмам, от печатных отчетов к PDF-файлам, от диапозитивов для диапроекторов к слайдам электронных презентаций.

С этими переменами связано немало проблем в плане управления и хранения, над решением которых усердно трудятся архивисты и учёные. Из этих проблем мы обращаем особое внимание на обеспечении целостности этих изначально-электронных объектов, т.е. на то, чтобы они оставались неизменными при хранении в архиве. Если вносить изменения в физические объекты таким образом, чтобы не оставалось очевидных следов несанкционированных манипуляций, довольно сложно, то изменить электронные объекты в силу их природы относительно легко. Возникает важный вопрос: как архивы могут гарантировать гражданам, что полученный ими из архива документ является тем же документом, что был изначально передан на архивное хранение?

Проект «Архангел» (ARCHANGEL): Архивация и блокчейн

Цель проекта ARCHANGEL (проект осуществляется Национальными Архивами Великобритании, о нём см. также подборку http://rusrim.blogspot.com/search/label/ARCHANGELН.Х.) - понять, как система на основе технологий распределённого реестра (DLT-система) может быть использована в качестве механизма для проверки того, что документы не были изменены за время их хранения в архивах. Основная идея заключается в применении к объекту алгоритма для вычисления хеша документа (однонаправленный процесс создания воспроизводимого цифрового «отпечатка» электронного объекта – хеш является глобально-уникальной контрольной суммой электронного объекта – Н.Х.), который затем может быть сохранён в распределённом реестре. Хеш не раскрывает содержимое документа, но позволяет любому, кто имеет доступ к оригинальному объекту, проверить, что его контент не изменился со времени первого хеширования.

Мой комментарий: Такой механизм ничем принципиально не отличается в техническом плане от использования услуг доверенной третьей стороны для получения отметок времени. Разница в том, что вместо известной государственной или частной организации создание отметок времени обеспечивает система, которая (в случае публичных решений типа Bitcoin) может не иметь известного владельца, и участниками которой может быть неопределенный круг, вообще говоря, недоверенных лиц. В зависимости от конкретных обстоятельств, эта особенность может оказаться как полезной, так и вредной.

Рисунок 1. Упрощенная схема процесса, предлагаемого в проекте ARCHANGEL.

Создание и развёртывание подобной системы осложняется ввиду ещё одной проблемы электронной архивации, связанной с изменением электронных форматов. Электронные форматы со временем меняются - создаются новые, старые перестают использоваться, а новое программное обеспечение может больше не поддерживать те форматы, что поддерживались предыдущими версиями. Так, например, некоторые современные видеоплееры не открывают старые видеофайлы, что создаёт фундаментальную проблему для электронных архивистов, стремящихся сохранить документы для будущего.

Для целей этого проекта нам нужно обеспечить, чтобы используемые нами алгоритмы хеширования учитывали то, как архивы решают эту проблему [устаревания форматов – Н.Х.] – говоря коротко, чтобы содержимое хешировалось вне формата. Для некоторых объектов сделать это может быть проще (например, для простых текстовых файлов), но это гораздо более серьезная проблема для, например, видеоформатов. В рамках проекта ARCHANGEL мы будем изучать и создавать прототипы решений для создания хешей с использованием методов машинного обучения, особенно для изображений и видеоконтента, вместо «традиционных» хешей на уровне байтов.

В рамках проекта мы не ограничимся исследованием реализуемости самой технологии; мы также изучим более широкий контекст - например, потребности пользователей и существующие процессы, используемые как архивистами, так и конечными пользователями. В ходе этой работы мы посмотрим, как можно создавать новые жизнеспособные открытые цифровые бизнес-модели, касающиеся целостности архивных материалов, и изучим потенциальные условно-бесплатные модели (freemium), реализуемых с помощью смарт-контрактов.

Мы намерены работать над проектом максимально открыто, например, публикуя весь код прототипа под открытой лицензией по мере его разработки. Мы стремимся взаимодействовать с архивистами и другими сторонами, которых интересует, каким образом данный проект может быть полезен для их собственной работы.

Если вы хотите принять участие в проекте или узнать больше о нём, обращайтесь по адресу research@theodi.org

Джаред Келлер (Jared Robert Keller)

Источник: сайт «Института открытых данных» (The Open Data Institute, ODI)
https://theodi.org/article/blockchains-potential-role-in-the-future-of-archiving/

Комментариев нет:

Отправка комментария