четверг, 1 февраля 2024 г.

Презентация Кайла Наумана «Обеспечение сохранности баз данных для будущего»

19 декабря 2023 года на сайте Zenodo была выложена презентация на английском языке руководителя отдела архивного права архива земли Баден-Вюртемберг (Landesarchiv Baden Württemberg, Германия) д-ра Кайла Наумана (Kail Naumann – на фото) к докладу, сделанному им 15 ноября 2023 года по теме «Обеспечение сохранности баз данных для будущего» (Preserving databases for the future).

Презентацию (27 слайдов) можно как просматривать онлайн ( https://zenodo.org/records/10405758 ), так и скачать в виде PDF-файла ( https://zenodo.org/records/10405758/files/Naumann_DB%20Archiving_04_slideshare.pdf?download=1 ).

В аннотации автор отмечает: «Эти слайды были подготовлены для международной аудитории, перед которой я выступал в ноябре 2023 года. Они отражают текущее состояние темы архивирования баз данных, над которой я работаю с 2020 года.»

«Изюминки», на которые я обратила внимание, просматривая презентацию:

  • Объём хранения баз данных в архиве земли Баден-Вюртемберг в настоящее время составляет около 300 миллионов строк (слайд 2).

  • Архив ставит перед собой задачу обеспечить сохранность и пригодность к использованию в 2080 (!) году 125 баз данных различного происхождения (слайд 3). При этом в течение последующих 60 лет публичная доступность баз данных не предусматривается, и архив не хочет нести каких-либо иных расходов, помимо расходов на хранение.

  • В качестве примера приведена история данных переписи населения Баден-Вюртемберга 1961. Данные на перфокартах обрабатывались на компьютерах IBM. В 1968 году из-за затопления 6 млн. перфокарт с первичными данными были утрачены, уцелели лишь 1,6 млн. перфокарт с агрегированными данными. Несколько раз проводилась миграция: в 1960-х годах – на магнитные ленты, с преобразованием кодировки; в 1990-х годах – на CD-ROM диски. В 2006 году материалы были переданы на архивное хранение (слайд 5). Автор спрашивает: «Сможем ли мы в предстоящие 60 лет лучше обеспечивать сохранность данных?».

  • На слайде 6 можно найти ряд гиперссылок на интересные материалы по вопросу обеспечения долговременной сохранности баз данных - в частности, на материалы проведенного в октябре 2021 года семинара «Сохранение баз данных до 2080 года – Обеспечение сохранности контента баз данных в долговременной перспективе» (Databases for 2080 – Preserving database content for the long term), см. https://www.landesarchiv-bw.de/de/aktuelles/termine/72973 (есть видеозапись: https://www.youtube.com/watch?v=Ta1XXS1UZ48 ).

  • Формат SIARD для реляционных баз данных был разработан в начале века, он является кандидатом в европейские стандарты. К настоящему времени 3 решения позволяют создавать SIARD-файлы: это DBPTK, SIARD Suite, Spectral Core Full Convert (слайд 17). Также отмечается довольно большая популярность компактной встраиваемой СУБД SQLite.

  • Общеотраслевой формат хранения баз данных пока так и не появился. С учётом появления носителей информации с более длительным сроком службы и развитие технологий эмуляции, предполагается, что снизится острота потребности в миграции старых форматов (слайд 18).

Источник: сайт Zenodo
https://zenodo.org/records/10405758
https://zenodo.org/records/10405758/files/Naumann_DB%20Archiving_04_slideshare.pdf?download=1

Комментариев нет:

Отправить комментарий