19 декабря 2023 года на сайте Zenodo была выложена презентация на английском языке руководителя отдела архивного права архива земли Баден-Вюртемберг (Landesarchiv Baden Württemberg, Германия) д-ра Кайла Наумана (Kail Naumann – на фото) к докладу, сделанному им 15 ноября 2023 года по теме «Обеспечение сохранности баз данных для будущего» (Preserving databases for the future).
Презентацию (27 слайдов) можно как просматривать онлайн ( https://zenodo.org/records/10405758 ), так и скачать в виде PDF-файла ( https://zenodo.org/records/10405758/files/Naumann_DB%20Archiving_04_slideshare.pdf?download=1 ).
В аннотации автор отмечает: «Эти слайды были подготовлены для международной аудитории, перед которой я выступал в ноябре 2023 года. Они отражают текущее состояние темы архивирования баз данных, над которой я работаю с 2020 года.»
- Объём хранения баз данных в архиве земли Баден-Вюртемберг в настоящее время составляет около 300 миллионов строк (слайд 2).
- Архив ставит перед собой задачу обеспечить сохранность и пригодность к использованию в 2080 (!) году 125 баз данных различного происхождения (слайд 3). При этом в течение последующих 60 лет публичная доступность баз данных не предусматривается, и архив не хочет нести каких-либо иных расходов, помимо расходов на хранение.
- В качестве примера приведена история данных переписи населения Баден-Вюртемберга 1961. Данные на перфокартах обрабатывались на компьютерах IBM. В 1968 году из-за затопления 6 млн. перфокарт с первичными данными были утрачены, уцелели лишь 1,6 млн. перфокарт с агрегированными данными. Несколько раз проводилась миграция: в 1960-х годах – на магнитные ленты, с преобразованием кодировки; в 1990-х годах – на CD-ROM диски. В 2006 году материалы были переданы на архивное хранение (слайд 5). Автор спрашивает: «Сможем ли мы в предстоящие 60 лет лучше обеспечивать сохранность данных?».
- На слайде 6 можно найти ряд гиперссылок на интересные материалы по вопросу обеспечения долговременной сохранности баз данных - в частности, на материалы проведенного в октябре 2021 года семинара «Сохранение баз данных до 2080 года – Обеспечение сохранности контента баз данных в долговременной перспективе» (Databases for 2080 – Preserving database content for the long term), см. https://www.landesarchiv-bw.de/de/aktuelles/termine/72973 (есть видеозапись: https://www.youtube.com/watch?v=Ta1XXS1UZ48 ).
- Формат SIARD для реляционных баз данных был разработан в начале века, он является кандидатом в европейские стандарты. К настоящему времени 3 решения позволяют создавать SIARD-файлы: это DBPTK, SIARD Suite, Spectral Core Full Convert (слайд 17). Также отмечается довольно большая популярность компактной встраиваемой СУБД SQLite.
- Общеотраслевой формат хранения баз данных пока так и не появился. С учётом появления носителей информации с более длительным сроком службы и развитие технологий эмуляции, предполагается, что снизится острота потребности в миграции старых форматов (слайд 18).
Источник: сайт Zenodo
https://zenodo.org/records/10405758
https://zenodo.org/records/10405758/files/Naumann_DB%20Archiving_04_slideshare.pdf?download=1
Комментариев нет:
Отправить комментарий