четверг, 22 августа 2013 г.

Миграция деловых систем в электронные архивы, часть III


(Окончание, предыдущую часть см. http://rusrim.blogspot.ru/2013/08/ii.html )

3.RDF/XML нормализация баз данных

Посмотрев видеозапись вдохновляющей лекции Тима Бернерса-Ли (Tim Berners-Lee) на TED-конференции ( http://www.youtube.com/watch?v=OM6XIICm_qo  ; американская некоммерческая организация TED (от Technology, Entertainment, Design – «Технология, развлечение, проектирование», http://www.ted.com ), которая занимается распространением новых идей и организацией соответствующих конференций – Н.Х. ) группа электронной миграции решила мигрировать всю систему TOS целиком в виде взаимосвязанных данных (linked data).

Команда создала на языке R2RML (язык отображения реляционных баз данных в формат RDF, см.  http://www.w3.org/TR/r2rml/ ) отображения для преобразования баз данных Oracle в формат RDF, котором были сохранены в виде текстовых файлов RDF/XML. RDF был также использован для сохранения метаданных, описывающих связи между информацией в реестре и графическими образами документов.

Что думают наши пользователи об этом подходе?

Сотрудник государственного органа:  «Спасибо, что прислали графические образы документов. Я понимаю эти RDF/XML-файлы содержат информацию из реестра, но у меня возникают проблемы с их просмотром. Можете ли Вы чем-нибудь помочь?»

Сотрудник службы ИТ-поддержки государственного органа: «Поисковый виджет сделан! Я не очень хорошо знаком со «взаимосвязанными данными», но я кое-что поизучал и понял, как можно использовать Вашу службу запросов SPARQL для создания нужных мне запросов. Хорошая работа!»

Представитель общественности: «Я нашла несколько документов, которые оказались очень полезными. Что делать с этими RD ..(как его там?) материалами я понятия не имела ... так что я их просто проигнорировала.»


Ученый-«электронный гуманитарий»/разработчик: «Взаимосвязанные данные, RDF, SPARQL – всё, что только можно было пожелать!»


4. Миграция баз данных в СУБД SQLITE

После анализа TOS-системы, группа по электронной миграции решила, что наилучшим способом сохранения целостности системы будет сохранение реляционных данных в реляционной базе данных; а также сохранение взаимосвязей между этими данными и графическими образами документов. Так как электронный архив не в состоянии поддерживать оригинальные проприетарные СУБД, то группа решила перенести данные в СУБД SQLITE (общедоступное программное обеспечение, которое записывает базу данных в один файл для удобства хранения, http://www.sqlite.org/ ). Графические образы документов были сохранены отдельно на диске. Там же были сохранены и метаданные в соответствующих RDF/XML-файлах.

Что думают наши пользователи об этом подходе?
Сотрудник государственного органа:  «Спасибо за графические образы документов. Я заметил, что вы сохранили данные реестра в реляционной базе данных, и я попрошу нашу ИТ-поддержку выполнить по ней запросы, спасибо!»

Сотрудник службы ИТ-поддержки государственного органа: «Всё отлично, спасибо! Я по большей части смог повторно использовать наши старые SQL-запросы для создания отчетов, которые мне были нужны для нашего годового отчета.»

Представитель общественности: «Я нашла несколько документов, которые оказались очень полезными. Не знала, что делать с этой базой данных, так что я просто проигнорировали её.»

Ученый-«электронный гуманитарий»/разработчик: «SQL: Как-то очень традиционно :), но я могу работать с ним»


Дорогу осилит идущий

Мой комментарий: в оригинале этот подраздел назван «Берясь за крапиву» (Grasping the nettle)  - в английском языке эта идиома означает браться за тяжёлую, неприятную, но нужную работу. – Н.Х.

Как показывает этот сценарий, найти практичные решения, которые подошли бы для всех потенциальных вариантов использования деловых систем, построенных на основе баз данных, нелегко. Нам придется выбирать, и этот выбор в некоторых случаях может разочаровать пользователей. Мы собираемся снизить этот риск, сохраняя, по мере возможности, первоначальные файлы вместе с преобразованной системой, однако вследствие морального устаревания программного обеспечения мы не сможем гарантировать постоянную доступность первоначальных файлов. Как говорит Крис Херли (Chris Hurley), в «электронном мире» нельзя избежать выборочности:
«В доэлектронном мире мы привыкли находить какие-либо особенности (singularity) и сохранять их нетронутыми в качестве свидетельства прошлых событий. В электронном мире мы не навязываем множественность, но это то, что мы получим; и умножение представлений (не дублирование данных) может еще долго продолжаться после того момента, когда в доэлектронном мире такие данные уже были бы отправлены, в защищённом от изменений виде, на архивное хранение и долговременное сохранение.

Такая множественность (multiplication) является результатом совместного использования данных и разнообразия их применения (повторного использования). Согласно классической теории, особенность в неизменённом виде доставлялась нам в процессе передачи для дальнейшего сохранения и объяснения, и мы выбирали, какую часть её сохранить.

С переосмысленной точки зрения, происходит всё то же самое, но особенность поступает в виде возможностей, среди которых мы должны выбрать те, которые обеспечивают как документирование, так и долговременную сохранность (в полной мере учитывая способы фактического использования данных) и поддерживают  повторное использование данных, следствием которого может стать новая дополнительная структуризация, которой первоначально не было.»

Крис Херли «Охота на Снарка (В поисках электронных «серий» документов)» (The Hunting of the Snark (Looking for Digital “Series”)), 2011 г., стр.13, http://www.descriptionguy.com/images/WEBSITE/hunting-of-the-snark-search-for-digital-series.pdf
Позитивной стороной этой картины, как показывает цитата из Криса, является то, что если мы будем хорошо делать свою работу, то при преобразовании электронных документных систем у нас будет возможность не только поддержания мигрированных деловых систем в качестве аутентичных документов, но и открытия этих систем с тем, чтобы сделать реальностью новые формы использования, которые были невозможны в оригинальных вариантах этих систем.

Ричард Лехейн (Richard Lehane)

Источник: сайт Управления государственных документов штата Новый Южный Уэльс
http://futureproof.records.nsw.gov.au/migrating-business-systems-to-the-digital-archives-a-post-from-the-digital-archives-team/

Комментариев нет:

Отправить комментарий