среда, 21 августа 2013 г.

Миграция деловых систем в электронные архивы, часть II


(Продолжение, начало см. http://rusrim.blogspot.ru/2013/08/i.html )

Пример сценария преобразования деловой системы

У Управления образовательных услуг (Office of Teacher Services) имеется унаследованная «операционная система «Учитель»» (Teacher Operating System, TOS), состоящая из двух частей:
  • «Реестр учителей» (Registry of Teachers), представляющий собой систему для регистрации информации об учителях (такой, как, ФИО, дата рождения, квалификация и места преподавания). Это проприетарная база данных, имеющая специализированный пользовательский интерфейс (для ввода данных о персонале Управления) и веб-интерфейс для учителей и школ, позволяющий посматривать сводные данные. Ключевыми в базе данных являются таблицы «учитель» и «школа»; и

  • «Документы учителя» (Teacher Docs)- система, в которой хранятся оцифрованные версии документов, относящихся к карьере учителя (например, заявления о принятии на работу, ежегодные оценки качества работы, чеки за работу с детьми и т. д.). Она включает проприетарную базу данных с метаданными о документах, а также 4,2 миллиона графических образов в SAN-хранилище.
Управления образовательных услуг недавно перешло на использование располагающейся в облаке реализации MS SharePoint под названием «Учителя онлайн» (Teachers Online), и сообщило о желании передать нам TOS как электронные архивные документы штата.

Примечание: Как показывает данный сценарий, проблема заключается не только о «обеспечении долговременной сохранности баз данных». В этом примере две базы данных являются компонентами более крупных систем в рамках единой деловой системы.

Представляем пользователей
Сотрудник государственного органа: «Мне только что позвонили из юридической фирмы. Они запрашивают полное дело на учителя, включающее данные из реестра и все взаимосвязанные документы. Мне всё это нужно сегодня.»

Сотрудник службы ИТ-поддержки государственного органа: «Мы, кажется, получаем намного больше запросов, касающихся этих архивным данным, чем ожидали! Мне хотелось бы включить возможности поиска по этим унаследованным данным в нашу новую систему «Учителя онлайн»; какой интерфейс прикладного программирования (API) Вы, ребята, предлагаете? Также наш исполнительный директор запрашивает некоторые сведения для годового отчета. Можем ли мы получить данные о числе учителей с разбивкой по школьным округам? Пока!»

Представитель общественности: «Я ищу сведения о члене семьи, которая, предположительно, работала учителем в Новом Южном Уэльсе. Я хотела бы, если это возможно, посмотреть ее «дело». Я набираю «Салли Адамс» в Вашей машине поиска... Могу ли я просто щелкнуть мышью по полученному результату? Я прилично владею компьютером ... Знаю, как использовать Word, электронную почту и Google ..., но я не эксперт.»

Ученый-«электронный гуманитарий»/разработчик: «Искать отдельные документы? Мы что, в ХХ веке живём? Я хочу получить доступ к первичным данным, которые смогу использовать для визуализации уровня финансирования государственной школьной системы на протяжении двадцатого века.»
Стратегии миграции операционной системы «Учитель» (TOS)

1. Статические отчеты

Группа электронного архива Управления государственных документов штата Новый Южный Уэльс проанализировала TOS и определила, что та выполняла одну главную задачу: управляла регистрацией учителей в Новом Южном Уэльсе. Исходя из этого, группа решила, что созданные по содержащимся в базе данным статические отчеты будут давать адекватное представление о системе, и экспортировала ряд отчетов в формате PDF, суммирующих сведения о карьере каждого учителя. Взаимосвязанные документы из подсистемы «Документы Учителя» были сохранены вместе с соответствующими PDF-отчетами в ZIP-архивах, при этом взаимосвязи были зафиксированы в файлах метаданных в формате XML.

Что думают наши пользователи об этом подходе?
Сотрудник государственного органа: «Спасибо за присланный по электронной ZIP-файл. Там есть всё, что мне нужно, и я могу сразу переслать его нашему специалисту по правовым вопросам. Нам нужно всё передать в государственный электронный архив!»

Сотрудник службы ИТ-поддержки государственного органа:  «Мне понравилось, что в Вашем каталоге ( http://search.records.nsw.gov.au/ ) есть ссылка на API-интерфейс, который я могу интегрировать с нашей системой. Я смог разработать для системы «Учителя онлайн» неплохой маленький поисковый виджет, который ищет дела учителей и извлекает эти ZIP-файлы. Но я не очень-то доволен тем, что Вы сделали с нашими старыми базами данных. Уж не знаю, как мне теперь создавать нужные мне отчеты. Думаю, я мог бы написать скрипт для извлечения информации обратно из PDF-файлов, но на это мне понадобятся недели.»

Представитель общественности: «Отлично, спасибо! У меня не было проблем с открытием ZIP-файла, PDF-файл о Салли содержит много полезной информации, и просто замечательно было увидеть копии оригинальных документов.»

Ученый-«электронный гуманитарий»/разработчик:  «Я мало что могу сделать с PDF-файлами. Посмотрю, что мне удастся найти в других местах :(»

2. XML-нормализации баз данных

Группа электронного архива Управления государственных документов штата Новый Южный Уэльс проанализировала TOS и определила, что та состояла из двух баз данных и большой набора файлов. Группа использовала специальное программное обеспечение  (SIARD) для длительного сохранения баз данных, разработанное Национальными Архивами Швейцарии, для преобразования двух баз данных в XML-файлы. Важной особенностью формата SIARD является то, что он допускает обратное преобразование (XML-файла в формате SIARD обратно в базу данных).

Затем группа использовала приложение Xena для обработки графических образов документов и создания для них индивидуальных нормализованных XML-контейнеров, содержащих графические образы.

Что думают наши пользователи об этом подходе?
Сотрудник государственного органа: «Спасибо за присланные файлы с расширением .xena. Теперь подскажите, пожалуйста, что мне с ними делать? Мой ИТ-отдел не слышало таком формате. А информация из реестра учителей тоже есть в этих файлах?»

Сотрудник службы ИТ-поддержки государственного органа:  «Мне удалось написать поисковый виджет, но наши сотрудники жалуются на формат выдаваемых результатов (какая-то вариация XML?). Спасибо, что указали мне на XML-версию базы данных. Я прочел документацию по SIARD и смог восстановить базу данных, а затем создать нужный отчет.»

Представитель общественности: «Я набрала «Салли Адамс» в машине поиска и получила несколько файлов в формате .xena. После долгой возни и поиска в Google, я поняла, как можно извлечь некоторые первоначальные «файлы». Думаю, это всё?»

Ученый-«электронный гуманитарий»/разработчик: «Эти XML файлы были огромными и на их скачивание ушли часы, но мне удалось конвертировать их обратно в базу данных, и теперь я могу приступить к работе ....»

(Окончание следует, см. http://rusrim.blogspot.ru/2013/08/iii.html )

Ричард Лехейн (Richard Lehane)

Источник: сайт Управления государственных документов штата Новый Южный Уэльс
http://futureproof.records.nsw.gov.au/migrating-business-systems-to-the-digital-archives-a-post-from-the-digital-archives-team/

Комментариев нет:

Отправка комментария