Заметка Дирка фон Суходолеца (Dirk von Suchodoletz) была опубликована 3 января 2012 года на сайте проекта по обеспечению долговременной сохранности электронных материалов Open Planets
Архивы Новой Зеландии и университет Фрайбурга (Freiburg), Германия, осуществляют совместный проект восстановления данных. Архив получил набор 5,25-дюймовых дискет, записанных в начале 1990-х годов и содержащих документы общественной организации, начиная с середины 1980-х. Сведений об этих дискетах немного, и организация хотела бы извлечь с них все читаемые файлы, и получить из этих файлов всю возможную информацию. Для национальных архивов, это прекрасная типовая задача, так как они часто получают объекты спустя довольно длительное время после их создания (20 лет и более). Чтобы иметь возможность считывать на низком уровне потоки бит (raw bit streams) с устаревших дискет, архив приобрел специальное аппаратное устройство, умеющее делать образы флоппи-дисков.
Первый этап: Сохранение потока битов
Группа Архивов Новой Зеландии по обеспечению непрерывного доступа к электронным материалам (digital continuity team) расценила этот проект как отличную возможность продемонстрировать практическое использование устройства Kryoflux и собрать больше информации о том, что нужно сделать для включения его в процессы архивной работы.
Первым этапом работы был визуальный осмотр дискет, с целью установления, по мере возможности, технических метаданных. Дискеты были снабжены ярлыками, идентифицировавшими их как DS QD 96 TPI, что означает двустороннюю запись четырехкратной плотности, с 96 дорожками на дюйм. Привод для чтения 5-дюймовых дискет был подсоединен к устройству KryoFlux, которое, в свою очередь, было связано с современным компьютером на базе Windows x86 с помощью USB-соединения. KryoFlux считывает состояние магнитного поля на дискетах и записывает этот сигнал в файл на компьютере. Поддерживаются различные варианты вывода: в проприетарном формате KryoFluxл, в формате RAW, а также в формате MFM (BTOS/CTOS), и образы дискет были созданы во всех этих форматах.
Помимо физического устройства чтения дискет, ключевым компонентом является интерпретирующее программное обеспечение, преобразующее записанный сигнал в образы дискет, структурированные в соответствии с различными стандартами форматирования. После обработки пары дискет стало ясно, что они не следуют какому-либо из известных стандартов файловой системы, поддерживаемых операционными системами сегодняшнего дня. Таким образом, дискеты невозможно было смонтировать непосредственно в файловой системе базового компьютера и прочитать с них файлы. Их, однако, все же можно было анализировать с помощью редактора 16-ричных кодов. Такой анализ показал, что процесс чтения выдавал осмысленные данные. Несколько "слов", таких, как sysImage.sys, встречались во всех читаемых образах дискет, - по-видимому, в составе структурных данных файловой системы. Результаты поиска в Интернете этой и других характерных строк позволили предположить, что дискеты, скорее всего, были создан на компьютере под управлением операционной системы фирмы Барроуз Текнолоджиз (Burroughs Technologies Operating System, BTOS) или её преемника Convergent Technologies Operating System (CTOS). К счастью, более детальную информацию всё еще можно найти на некоторых сайтах, описывающих эту файловую систему.
Поиски показали, что, помимо оригинального программного обеспечения и его (также устаревших) преемников, в настоящее время нет другого ПО, способного правильно интерпретировать дискеты или образы дискет, отформатированных в этой файловой системе. Поскольку для этой системы нет эмуляторов, то метод эмуляции также использовать не удалось. В итоге на кафедре компьютерных наук Фрейбургского университета была предложена тема бакалаврской диссертации, нацеленная на углубленное изучение вопроса и создание, в конечном итоге, программного приложения для интерпретации содержащейся на дискетах информации, на основе сведений, имеющихся в Интернете.
Второй этап: Создание интерпретатора
Рабочая группа во Фрейбурге по вопросам долговременной сохранности смогла привлечь студента для выполнения задачи написания интерпретатора и ПО для извлечения файлов из образов дискет. Это хорошая проблема для специалиста-компьютерщика, поскольку для её решения требуется знание концепций операционных и файловых систем, которое может быть применено на практике. Поскольку не требуется создание полнофункционального драйвера файловой системы, достаточно было разработать интерпретатор битового потока.
Первый прототип интерпретатора, - поскольку на этой стадии не было требований к производительности, - был написан на скриптовом языке программирования Python, хорошо подходящем для быстрой разработки приложений. К концу года было создано приложение, способное читать заголовки файловой системы и выдавать на их основе списки содержимого директорий. Частичный вывод выглядит следующим образом:
В этом примере блок заголовка тома (volume header block, VHB) дает ошибку при подсчете контрольной суммы, однако правильные блок заголовков файлов (File Header Block) позволяют прочитать простую структуру директории. Выдача представляется правильный, поскольку в ней присутствуют имена таких файлов, как sysImage.sys, которые были видны и в 16-ричном редакторе. По этой выдаче определенная информация может быть получена из самих имен файлов.
Следующим этапом будет реализация функциональной возможности извлечения файлов, позволяющий выделить отдельные файлы из образа диска и сбросить все файлы, имеющиеся в образе диска, в какую-нибудь папку на базовом компьютере. Тогда можно будет провести дальнейшее изучение файлов, чтобы собрать больше сведений об их первоначальном назначении.
Дирк фон Суходолец (Dirk von Suchodoletz)
Источник: сайт Open Planets Foundation
http://www.openplanetsfoundation.org/node/780
Архивы Новой Зеландии и университет Фрайбурга (Freiburg), Германия, осуществляют совместный проект восстановления данных. Архив получил набор 5,25-дюймовых дискет, записанных в начале 1990-х годов и содержащих документы общественной организации, начиная с середины 1980-х. Сведений об этих дискетах немного, и организация хотела бы извлечь с них все читаемые файлы, и получить из этих файлов всю возможную информацию. Для национальных архивов, это прекрасная типовая задача, так как они часто получают объекты спустя довольно длительное время после их создания (20 лет и более). Чтобы иметь возможность считывать на низком уровне потоки бит (raw bit streams) с устаревших дискет, архив приобрел специальное аппаратное устройство, умеющее делать образы флоппи-дисков.
Первый этап: Сохранение потока битов
Группа Архивов Новой Зеландии по обеспечению непрерывного доступа к электронным материалам (digital continuity team) расценила этот проект как отличную возможность продемонстрировать практическое использование устройства Kryoflux и собрать больше информации о том, что нужно сделать для включения его в процессы архивной работы.
Первым этапом работы был визуальный осмотр дискет, с целью установления, по мере возможности, технических метаданных. Дискеты были снабжены ярлыками, идентифицировавшими их как DS QD 96 TPI, что означает двустороннюю запись четырехкратной плотности, с 96 дорожками на дюйм. Привод для чтения 5-дюймовых дискет был подсоединен к устройству KryoFlux, которое, в свою очередь, было связано с современным компьютером на базе Windows x86 с помощью USB-соединения. KryoFlux считывает состояние магнитного поля на дискетах и записывает этот сигнал в файл на компьютере. Поддерживаются различные варианты вывода: в проприетарном формате KryoFluxл, в формате RAW, а также в формате MFM (BTOS/CTOS), и образы дискет были созданы во всех этих форматах.
Помимо физического устройства чтения дискет, ключевым компонентом является интерпретирующее программное обеспечение, преобразующее записанный сигнал в образы дискет, структурированные в соответствии с различными стандартами форматирования. После обработки пары дискет стало ясно, что они не следуют какому-либо из известных стандартов файловой системы, поддерживаемых операционными системами сегодняшнего дня. Таким образом, дискеты невозможно было смонтировать непосредственно в файловой системе базового компьютера и прочитать с них файлы. Их, однако, все же можно было анализировать с помощью редактора 16-ричных кодов. Такой анализ показал, что процесс чтения выдавал осмысленные данные. Несколько "слов", таких, как sysImage.sys, встречались во всех читаемых образах дискет, - по-видимому, в составе структурных данных файловой системы. Результаты поиска в Интернете этой и других характерных строк позволили предположить, что дискеты, скорее всего, были создан на компьютере под управлением операционной системы фирмы Барроуз Текнолоджиз (Burroughs Technologies Operating System, BTOS) или её преемника Convergent Technologies Operating System (CTOS). К счастью, более детальную информацию всё еще можно найти на некоторых сайтах, описывающих эту файловую систему.
Поиски показали, что, помимо оригинального программного обеспечения и его (также устаревших) преемников, в настоящее время нет другого ПО, способного правильно интерпретировать дискеты или образы дискет, отформатированных в этой файловой системе. Поскольку для этой системы нет эмуляторов, то метод эмуляции также использовать не удалось. В итоге на кафедре компьютерных наук Фрейбургского университета была предложена тема бакалаврской диссертации, нацеленная на углубленное изучение вопроса и создание, в конечном итоге, программного приложения для интерпретации содержащейся на дискетах информации, на основе сведений, имеющихся в Интернете.
Второй этап: Создание интерпретатора
Рабочая группа во Фрейбурге по вопросам долговременной сохранности смогла привлечь студента для выполнения задачи написания интерпретатора и ПО для извлечения файлов из образов дискет. Это хорошая проблема для специалиста-компьютерщика, поскольку для её решения требуется знание концепций операционных и файловых систем, которое может быть применено на практике. Поскольку не требуется создание полнофункционального драйвера файловой системы, достаточно было разработать интерпретатор битового потока.
Первый прототип интерпретатора, - поскольку на этой стадии не было требований к производительности, - был написан на скриптовом языке программирования Python, хорошо подходящем для быстрой разработки приложений. К концу года было создано приложение, способное читать заголовки файловой системы и выдавать на их основе списки содержимого директорий. Частичный вывод выглядит следующим образом:
В этом примере блок заголовка тома (volume header block, VHB) дает ошибку при подсчете контрольной суммы, однако правильные блок заголовков файлов (File Header Block) позволяют прочитать простую структуру директории. Выдача представляется правильный, поскольку в ней присутствуют имена таких файлов, как sysImage.sys, которые были видны и в 16-ричном редакторе. По этой выдаче определенная информация может быть получена из самих имен файлов.
Следующим этапом будет реализация функциональной возможности извлечения файлов, позволяющий выделить отдельные файлы из образа диска и сбросить все файлы, имеющиеся в образе диска, в какую-нибудь папку на базовом компьютере. Тогда можно будет провести дальнейшее изучение файлов, чтобы собрать больше сведений об их первоначальном назначении.
Дирк фон Суходолец (Dirk von Suchodoletz)
Источник: сайт Open Planets Foundation
http://www.openplanetsfoundation.org/node/780
Комментариев нет:
Отправить комментарий