четверг, 17 ноября 2016 г.

О докладе «Следуем ли нам всё хранить вечно? Определение долговременной ценности научных данных»


Заметка Криса Эриксона (Chris Erickson – на фото) из университета им. Брайама Янга (Brigham Young University) была опубликована 2 ноября 2016 года на блоге «Долговременная сохранность имеет значение» (Digital Preservation Matters, http://preservationmatters.blogspot.com/ ).

Ссылка: Бетани Андерсон (Bethany Anderson) и др. « Следуем ли нам всё хранить вечно? Определение долговременной ценности научных данных» (Should We Keep Everything Forever?: Determining Long-Term Value of Research Data), Труды конференции iPres 2016, стр. 284-285/страница 143 PDF-файла, стендовый доклад, см. https://ipr16.organizers-congress.org/frontend/organizers/media/iPRES2016/_PDF/IPR16.Proceedings_4_Web_Broschuere_Link.pdf

В стендовом докладе описываются усилия учреждения (Университета Иллинойса в Убрана-Шампейн – Н.Х.) по запуску ведомственного хранилища данных под названием «Банк данных Иллинойса» (Illinois Data Bank). Служба управления научными данными университета (Research Data Service, доклад подготовлен именно её представителями – Н.Х.) ставит свое целью обеспечение долговременной сохранности и доступа к опубликованным научным наборам данных в течение как минимум пяти лет после даты публикации в Банке данных.

В рамках анализа деятельности по обеспечению долговременной сохранности были подготовлены процессы и руководства по проведению экспертизы ценности наборов данных, которые помогут отыскивать и использовать открытые научные данные. Авторы предлагают решение для обеспечения сохранности и доступа, которому исследователи смогут доверять.

Предлагаемая концепция включает руководства и процессы анализа опубликованных наборов данных по истечении пятилетнего периода гарантированного хранения, с целью принятия решения об их дальнейшем сохранении либо исключении из состава фондов. Такой систематический подход к экспертизе ценности помогает определить долгосрочную актуальность набора данных, его ценность для научных сообществ и его пригодность для долговременной сохранности.

В руководстве по проведению экспертизы материалов Банка данных Иллинойса содержатся следующие рекомендации:

Кураторы, библиотекари и архивисты оценивают следующие факторы:
  • Стоимость хранения: оценка расходов на продолжение хранения;

  • Стоимость обеспечения сохранности: оценка расходов на продолжение или расширение работ по обеспечению долговременной сохранности;

  • Доступ: используются показатели, отражающие интерес к конкретному набору данных;

  • Цитирование: цитировался ли набор данных в каких-либо публикациях;

  • Ограничения: имеются ли ограничения на доступ или повторное использование.
Специалисты предметной области оценивают следующие факторы:
  • Возможность воссоздания набора данных;

  • Стоимость воссоздания набора данных;

  • Влияние выполненного исследования: оказало ли изучение данного набора данных существенное влияние на исследования;

  • Уникальность соответствующего исследования;

  • Качество исследования;

  • Качество набора данных;

  • Текущая актуальность для современных научных вопросов.
Кураторы, библиотекари и архивисты вместе со специалистами предметной области оценивают следующие факторы:
  • Наличие других копий;

  • Понятность: являются ли метаданные и документация достаточными для доступа / повторного использования?

  • Зависимости: Какова зависимость от программного обеспечение и прочих внешних факторов?

  • Соответствие целям и задачам хранилища: Нет ли более подходящего хранилища для конкретного набора данных?
Крис Эриксон (Chris Erickson)

Мой комментарий: По-моему, это достаточно прагматичный, кратко и четко сформулированный подход к экспертизе ценности наборов и баз данных. Кстати говоря, чего в нем явно недостает, так это исторической составляющей – имеет смысл выборочно отбирать на архивное хранение как «типовые» наборы данных и связанную с ними документацию, которые отражают распространенные методы исследования (и, возможно, даже их недочёты); так и наборы данных, связанные с деятельностью выдающихся учёных.

В «экономическом» блоке факторов недостает (наверное, ввиду того, что это программа открытых данных) вопроса о возможности монетизировать набор данных.

Я бы также рекомендовала оценить ценность набора данных в качества свидетельства / доказательства, если он каким-либо образом отражает деловую деятельность того или иного государственного органа или коммерческой организации, либо права и обязанности лиц и организаций.

Источник: блог Digital Preservation Matters
http://preservationmatters.blogspot.ru/2016/11/should-we-keep-everything-forever.html

Комментариев нет:

Отправить комментарий