четверг, 3 сентября 2015 г.

США: Где ученым следует держать свои данные?


Заметка директора по научному развитию Университета Род-Айленда (University of Rhode Island) Карен Маркин (Karen M. Markin) была опубликована 23 июня 2015 года в издании «Хроники высшего образования» (Chronicle of higher education)

Федеральные органы, занимающиеся выдачей грантов, начали, наконец, выпускать официальные политики по вопросам хранению информации.

Выдающие гранты федеральные органы уже давали понять, что подаваемые запросы на гранты должны включать планы по предоставлению другим ученым доступа к научно-исследовательским данным. До сих пор не было, однако, ясности с тем, как и где исследователи должны хранить свои данные, в составе которых могут быть, например, и конфиденциальная персональная медицинская информация, и колоссальные массивы полученных со спутников изображений.

Фото: Roy Niswanger

В прошлом исследователи должны были сами заботиться о себе. Хотя ключевые органы финансирования научной деятельности уже ряд лет выставляли требования о возможности совместного использования данных, университеты не спешат помогать ведущим исследователям в выполнении этих обязательств. В результате многие держат данные на личных жестких дисках и самостоятельно отвечают на запросы.

Хорошей новостью является то, что федеральные органы начинают выпускать официальные политики – включающие рекомендации по хранению. Плохая новость заключается в том, что в случае невыполнения требований новых политик можно лишиться возможности получения дополнительный денег по гранту.

Исследователи обычно не слишком охотно делились данными, опасаясь злоупотреблений либо боясь утратить собственные конкурентные преимущества в научной работе. В 2003 году, стремясь максимизировать использование собранных на государственные деньги данных, Национальные институты здравоохранения (National Institutes of Health, NIH) потребовали, чтобы каждое крупное предложение о финансировании включало в себя план по обмену данными. Их примеру в 2011 году последовал Национальный научный фонд (National Science Foundation, NSF), сделав планы управления данными обязательной частью всех заявок. Большое толчок был дан в 2013 году, когда Управление Белого дома по вопросам науки и технической политики (Office of Science and Technology Policy) распорядилось, чтобы все федеральные органы исполнительной власти, тратящие на научные исследования более 100 миллионов долларов в год, разработали планы обеспечения публичной доступности полученных данных (см. https://www.whitehouse.gov/blog/2013/02/22/expanding-public-access-results-federally-funded-research ).

Мало кто будет спорить с идеей сделать собранные на деньги налогоплательщиков данные широко доступными для научного анализа, однако многих исследователей раздражает необходимость составления планов управления данными, представляющих собой ещё один административный компонент в и без того забюрократизированном процессе подачи заявок на гранты.

К счастью, директива Белого дома описывает элементы, которые должны быть включены во все политики обеспечения публичного доступа, и настоятельно призывает все федеральные органы исполнительной власти сделать такие политики совместимыми друг с другом. Политики применимы к научным данным в электронном формате, но не к лабораторным образцам и иным физическим объектам. Также из области охвата политик исключаются лабораторные журналы, данные предварительных анализов и аналогичные рабочие материалы.

Федеральные органы учитывают качество плана управления данными в составе заявки в ходе её оценки, что является мощным стимулом для ученых приложить серьезные усилия к разработке такого плана. Федеральные политики позволяют исследователям выделять часть полученных по гранту средств на управление и хранение данных.

Не все политики федеральных органов точно указывают, когда полученные в рамках работ по гранту научные данные должна стать публично доступными. Некоторые политики увязывают этот момент со временем публикации итоговой научной статьи, чтобы из исследователей преждевременно не «выдаивались» их собственные данные.

Руководители программ финансирования несут ответственность за отслеживание выполнения получателями грантов их обязательств по обеспечению коллективного использования данных. Для этого используется «кнут»: не исполняющие требований исследователи могут лишиться финансирования. Ведущим исследователям настоятельно рекомендуется размещать свои данные в существующих общедоступных электронных хранилищах. NIH составили в помощь исследователям список таких хранилищ, который планируется расширить. NSF направляет исследователей в конкретные хранилища океанографических и климатических данных.

Некоторые федеральные органы разрабатывают шаблоны, помогающие заявителям написать приемлемый план управления данными. У других имеются контрольные списки элементов, которые должны быть включены в такие планы. Исследователи должны быть бдительны: несмотря на требуемую сверху схожесть, в требованиях к планам разных органов (а иногда и различных департаментов одного органа) имеются различия, и необходимо убедиться в том, что при подготовке плана используются «правильные» руководства. Например, некоторые подразделения NSF требуют предоставления доступа только к электронным данным, в то время, как отделение океанологии NSF требует предоставления доступа также к взятым пробам.

Конечно же, некоторые данные не подлежат публичному раскрытию. Обязательные требования распространяются только на несекретные исследования, и это позволяет федеральным органам учитывать вопросы конфиденциальности и неприкосновенности частной жизни (например, в рамках биомедицинских исследований), а также имущественные интересы и права интеллектуальной собственности.

В то же время, появилась помощь и для раздраженных следователей, которые не могут найти подходящий шаблон федерального органа. Располагающийся на сайт университета Калифорнии свободно доступный ресурс «DMP Tool» (Data Management Planning Tool - «Инструмент планирования управления данными», https://dmptool.org/ ) позволяет в интерактивном режиме пройти этапы подготовки плана управления данными для более чем десятка выдающих гранты организаций. Для его использования нужно создать учетную запись, но инструмент можно использовать даже в том случае, если Ваш университет не является учреждением-партнером. Инструмент предлагает ввести информацию, необходимую для заполнения плана. Что он не делает, так это не дает рекомендаций о том, как выбирать формат, хранить, распространять и обеспечивать долговременную сохранность данных. В этих вопросах Вам, возможно, сможет помочь Ваша университетская библиотека.

Попробуйте начать с веб-сайта библиотеки Вашего кампуса. У многих библиотек есть специальная страница, содержащая связанные с научными исследованиями руководства и рекомендации по различным вопросам, в том числе по подготовке планов управления данными. Поищите на сайте Вашей университетской библиотеки «план управления данными» и посмотрите, что будет найдено. По моему опыту, эти страницы могут быть полезными, но их порой непросто отыскать. Если Вы не можете сами найти нужную веб-страницу, обратитесь к сотруднику справочной группы библиотеки.

Подобная страница, вероятно, будет содержать руководство «для начинающих» по планам управления данными, ссылки на требования выдающих гранты учреждений, а также ссылки на хранилища данных по различным научным дисциплинам. Там же может найтись ценная информация о той поддержке, которую Ваше учреждение предоставляет для написания плана управления данными и для форматирования, хранения, распространения и обеспечения долговременной сохранности данных.

Многие библиотеки играют ведущую роль в этих усилиях. Для неспециалистов хранение и подготовка данных могут быстро стать проблемой, и полезно иметь под рукой кого-то знающего, кто сможет провести Вас через все тонкости наименования и форматирования данных для облегчения доступа к ним других заинтересованных лиц. Федеральные органы планируют ввести стандарты для этих так называемых «метаданных».

Исследователи также могут самостоятельно поизучать хранилища данных. Два места, с которых стоит начать, это справочники Open Access Directory ( http://oad.simmons.edu/oadwiki/Data_repositories ) и Re3data.org ( http://www.re3data.org/ ). их перечислены сотни хранилищ данных из разных областей знаний, от истории искусства до зоологии.

Тем исследователям, у которых до сих пор вызывает отторжение дополнительная работа, связанная с обеспечением коллективного использования данных, следует смотреть на неё как на способ повышения своей репутации и репутации своего учреждения в научном сообществе. Вы выигрываете в престиже, когда люди начинают использовать составленные Вами наборы данных. Подготовку набора данных также можно подать как элемент ожидаемой отдачи, которую нужно описать в заявке на грант. В будущих заявках Вы сможете в своей биографии упомянуть такие наборы данных как научный продукт.

Карен Маркин (Karen M. Markin)

Сайт издания «Хроники высшего образования» (Chronicle of higher education)
http://chronicle.com/article/Where-Should-You-Keep-Your/231065/ 

Комментариев нет:

Отправить комментарий