Данный пост бельгийской консалтинговой компании Phoenx был опубликован 12 марта 2026 года в социальной сети LinkedIn.
В сфере медико-биологических наук наблюдается беспрецедентный взрывной рост объёма данных. От высокопроизводительного геномного секвенирования и медицинской визуализации высокого разрешения до децентрализованных клинических испытаний и электронных медицинских документов - объём и сложность генерируемых данных постоянно растут. Однако генерация данных - это только первый шаг; настоящей проблемой является обеспечение доступности, читаемости и возможности доверять этим данным в течение предстоящих десятилетий.
Именно здесь на помощь приходит направление обеспечения долговременной сохранности электронных материалов («электронная сохранность» - Long-Term Digital Preservation, LTDP). Деятельность по обеспечению электронной сохранности - которая гораздо сложнее, чем просто резервное копирование или облачное хранение - является стратегическим императивом для современных организаций, занимающихся медико-биологическими исследованиями.
Что такое долговременная электронная сохранность?
Обеспечение долговременной сохранности электронных материалов подразумевает активное управление электронно-цифровым контентом во времени с целью обеспечения его постоянной доступности, пригодности к использованию и аутентичности. В медико-биологической отрасли данные часто необходимо хранить от 25 до 50 лет - или даже постоянно. В течение таких длительных периодов времени происходят сбои в работе аппаратного обеспечения для хранения данных, устаревают программные приложения и перестают использоваться ранее популярные файловые форматы.
Переход от бумажных к цифровым архивам в сфере медико-биологических наук можно сравнить с разницей между хранением секретного рецепта печенья Вашей бабушки в пыльном, потрепанном блокноте - и его загрузкой в облако. В бумажную эпоху исследователям приходилось копаться в переполненных шкафах для хранения документов, расшифровывая кофейные пятна и загадочный почерк давно вышедших на пенсию коллег. Сегодня же вместо защиты от порезов при работе с бумажными листами ученым приходится «воевать» с забытыми паролями и постоянно эволюционирующими файловыми форматами («Подождите, у кого-нибудь есть ещё привод, способный читать Zip-диски?»). В бумажных архивах всегда были свои источники хаоса - пропавшие дела, положенные не на место диаграммы, а порой и семейства мышей; ну а электронная сохранность приносит с собой новые проблемы.
Деятельность по обеспечению долговременной электронной сохранности (LTDP) выходит за рамки стандартных для ИТ резервных копий, решая следующие основные задачи:
1. Сохранность на уровне потока битов: Обеспечение отсутствия деградации формирующих электронные объекты потоков битов (нулей и единиц) с течением времени (борьба с «цифровой коррозией» - bit rot) с использованием контрольных сумм и распределенного хранения.
2. Сохранность на логическом уровне: Обеспечение реальной возможности открытия и понимания данных. Сюда входит проведение конверсии устаревших файловых форматов (например, унаследованных проприетарных форматов для данных спектрометрии) в открытые стандартизированные форматы.
3. Метаданные и контекст: Сохранение сведений о том, «кто, что, где, когда и почему» в отношении данных. В отсутствие метаданных 20-летний набор данных представляет собой просто бесполезную последовательность чисел.
4. Принципы FAIR (акроним FAIR буквально означает «справедливые»; является сокращением от слов Findability, Accessibility, Interoperability, Reusability –отыскиваемость, доступность, интероперабельность и повторное использование - Н.Х.): Обеспечение того, чтоб сохранённые данные оставались находимыми, доступными, интероперабельными и пригодными для повторного использования.
2. Сохранность на логическом уровне: Обеспечение реальной возможности открытия и понимания данных. Сюда входит проведение конверсии устаревших файловых форматов (например, унаследованных проприетарных форматов для данных спектрометрии) в открытые стандартизированные форматы.
3. Метаданные и контекст: Сохранение сведений о том, «кто, что, где, когда и почему» в отношении данных. В отсутствие метаданных 20-летний набор данных представляет собой просто бесполезную последовательность чисел.
4. Принципы FAIR (акроним FAIR буквально означает «справедливые»; является сокращением от слов Findability, Accessibility, Interoperability, Reusability –отыскиваемость, доступность, интероперабельность и повторное использование - Н.Х.): Обеспечение того, чтоб сохранённые данные оставались находимыми, доступными, интероперабельными и пригодными для повторного использования.
Для достижения этих целей организации используют такие концепции, как эталонная модель от крытой архивной информационной системы (OAIS, Open Archival Information System), предлагающая стандартизированную архитектуру для электронных архивов.
Ключевые мотивы обеспечения долговременной электронной сохранности в сфере медико-биологических наук
Почему же фармацевтические компании, научно-исследовательские институты и биотехнологические фирмы инвестируют значительные средства в обеспечение электронной сохранности данных? Соответствующие факторы можно разделить на регуляторные, научные и экономические.
1. Строгое исполнение законодательно-нормативных требований
Первоочередным мотивом, побуждающим обеспечивать долговременную электронную сохранность данных в сфере медико-биологических наук, является необходимость исполнения жёстких законодательно-нормативных требований. Во всем мире органы управления здравоохранения устанавливают строгие правила хранения данных в интересах обеспечения безопасности пациентов и эффективности лекарственных препаратов.
- Правила проведения клинических испытаний (Clinical Trial Regulations): Европейское агентство по контролю над лекарственными препаратами (European Medicines Agency, EMA) требует, чтобы мастер-файлы клинических испытаний (Trial Master File, TMF) хранились не менее 25 лет после их завершения.
- Принципы ALCOA++ (данный акроним образован от слов Attributable, Legible, Contemporaneous, Original, and Accurate – «атрибутируемые, читаемые, актуальные, первичные и точные» - Н.Х.): Такие государственные регуляторы, как американское Управление по контролю за качеством пищевых продуктов и медикаментов (Food and Drug Administration, FDA), требуют, чтобы данные были атрибутируемыми, читаемыми, актуальными, первичными и точными (ALCOA). LTDP-системы электронной сохранности обеспечивают ведение журналов аудита и наличие криптографические доказательств, необходимых для подтверждения этой целостности спустя десятилетия.
Наука развивается на фундаменте ранее сделанных открытий. Если данные, лежащие в основе опубликованной статьи или запатентованной лекарственной формулы, спустя 15 лет окажутся недоступными или их нельзя будет прочитать, то ход научного процесса будет нарушен. Меры электронной сохранности обеспечивают, что результаты экспериментов могут быть проверены, воспроизведены и защищены в случае их оспаривания спустя длительное время после того, как первоначальные исследователи уже перешли к другим проектам.
3. Способствование применению ИИ и вторичному использованию данных
Исторические данные представляют собой «золотую жилу» для современных алгоритмов искусственного интеллекта (ИИ) и машинного обучения (МО). Однако для эффективного обучения моделей ИИ требуются огромные объемы чистых, контекстуализированных данных. Сохраняя данные прежних исследований, клинические и геномные данные в доступных форматах, организации получают возможность использовать свои исторические архивы для выявления новых биомаркеров, для перепрофилирования существующих лекарств и для ускорения конвейеров исследований и разработок.
4. Вывод систем из эксплуатации и экономическая эффективность
Организации, по мере модернизации ими своих систем управления лабораторной информацией (Laboratory Information Management Systems, LIMS) и электронных лабораторных журналов (Electronic Lab Notebooks, ELN), часто вынуждены поддерживать устаревшие системы в работоспособном состоянии просто для того, чтобы сохранить доступ к старым данным. Это влечёт за собой огромные затраты на лицензирование, техническое обслуживание и обеспечение безопасности.
5. Страховка на случай инцидентов кибербезопасности
В эпоху участившихся атак на биотехнологические данные с использованием программ-вымогателей, LTDP-решения выполняют роль высокозащищённых «кибер-бункеров» - внеофисных хранилищ защищённые от внесения изменений резервных копий – обеспечивая возможность быстрого восстановления данных без уплаты выкупа злоумышленникам, поддерживая при этом целостность данных в соответствии с требованиями хороших практик (GxP) и законов (HIPAA) - и защищая данные от последствий «цифровой коррозии» и инцидентов безопасности.
Мой комментарий: Акроним GxP (Good x Practice) обозначает совокупность обязательных руководств и законодательно-нормативных требований к качеству, используемых в регулируемых отраслях - в первую очередь в фармацевтике, пищевой промышленности и в производстве медицинских изделий - для обеспечения безопасности, эффективности и высокого качества продукции. Вместо «x» могут подставляться условные обозначения для конкретных отраслей, такие как M (Manufacturing) для производства (GMP), L (Laboratory) для лабораторных исследований (GLP) или C (Clinical) для клинических исследований (GCP).
HIPAA – это американский Закон о переносимости и подотчётности медицинского страхования 1996 года, содержащий, в том числе, положения о защите медицинских данных и неприкосновенности личной жизни т.е. персональных данных.
Заключение
Данные в сфере медико-биологических наук являются наиболее ценным из активов, которыми располагает организация. Обращаться с данными как с активом, полезным лишь в краткосрочной перспективе, дело рискованное, поскольку такое отношение может повлечь за собой санкции со стороны контролирующих органов и затруднить инновации. Обеспечение долговременной электронной сохранности - это не просто ИТ-задача архивирования данных, а ключевая по важности деловая стратегия.
Внедряя надежные LTDP-решения для обеспечения долговременной электронной сохранности, организации сферы медико-биологических наук смогут обеспечить, чтобы их революционные открытия оставались защищёнными, соответствовали законодательно-нормативным требованиям и могли способствовать следующему поколению прорывных открытий в данной области.
Источник: сайт LinkedIn
https://www.linkedin.com/pulse/future-proofing-digital-records-overview-drivers-long-term-kdhhe/



Комментариев нет:
Отправить комментарий