В 2007 году Библиотека Конгресса США (Library of Congress) организовала первую встречу по теме «Проектированию архитектур хранения данных для цифровых коллекций» (Designing Storage Architectures for Digital Collections, DSA). Целью этой первой встречи было собрать вместе специалистов по архитектуре хранения данных для обсуждения уникальных требований к хранению данных нового Национального центра сохранения аудиовизуальных материалов (National Audio-Visual Conservation Center, NAVCC) Библиотеки.
В последующие годы данное мероприятие трансформировалось в площадку для более широкого обсуждения достижений, проблем и решений в области хранения цифровых данных.
9-10 марта 2026 года Библиотека провела 20-ю по счету такую встречу, теперь уже ставшую международной (см. https://www.digitalpreservation.gov/meetings/storage26.html?loclr=blogsig ).
В этом году в мероприятии приняли участие 172 ведущих мировых эксперта в областях инфраструктур хранения данных, передовых практик, инноваций и прогнозов развития экосистемы обеспечения долговременной сохранности электронных материалов (электронной сохранности). Организаторы встречи подготовили насыщенную программу, способствующую открытому обсуждению текущих проблем цифрового хранения и рассчитанные на опережающие действия решений для смягчения будущих прогнозируемых рисков. Участники встречи представляли различные государственные органы и учреждения, учреждения культурного наследия, отрасль цифрового хранения, а также академические и научно-исследовательские организации.
Директор по ИТ Библиотеки Конгресса Джудит Конклин (Judith Conklin) поприветствовала собравшихся и задала тон двум последующим дням оживленной дискуссии. Затем сотрудники Библиотеки сообщили новости за прошедший год, касающиеся текущей среде хранения, темпов роста объёмов данных и поиска инновационных методов цифрового хранения.
В число тем для обсуждения входили:
- широкое распространение цифровых данных и проблемы, с которыми сталкиваются поставщики услуг хранения, пытаясь удовлетворить этот спрос;
- энергетические и экологические аспекты, необходимые для поддержания экосистемы хранения данных;
- влияние искусственного интеллекта (ИИ) на потребность в услугах хранения данных;
- проблемы и наилучшие практики, о которых говорили различные поставщиков услуг по курированию данными; а также
- ряд технологических обновлений, представленных поставщиками услуг хранения для решений на основе как новых, так и традиционных технологий хранения.
Хотя доклады и последующие обсуждения сильно различались по своему характеру, неизменно звучали две основные темы:
- Каким образом сообщество поставщиков услуг хранения данных сможет поддерживать необходимый уровень обслуживания в условиях быстрого увеличения объёмов данных?
- Каким образом это сообщество будет реагировать на требования открыть доступ ИИ к данным, которые прежде хранились на носителях с низкой скоростью доступа?
Хотя первая тема постоянно дискутировалась на протяжении многих лет, в этом году все выглядело иначе. Группа теперь обсуждает этот вопрос как проблему сегодняшнего дня, а не как проблему будущего. Похоже, достигнут переломный момент: поставщики услуг хранения данных не могут справиться с возрастающим спросом на их услуги. Эта проблема проявляет себя на рынке в виде ограниченности предложений и растущей стоимости хранения в расчёте на терабайт данных. Многие участники встречи выразили поддержку новым и нарождающимся технологиям, разрабатываемым сейчас для заполнения пробелов, не покрываемых существующими носителями информации.
Вопрос хранения данных на соответствующих носителях, выбираемых в зависимости от частоты доступа, давно уже дискутировался в рамках данного форума, - и хотя эта тема по-прежнему обсуждалась, был введён новый элемент: вопрос доступа универсальных и больших языковых моделей к находящимся на хранении данным. В условиях постоянного расширения использования ИИ даже данные, исторически хранившиеся на «холодных» (менее доступных) носителях, должны быть динамичными и доступными, если требуется обеспечить эффективное их использование ИИ-моделями. Эта тенденция может побудить кураторов данных к тому, чтобы хранить свои данные на «более горячих» (более доступных) носителях с большим энергопотреблением. Такие «горячие» решения, как правило, дороги и имеют больший углеродный след.
Хотя этим двум проблемам была посвящена большая часть дискуссий на протяжении всей встречи, также достаточно много времени обсуждались и решения. Новые носители информации, такие как оптические и молекулярные решения высокой плотности, получили бóльшую поддержку, чем в предыдущие годы, - и разрабатывающие их компании движутся к коммерциализации этих решений на корпоративном уровне. Есть надежда, что такие решения в ближайшие годы заполнят определенные пробелы на рынке. Помимо этого, состоялось несколько дискуссий по поводу оценки энергетических потребностей цифрового архива; использования цифровых архивов для смягчения последствий стихийных бедствий; а также о том, как оцифровка архивов может способствовать расширению исторических и генеалогических знаний сообщества.
Встречи серии «Проектирование архитектур хранения данных для цифровых коллекций» неизменно собирают уникальное сочетание экспертов, представляющих поставщиков услуг хранения данных; специалистов по технологиям; пользователей данных и архивистов, с целью обсуждения сложных вопросов, связанных с экосистемой хранения данных. В 2026 году ситуация была такой же, но в этом году форум прошел несколько в ином ключе. Члены сообщества ощущали бóльшую срочность в отношении давно прогнозируемых проблем, которые теперь стали реальностью, а также проблем, которые ещё предстоит решить.
Каким образом поставщики услуг хранения данных смогут удовлетворить очень высокий рыночный спрос, вызванный неконтролируемым ростом объёмов данных? Станет ли дефицит хранилищ данных ограничивающим фактором для бума ИИ? Каким образом организации смогут обеспечить надлежащее курирование данных и удовлетворить связанные с этим энергетические потребности? Хотя окончательные ответы на эти вопросы ещё не сложились, - более широкое сотрудничество членов сообщества, укрепившееся на этом мероприятии, является ключевым шагом на пути к поиску ответов, необходимых для обеспечения здорового будущего для мировых данных.
Для получения детальной информации о докладах и доступа к дополнительным материалам, пожалуйста, посетите репозиторий встречи DSA 2026 по адресу
https://www.digitalpreservation.gov/meetings/storage26.html?loclr=blogsig .
Винсент Колтеллино (Vincent Coltellino)
Источник: блог «Сигнал» (The Signal) на сайте Библиотеки Конгресса США
https://blogs.loc.gov/thesignal/2026/06/2026-designing-storage-architectures/




