четверг, 30 января 2020 г.

Семинар Библиотеки Конгресса США по системам хранения, часть 3


(Продолжение, предыдущую часть см. http://rusrim.blogspot.com/2020/01/2.html )

Облачное хранение

На семинаре с полезными маркетинговыми презентации выступили представители компаний
Джулиан Морли (Julian Morley) сообщил о переходе Стэнфордского университета с собственной системы ленточного хранения на облачное хранилище (см.  http://www.digitalpreservation.gov/meetings/DSA2019/Day_1/20_Morley_Tape_to_Cloud.pdf - доклад называется «Путешествие в Облака» - Н.Х.), приведя ценные данные о затратах. Ранее я уже рассказывал об экономическом моделировании (см. https://blog.dshr.org/2019/02/economic-models-of-long-term-storage.html ), которое Морли использовал для обоснования этого решения.

В опубликованной в популярном ИТ-издании «The Register» статье Тима Андерсона (Tim Anderson) под названием «Архивное хранение появляется в Google Cloud: Станет ли оно конкурентом AWS и Azure?» (Archive storage comes to Google Cloud: Will it give AWS and Azure the cold shoulder?, см. https://www.theregister.co.uk/2020/01/09/archive_storage_comes_to_google_cloud_how_does_it_compare_to_aws_and_azure/ ) дано удобное сопоставление ценовых планов, предлагаемых ведущими поставщиками услуг облачного хранения для целей архивного хранения данных (см. рис. ниже), при этом сделан следующий вывод:

Стоимость долговременного хранения и использования неактивной информации (cold storage) в различных системах, в долларах в месяц

«Обратите внимание на то, что данная таблица даёт очень сильно упрощённую картину. Ценообразование является очень сложным; операции классифицированы более детально, чем просто «чтение» и «запись»; предоставляемые услуги различаются в деталях; и могут предоставляться скидки на зарезервированное хранение. Стоимость передачи данных в рамках Вашей облачной инфраструктуры может быть ниже. Единственный способ обеспечить достоверное сравнение - это сформулировать Ваши точные требования (а также узнать, способен ли поставщик облачных услуг удовлетворить их), и согласовать с поставщиком цену для вашего конкретного случая.»

Хранение данных в ДНК

Я уже писал с большим энтузиазмом о потенциале ДНК-хранения в долговременной перспективе, при этом скептически относясь к среднесрочному будущему этой технологии в качестве среды архивного хранения в течение более чем семи лет (см. https://blog.dshr.org/2018/02/dnas-niche-in-storage-market.html и https://blog.dshr.org/2012/10/forcing-frequent-failures.html ).

Меня всегда впечатляли усилия в этой области совместной группы компании Microsoft и университета штата Вашингтон, и работа Карин Стросс (Karin Strauss) и Луиса Цезе (Luis Ceze) по ДНК-хранению и обработке данных не является исключением (см. http://www.digitalpreservation.gov/meetings/DSA2019/Day_2/01_Strauss_LoC-DNAStorage-Sep2019-web.pdf ).

Слайд из презентации к докладу Стросс и Цезе

Доклад включает подробности подготовленного ими прототипа законченной автоматической системы для записи и чтения (см. их статью об этом проекте https://doi.org/10.1038/s41598-019-41228-8 , и видео: https://www.youtube.com/watch?v=60Gi5lqL-dA&feature=youtu.be ), а также обсуждение методов выполнения вычислений над записанными ДНК-данными в рамках технологий «больших данных».

Энн Фишер (Anne Fischer) в своём докладе рассказала об исследовательской программе американского агентства по передовым военным научно-техническим проектам (Defense Advanced Research Projects Agency, DARPA) в области молекулярной информатики (см. http://www.digitalpreservation.gov/meetings/DSA2019/Day_2/02_fischer_Molecular-Informatics_LOC_Fischer.pdf ). Одним из его предшественников этой работы был семинар DARPA в 2016 году (см. https://blog.dshr.org/2016/05/the-future-of-storage.html ). В докладе Фишер подчеркивалась разнообразие малых молекул, которые можно использовать в качестве носителя информации. В прошлом году уже писал об одном подходе без использования ДНК, предложенным университетом Гарварда (см. https://blog.dshr.org/2019/05/storing-data-in-oligopeptides.html ).

В своём посте «Снижение затрат на запись данных в ДНК» (Cost-Reducing Writing DNA Data, см. https://blog.dshr.org/2019/03/cost-reducing-writing-dna-data.html ) я писал о подходе компании Catalog ( https://www.catalogdna.com/ ), где нить собирается из библиотеки коротких последовательностей основных аминокислот. Это хорошая идея, позволяющая преодолеть один из крупных недостатков ДНК как носителя информации – низкую пропускную способность при записи.

Однако слайды к докладу Девина Лика (Devin Leake - см. http://www.digitalpreservation.gov/meetings/DSA2019/Day_2/03_leake_20190910_LoC_Leake.pdf  ) небогаты подробностями, и весь доклад больше похож на «речь в лифте» (elevator pitch) с целью уговаривания инвесторов. Доклад начинается с повторения смехотворного прогноза фирмы IDC о количестве «произведенных байтов» (см. мой пост https://blog.dshr.org/2016/09/where-did-all-those-bits-go.html ), которое приравнивается к спросу на объёмы хранения и, в частности, архивного хранения. Если Вы развиваете компанию, Вам необходимо гораздо лучшее представление о рынке, на который Вы нацеливаетесь, чем это (см. https://blog.dshr.org/2018/03/archival-media-not-good-business.html - есть перевод на русский язык здесь: https://rusrim.blogspot.com/2018/03/blog-post_15.html - Н.Х.).

(Окончание следует, см. http://rusrim.blogspot.com/2020/01/4.html )

Дэвид Розенталь (David Rosenthal)

Источник: DSHR's Blog
https://blog.dshr.org/2020/01/library-of-congress-storage.html

Комментариев нет:

Отправка комментария