пятница, 31 января 2020 г.

Семинар Библиотеки Конгресса США по системам хранения, часть 4


(Окончание, предыдущую часть см. http://rusrim.blogspot.com/2020/01/3.html )

Доклад Генри Ньюмена (Henry Newman)

Добрый доктор Панглосс (известный персонаж романа Вольтера «Кандид», довольно-таки карикатурно изображающий учёного философа – Н.Х.) был бы в восхищении от энтузиазма Генри Ньюмана в отношении сетей 5G (см. http://www.digitalpreservation.gov/meetings/DSA2019/Day_1/04_newman_2019.DSA.hsn.v2.pdf ), но я настроен куда более скептически.

Это правда, что первые образцы 5G-телефонов способны продемонстрировать скорость передачи данных около 2 гигабит в секунду в очень ограниченных зонах покрытия в некоторых городах США. Однако 5G-телефоны будут стоить дороже (см., например, https://www.cnet.com/news/the-6-hardest-truths-weve-learned-about-5g/ ), будет дороже их использование, меньше срок службы батареи. У них будет проблема перегрева, менее постоянная полоса пропускания и практически несуществующее покрытие. Взамен Вы получите более высокую пиковую пропускную способность, которую большинство людей не использует. Клиенты уже замечают, что их существующие телефоны «достаточно хороши» (см. https://www.zdnet.com/article/my-four-year-old-iphone-is-too-good-to-upgrade-and-that-should-worry-apple/ ). Так что переход на 5G ну просто блестящая идея! (см. также https://www.techdirt.com/articles/20200106/08554343687/theres-recurring-theme-with-5g-disappointment.shtml ).

Причина, по которой операторы строят сети 5G, связаны отнюдь не с телефонами, а с тем, что они видят золотую жилу в «интернете вещей». Но объедините пропускную способность в 2 Гбит/с с печально известным отсутствием безопасности «интернета вещей» (см., например,  https://www.cbsnews.com/news/ring-and-nest-hackers-home-security-cameras-vulnerable-to-cyberattacks/ ), и у Вас на руках будет катастрофа, которую операторы связи просто не могут допустить.

Интернет вещей распространился по двум причинам. «Вещи» очень дёшевы, и подключение их к интернету не регулируется, поэтому поставщики интернет-услуг не могут создавать здесь препятствий. Однако для подключения «вещи» к 5G-интернету потребуется тарифный план для передачи данных от оператора связи, и это позволит операторам навязывать требования и, следовательно, расходы. Среди требований может быть требование о наличии у «вещей» UL-сертификации ( https://www.techdirt.com/articles/20191209/13065843536/ul-pushes-security-standards-internet-broken-things.shtml - здесь имеется в виду система сертификации, продвигаемая американской компанией по стандартизации и сертификации в области техники безопасности Underwriters Laboratories, о ней см. https://ru.wikipedia.org/wiki/UL_(Underwriters_Laboratories)Н.Х.), адекватной безопасности и поддержки, включая своевременное обновление программного обеспечения в течение, возможно, довольно длительно срока службы в подключённом состоянии. Именно отсутствие этих дорогостоящих свойств сделало «интернет вещей» столь широко распространённым и таким кошмаром для безопасности (см. https://www.androidpolice.com/2020/01/02/uh-oh-xiaomi-camera-feed-showing-random-homes-on-a-google-nest-hub-including-still-images-of-sleeping-people/ )!

Контроль целостности (fixity)

В двух докладах обсуждалась проверка неизменности (fixity checks). Марк Купер (Mark Cooper, см. http://www.digitalpreservation.gov/meetings/DSA2019/Day_1/18_mcooper_lc_dcm_slides.pdf ), рассказал об усилиях по проверке как полноты состава, так и контрольных сумм определенной части цифровой коллекции Библиотеки Конгресса США. Был сделан вывод о том, что если технические части общей системы были надежными, то человеческие - не совсем:
  • Контент в системе хранения корректен, в отличие от реестров;

  • Хранители контента обходят системные ограничения, что приводит к некорректности реестров;

  • Контент в электронной системе хранения следует рассматривать как потенциально динамичный, в особенности в плане его представления и доступа;

  • Система должна обеспечивать необходимые операции таким образом, чтобы поддерживались их протоколирование и контроль версий.
Представитель компании Google Базз Хейс (Buzz Hayes, см. http://www.digitalpreservation.gov/meetings/DSA2019/Day_1/22_hays_Fixity-on-GCP-Overview.pdf ) рассказал о рекомендуемом компанией методе контроля целостности данных в облаке Google. Существуют сценарии для двух традиционных подходов:
  • Чтение и вычисление хеша записанных данных, что при больших масштабах обходится дорого из-за оплаты доступа и пропускной способности;

  • Хеширование данных непосредственно в облаке, в котором те хранятся, что предполагает доверие к облаку в том плане, что хеш действительно будет вычислен заново, а не просто будет взято значение, запомненное при приёме данных на хранение.
Мне всё еще предстоит увидеть облачный API-интерфейс, в котором будет реализован метод, опубликованный 12 лет тому назад Мехулом Шахом и др. (Mehul Shah et al, см. https://www.usenix.org/legacy/events/hotos07/tech/full_papers/shah/shah_html/ ), который предполагает передачу владельцем данных облачному провайдеру однократно используемого случайного числа (nonce), с тем, чтобы тот вычислил во время проверки хеш данных с учётом этого числа. См. также мой пост «Аудит целостности многочисленных экземпляров электронного объекта» (Auditing The Integrity Of Multiple Replicas, https://blog.dshr.org/2019/11/auditing-integrity-of-multiple-replicas.html ).

Блокчейн

Шармила Бхатия (Sharmila Bhatia) в своём докладе рассказала об инициативе Национальных Архивов США по изучению потенциала блокчейна для способствования управлению государственными документами (см. http://www.digitalpreservation.gov/meetings/DSA2019/Day_1/08_bhatia_Blockchain-LC-20190909.pdf ). В заключение она сделала следующие выводы:
Целостность и аутентичность
  • Функциональные возможности технологий блокчейна и распределенных реестров являются новым способом обеспечения целостности и аутентичности электронных документов

  • Они могут не помочь при решении задач обеспечения долговременной сохранности и доступности, и могут даже усложнить эти проблемы.
Важно отметить, что то, что Национальные Архивы США подразумевают под «государственными документами», весьма отличается от того, что обычно понимается под термином «документы», - и законодательно-нормативная база, на основе которой действуют Национальные Архивы, может сделать внедрение технологии блокчейна проблематичным.

Бен Фино-Радин (Ben Fino-Radin) и Мишель Ли (Michelle Lee) прорекламировали стартап Starling (см. http://www.digitalpreservation.gov/meetings/DSA2019/Day_1/24_fino-radin_Starling-LC-storage-architectures-mtg.pdf ), утверждая, в частности, что он «использует упрощенное и скоординированное децентрализованное хранение в сети Filecoin».

Их слайды описывают, как технология, работает, однако не дают представления о том, сколько это может стоить. Как и в случае с ДНК-хранением и другими экзотическими носителями информации, реальная проблема является экономической, а не технической.

Я уже писал скептически об экономике сети Filecoin в постах «Четырех самых дорогостоящих слова английского языка» (The Four Most Expensive Words in the English Language, https://blog.dshr.org/2018/06/the-four-most-expensive-words-in.html ) и «Триумф жадности над арифметикой» (Triumph Of Greed Over Arithmetic, см. https://blog.dshr.org/2018/08/triumph-of-greed-over-arithmetic.html ), сравнивая возможное ценообразование этого решения с решениями S3 и S3 RRS фирмы Amazon. Конечно, цифры выглядели бы намного хуже для Filecoin, если бы я сопоставил их цены с ценами Wasabi.

Заключительные рекомендации организаторам

Такие семинары всегда являются захватывающими событиями. Но, пожалуйста, рассылая в следующем году приглашение принять участие в очередном семинаре, недвусмысленно дайте понять, что любой, кто рискнёт использовать в своих слайдах прогнозы для «произведенных данных» (см. https://blog.dshr.org/2016/09/where-did-all-those-bits-go.html ) в качестве актуальных для «хранения данных» и особенно архивного хранения, будет прогнан со сцены калёной метлой.

Дэвид Розенталь (David Rosenthal)

Источник: DSHR's Blog
https://blog.dshr.org/2020/01/library-of-congress-storage.html

Комментариев нет:

Отправить комментарий