понедельник, 17 июня 2019 г.

Архивная тема на XI Международном IT-Форуме c участием стран БРИКС и ШОС


XI Международный IT-Форум c участием стран БРИКС и ШОС прошел в г.Ханты-Мансийске 10-12 июня 2019 года. Программа была очень насыщенная, из-за чего на многие параллельные мероприятия, которые были для меня интересны, попасть не удалось.

Отмечу, что анализ программ всех мероприятий показывает, что тематика обеспечения сохранности электронной информации и документов была бы актуальна практически на любой площадке IT-Форума.

Участники круглого стола на выставке «Цифровые технологии для всех», за нашими спинами инсталляция «Связь поколений Югры»

Подготовленная организаторами деловая и культурная программа была рассчитана на три дня и на очень «закаленных» архивистов (с программой можно познакомиться здесь https://itforum.admhmao.ru/upload/files/2019/programma-s-dokladami.docx?v=1560237928 ).

Для информирования тех, кто не смог приехать лично, использовались различные современные каналы связи, см. https://www.facebook.com/archivesl.admhmao.ru/?tn-str=k%2AF . Да и сами участники активно размещали фото и видео в сети (см.: https://www.facebook.com/bfpopovici , https://www.facebook.com/profile.php?id=100011311087478 ).

10 июня 2019 года в Государственном архиве Югры прошел митап (если по-русски, то семинар :) ) «Новая профессия – IT-архивист». Отмечу, что вопросы подготовки современных кадров традиционно включаются в программу конференции ВНИИДАД, но к сожалению, на них постоянно не хватает времени. В данном случае удалось не только выслушать подготовленные доклады, но и дать всем желающим высказать свою позицию по этому важному вопросу.

Сотрудники Государственного архива Югры провели для участников ознакомительную экскурсию, рассказали о том, как меняется архив, что он представляет собой сегодня и чего удалось достичь. Само собой, нам показали интересные документы, которые хранятся в его фондах - например, приказы по личному составу за годы войны, которые изготавливались на этикетках от рыбных консервов Самаровского рыбокомбината (см. https://www.facebook.com/archivesl.admhmao.ru/videos/1238284833012991 ). В фондах также хранятся документы на ткани (см. https://www.facebook.com/watch/?v=617290865452340 ).

Ключевым мероприятием IT-Форума для представителей архивно-документационного сообщества стал круглый стол «Трансформация архивов в цифровую эпоху: проблемы и решения», который прошел 11 июня (см. https://itforum.admhmao.ru/2019/news/2841405/ ). Который транслировался в Интернете в реальном времени (см. https://www.youtube.com/watch?v=CtNlIVIa2Ck - я планирую вырезать и выложить на своем канале в YouTube доклады круглого стола по отдельности, поскольку полной 8-часовой видеозаписью, которая не выключалась и на время перерывов, пользоваться неудобно).

На «круглом столе»

В итоге российские архивисты и ряж зарубежных коллег провели вместе три дня, активно общаясь и вне рамок официальных мероприятий. Активные и насыщенные дискуссии по актуальным вопросам нашей профессии не прекращались и во время завтраков, обедов и ужинов, общение продолжалось во время переездов на автобусах. Я получала от этого огромнейшее удовольствие.

Отмечу, что успешно провести столь насыщенную программу удалось только благодаря усилиям коллег из Архивной службы Юргы. Все эти дня они прилагали все свои силы, чтобы участники круглого стола чувствовали себя комфортно и получили максимальную пользу и удовольствие от мероприятия. Все мы высоко ценим их труд и неизменную доброжелательность и внимание.

Источник: Сайт Архивной службы Юргы / сайт ИТ-Форума / Facebook
https://archivesl.admhmao.ru/
https://itforum.admhmao.ru/2019/news/2841405/

воскресенье, 16 июня 2019 г.

DLM-форум, день первый


Данная новость была опубликована 24 мая 2019 года на датском сайте digitalbevaring.dk. Несмотря на упадок DLM-форума в последние годы, я продолжаю следить за его деятельностью и конференциями, и время от времени там происходят интересные события.


В настоящее время в Берне, Швейцария, проходит конференция и ежегодное общее собрание DLM-форума (конференция проходила 21-22 мая 2019 года – Н.Х.).

Ранее аббревиатура «DLM-форум» (о нём см. http://www.dlmforum.eu/ )  расшифровывалась как «Форум по вопросам управления жизненным циклом документов» (Document Lifecycle Management Forum), однако на ежегодном общем собрании члены сообщества решили изменить расшифровку аббревиатуры на «Управления жизненным циклом данных» (Data Lifecycle Management). Единодушное одобрение этого решения свидетельствует об общей тенденции в области обеспечения долговременной сохранности электронных материалов, где сегодня мы видим все более сложные электронные системы и объекты, которые необходимо сохранять.

Мой комментарий: Все эти шатания DLM-форума от одного модного словца к другому говорят лишь о том, что ассоциация никак не может найти себя и свою аудиторию…

Теме сложности было уделено большое внимание в ключевом докладе первого дня, в котором Филипп Кудре-Мору (Philippe Cudré-Mauroux) из Университета Фрибурга (Friborg) рассказал о попытке установления взаимоотношений между структурированными и неструктурированными большими данными с помощью «графов знаний» (knowledge graph, об истории этого понятия см. Википедию, https://ru.wikipedia.org/wiki/Knowledge_Graph ) ,

Эсбен Сьёволл (Esben Sjøvoll) из Национальных Архивов Норвегии в своём докладе говорил о «запроектированном документировании» (Documentation by Design). Он показал, что существует большая разница между количеством информации, которую сотрудники государственного учреждения обрабатывают за один день, и тем количеством, которое фактически поступает в систему управления документами.

Эспен привел пугающий пример из практики норвежского Министерства иностранных дел, где в системе регистрационных журналов за несколько лет можно было найти только 17 документов, касающихся отношений между Китаем и Норвегией. Однако если провести подобный поиск на почтовом сервере ведомства, то можно найти более 300 тысяч писем за тот же период. Основное мысль докладчика заключалась в том, что для достижения целей электронной сохранности необходимо учесть данный аспект при проектировании архитектуры систем, заложить в системы соответствующие возможности, с тем, чтобы электронная сохранность начиналась с момента создания данных.

Анси Яскелайнен (Anssi Jääskeläinen) из финского Университета прикладных наук разработал трехмерную игру с фактами, касающимися бомбардировки Хельсинки во время Второй мировой войны, в качестве способа анализировать сохранённые исторические данные, так сказать, «в игре».

Наконец, Себастьян Соез (Sébastian Soyez) из Государственных Архивов Бельгии представил свою новую стратегию и прототип решения для веб-архивирования под названием PROMISE, о которой можно получить дополнительную информацию по адресу https://promise.hypotheses.org/

Источник: сайт digitalbevaring.dk
https://digitalbevaring.dk/dlm-forum-dag1/

Великобритания: Опубликован ещё один стандарт, относящийся к проведению госзакупок


Как сообщил сайт британского института стандартов, 29 мая 2019 года был опубликован стандарт BS 95009:2019 «Закупки в государственном секторе. Типовые требования к организациям, поставляющим товары и услуги» (Public sector procurement. Generic requirements for organizations providing products and services) объёмом 23 страницы, см. https://standardsdevelopment.bsigroup.com/projects/2018-02931 .

В аннотации на документ, в частности, отмечается:
Настоящий британский стандарт устанавливает типовые требования, выполнение которых позволяет подтвердить:
  • Пригодность организации в качестве внешнего поставщика товаров и услуг для государственного сектора; а также

  • Способность организации к совместной работе в интересах удовлетворения требования заказчика.
Настоящий британский стандарт может быть использован любой организацией, независимо от её типа, размера или характера деятельности. Он может использоваться организациями:
  • Передающими на субподряд сторонним поставщикам поставку товаров или оказание услуг; и / или

  • Выступающими в качестве внешних поставщиков в рамках всей цепочки поставок.
Примечание 1. Настоящий британский стандарт также может использоваться организациями, вовлеченными в процесс закупок в негосударственном секторе.

Примечание 2. Для того, чтобы иметь право заявить о соответствии настоящему британскому стандарту в отношении контрактов любой категории, должны быть удовлетворены все его критерии.
Содержание документа следующее:
Предисловие
0. Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Условия деятельности (контекст) организации
5. Стратегическое управление организацией
6. Менеджмент риска и возможностей
7. Финансовая и коммерческая подотчётность
8. Менеджмент качества
9. Закупки и цепочка поставок
10. Оценка качества работы
11. Персонал
12. Совершенствование
Приложение A (справочное): Руководство по применению стандарта BS 95009 и по исполнению его требований
Библиография
Мой комментарий: Данный небольшой документ содержит высокоуровневые требования типа «организация должна иметь/внедрить/реализовать …», без каких-либо конкретных указаний о том, как именно это требование следует выполнять, что обеспечивает максимальную гибкость. Требования, кстати говоря, очень похожи на высокоуровневые требования систем менеджмента.

Источник: Сайт Британского института стандартов BSI
https://standardsdevelopment.bsigroup.com/projects/2018-02931

суббота, 15 июня 2019 г.

Интервью Хрвое Станчича о проекте InterPARES и о многом другом


Есть такая семейная пара американских архивистов-энтузиастов – Джоф Хат (Geof Huth) и Карен Тривет (Karen Trivette), см. фото слева.

Карен возглавляет департамент специальных коллекций в технологическом институте моды (Fashion Institute of Technology) при государственном университете Нью-Йорка. Джоф руководит архивно-документационной службой Объединённой судебной системы штата Нью-Йорк (NYS Unified Court System).

Джоф и Карен ведут аудиоблог «История, рассказанная архивистом» (An Archivist's Tale, см. https://www.spreaker.com/show/an-archivists-tale ), где к настоящему моменту выложено 66 аудиозаписей-подкастов.

25 мая 2019 года Джоф и Карен выложили запись часового интервью, взятого у, можно сказать, восходящей молодой звезды архивного сообщества – хорватского специалиста, Хрвое Станчича (Hrvoje Stančić - на фото внизу), который возглавляет кафедру архивоведения и документоведения факультета гуманитарных и социальных наук Университета Загреба и является сейчас одним из организаторов сообщества участников международного проекта InterPARES.

В своём интервью на английском языке, выложенном в посте под названием «Эпизод 66: Алгоритмическая ответственность» (The Algorithmic Responsibility), которое доступно по адресу https://www.spreaker.com/user/archiviststale/0066-hrvoje-stancic , Хрвое (на фото слева) рассказывает о своём участии в международном проекте InterPARES Trust, в рамках которого изучаются средства и способы обеспечения доверия; о своей преподавательской деятельности, о своей работе по составлению англо-хорватского словаря профессиональной лексики, и о том, что мы «часто аутентифицируем лишь фальшивость документа» :)

Сам Хрвое написал в социальной сети LinkedIn следующее:
Карен Тривет и Джоф Хат взяли у меня интервью для серии подкастов «История, рассказанная архивистом» (An Archivist's Tale), когда мы были на конференции в Раденци, Словения, 4 апреля 2019 года.

В недавно опубликованном 66-м эпизоде  под названием «Алгоритмическая ответственность» я говорил о трансформирующих (disruptive) технологиях, таких, как искусственный интеллект (ИИ), блокчейн, аналитика больших данных и др. в контексте архивов, а также о моей мотивации при преподавания и проведении исследований в рамках проекта InterPARES Trust и об идеях, лежащих в основе его следующего этапа - InterPARES Disrupt - который участвует в конкурсе на получении гранта в рамках крупной европейской программы Horizon 2020, финансируемой Еврокомиссией.

Вы можете прослушать интервью по адресу https://lnkd.in/eCFNDPN .
Источник: сайт Speaker.com
https://www.spreaker.com/user/archiviststale/0066-hrvoje-stancic

Завершается работа над европейским стандартом EN 17371 по оказанию услуг


В мае 2019 года на сайтах многих европейских органов по стандартизации был выложен в платном доступе проект европейского стандарта EN 17371 «Оказание услуг» (Provision of services) в трёх частях. Некоторые из этих органов (например, Британский институт стандартов BSI) предоставили желающим возможность принять участие в публичном обсуждении документов.

Документы разработаны техническим комитетом SVS/21 «Европейские стандарты оказания услуг» (European Service Standards) Европейского комитета по стандартизации CEN.


Приведенная ниже информация взята сайта BSI.

EN 17371-1 «Оказание услуг – Часть 1: Закупка услуг – Руководство по оценке способности поставщиков услуг и по оценке предложений об оказании услуг» (Provision of services. - Part 1: Service procurement - Guidance for the assessment of the capacity of service providers and evaluation of service proposals), см. https://standardsdevelopment.bsigroup.com/projects/2018-00670

Настоящий документ содержит рекомендации по оценке способности поставщиков услуг и по оценке предложений об оказании услуг, с целью совершенствования и облегчения процесса закупки услуг.

Настоящий документ может быть использован:
  • Любой организацией независимо от её типа или размера;

  • Любыми заинтересованными сторонами, которые прямо или косвенно вовлечены в процесс закупок или затрагиваются им.
Настоящий документ не применим к договорам об оказании услуг клиентам-физическим лицам (B2C) или к контрактам на выполнение работ.

EN 17371-2 «Оказание услуг – Часть 2: Контракты на оказание услуг – Руководство по формированию и структуре контрактов» (Provision of services. Part 2: Services Contracts - Guidance for the design and structure of contracts), см.
https://standardsdevelopment.bsigroup.com/projects/2017-03926

Настоящий документ содержит рекомендации по формированию и структуре контрактов на оказание услуг. Он рассчитан на покупателей и поставщиков услуг, вступающих в договорные отношения, которые не обязательно имеют юридическую подготовку.

Настоящий документ применим в любой организации, независимо от её типа или размера. Он не применим к договорам об оказании услуг клиентам-физическим лицам (B2C) или к контрактам на выполнение работ.

Примечание 1. Стандарт не распространяется на «контракты на выполнение работ» т.е. на контракты, целью которых является только выполнение, или же как проектирование, так и выполнение определенных работ. Однако контракты, целью которых является только проектирование, входят в область применения стандарта.

Примечание 2. Под «работами» понимаются результаты строительных или гражданских инженерных работ, взятые в целом, которые самодостаточны для выполнения определенной экономической или технической функции.

EN 17371-3 «Оказание услуг – Часть 3: Менеджмент измерения показателей качества услуг – Руководство по механизму измерения качества услуг как части контрактов на оказание услуг» (Provision of services. Part 3: Management of Performance Measurement - Guidance on the mechanism to measure performance as part of service contracts), см.
https://standardsdevelopment.bsigroup.com/projects/2017-03927

Настоящий документ содержит рекомендации по созданию механизма для менеджмента измерения показателей качества услуг как составной части всего контракта на оказание услуг.

Настоящий документ может быть использован:
  • Любой организацией независимо от её типа или размера;

  • Покупателями услуг; а также

  • Поставщиками услуг, которые могут находиться как внутри, так и вне организации-покупателя услуг.
Настоящий документ не применим к договорам об оказании услуг клиентам-физическим лицам (B2C) или к контрактам на выполнение работ.

Примечание 1. Стандарт не распространяется на «контракты на выполнение работ» т.е. на контракты, целью которых является только выполнение, или же как проектирование, так и выполнение определенных работ. Однако контракты, целью которых является только проектирование, входят в область применения стандарта.

Примечание 2. Под «работами» понимаются результаты строительных или гражданских инженерных работ, взятые в целом, которые самодостаточны для выполнения определенной экономической или технической функции.

Источник: сайт BSI
https://standardsdevelopment.bsigroup.com/projects/2018-00670
https://standardsdevelopment.bsigroup.com/projects/2017-03926
https://standardsdevelopment.bsigroup.com/projects/2017-03927

пятница, 14 июня 2019 г.

Документы и «представления»


Данная заметка Эда Саммерса (Ed Summers – на фото) была опубликована 15 мая 2019 года на его сайте Inkdroid.org. Она интересна тем, что отражает дискуссии теоретического плана, которые идут в мировом архивном сообществе. К новым идеям можно относиться по-разному, но пищу для размышлений они дают :)

Одним из интересных вопросов, которые возникли у меня в ходе недавнего Конгресса по вопросам архивного дела в Каталонии (Congrés d’Arxivística de Catalunya, http://arxivers.cat/ ), стал вопрос о различии в рамках работы архива между «документами» (records) и «представлениями» (representations).

Данный вопрос был наиболее четко поставлен Грегом Роланом (Greg Rolan, https://research.monash.edu/en/persons/greg-rolan , университет Монаш, Австралия)  который довольно-таки недвусмысленно заявил, что в его недавней работе на тему «Вовлекающее полномасштабное управление информацией»[1], понятие документа о событии вытесняется представлением этого события.

Подобное переименование влечёт за собой ряд интересных последствий для теории и практики архивного дела. Наиболее важно то, что в этом случае допускается сосуществование множества точек зрения на событие, которые могут поддерживать, дополнять или противоречить друг другу, - вместо, в противном случае, одного-единственного описания.

Мой комментарий: Много лет университет Монаш был одним из мировых центров архивно-документационной науки. Лично мне удивительно, что его представитель совершенно не понимает, что такое «документ», и что документов об одном и том же событии может быть сколько угодно, в том числе и составленных различными сторонами и отражающих различные точки зрения. Что далеко ходить – достаточно взглянуть в документы любого судебного дела! К тому же документ хоть горшком назови, хоть «представлением» – он от этого не престанет быть документом :)

Это особенно важно в ситуациях, когда существует дисбаланс власти и влияния между тем, кто документирует, и тем, кого документируют, - как, например, в конкретной ситуации, которую изучали австралийские специалисты: это документация австралийских интернатов, где длительное время живут подростки, которые «не в состоянии жить в семье ввиду риска физического, сексуального и эмоционального насилия или невнимания».

Возможность иметь несколько «представлений» о событии позволяет множеству заинтересованных сторон стать частью информационной системы и принять участие в её работе. Модели, ориентированные на создание документов, имеют тенденцию отдавать предпочтении отчетам о событиях, подготовленным организацией, в плане того, что является «авторитетным документом» и что является предметом спора или даже политической борьбы.
На фото – Грег Ролан (Greg Rolan)

«При использовании такого подхода, документ может отражать множество действий, и каждый вид деятельности может быть отражён во многих документах. Такая концептуализация меньше связана с природой документов как физических артефактов, чем со способствованием выражению человеческой деятельности и вовлечением. Кроме того, этот подход также допускает другие виды документальности, такие как личная память и сценическое представление» (Ролан, 2017, см. [3]).
Для меня это вдвойне интересно, поскольку стыкуется с моим собственным исследовательским интересом к архитектуре сети и тому, как она используется в качестве системы документации, или, смею сказать, «архива» [4]. Идея представления была введена в веб-архитектуру для того, чтобы разрешить определенные противоречия, связанные с ролью электронных объектов (documents) в сети [2] и их поведения с течением времени, в том числе с учётом предпочтений клиентов (веб-браузеры). Веб-сервер делает доступными представления ресурсов, и в зависимости от того, кто Вы, как и когда Вы делаете запрос, Вы можете получить другое представление этого ресурса. Документ - это удобная иллюзия ... а не материальный объект.

Подобно тому, как концепция Филдинга о передаче состояния представления (Representational State Transfer, REST – см. также Википедию, https://ru.wikipedia.org/wiki/REST - Н.Х.) уводит сеть от того, чтобы служить главным образом для передачи электронных объектов, - Ролан и соавторы просят нас рассматривать архивы в меньшей степени как коллекции документов, и больше как процессные системы, в которых события, их представления и соответствующие заинтересованные стороны существуют во времени и находятся во взаимоотношениях друг с другом. Я только что бегло ознакомился с этой «метамоделью метаданных для управления документами» на конференции, но вижу, что Ролан развивает идею, сформулированную в его работе [3], которую я собираюсь изучить более обстоятельно.

Литература

[1] Джоан Эванс (Joanne Evans), Сью МакКемиш (Sue McKemmish), Грегори Ролан (Gregory Rolan) «Вовлекающее полномасштабное управление информацией: Преобразование управления документами в учреждениях по уходу за детьми вне дома» (Participatory information governance: Transforming recordkeeping for childhood out-of-home care), журнал «Управление документами» (Records Management Journal), том 29 (1/2). 2018 г.

[2] Рой Филдинг (Roy Fielding) «Архитектурные стили и проектирование сетевых программных архитектур» (Architectural styles and the design of network-based software architectures), диссертация на степень PhD, Университет Калифорнии, г. Ирвин, 2000 г., https://www.ics.uci.edu/~fielding/pubs/dissertation/top.htm

[3] Грегори Ролан (Gregory Rolan) «На пути в интероперабельным документным системам: Метамодель метаданных для управления документами» (Towards interoperable recordkeeping systems: A meta-model for recordkeeping metadata), журнал «Управление документами» (Records Management Journal),, том 27(2), стр.125–148. 2017 г.

[4] Эд Саммерс (Ed Summers), Дорофия Сальо (Dorothea Salo) «Связывая объекты в сети: Прагматичное изучение использования связанных данных библиотеками, архивами и музеями» (Linking things on the web: A pragmatic examination of linked data for libraries, archives and museums), сайт Университета Корнелл (Cornell University), публикация arXiv:1302.4591. arXiv, 2013 год, https://arxiv.org/abs/1302.4591

Эд Саммерс (Ed Summers)

Источник: сайт Inkdroid
https://inkdroid.org/2019/05/15/records-and-representations/

Стандарты инновационного менеджмента ГОСТ, CEN и ИСО


В современной экономике инновации играют огромную роль, поэтому не удивительно, что целый ряд органов по стандартизации разрабатывает соответствующие стандарты.

В первую очередь стоит упомянуть опубликованные в 2013-2015 годах техническим комитетом TC 389 «Менеджмент инноваций» (Innovation management) Европейского комитета по стандартизации (CEN) технические спецификации CEN/TS 16555 «Менеджмент инноваций» (Innovation Management) в семи частях:
  • CEN TS 16555-1-2013 «Менеджмент инноваций – Часть 1: Система менеджмента инноваций» (Innovation Management - Part 1: Innovation Management System), см. http://www.doc88.com/p-9999658297109.html

    В России документ адаптирован как ГОСТ Р 56273.1-2014 «Инновационный менеджмент. Часть 1. Система инновационного менеджмента», см. http://protect.gost.ru/v.aspx?control=8&baseC=6&id=190575

  • CEN TS 16555-2-2014 «Менеджмент инноваций - Часть 2: Менеджмент стратегических знаний» (Innovation management - Part 2: Strategic intelligence management), http://www.doc88.com/p-0476416543930.html

    В России документ адаптирован как ГОСТ Р 56273.2-2016 «Инновационный менеджмент. Часть 2. Менеджмент стратегического прогнозирования», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=197411

  • CEN TS 16555-3-2014 «Менеджмент инноваций – Часть 3: Инновационное мышление» ( Innovation management - Part 3: Innovation thinking), http://www.doc88.com/p-5807837984481.html

    В России документ адаптирован как ГОСТ Р 56273.3-2016 «Инновационный менеджмент. Часть 3. Инновационное мышление», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=198057

  • CEN TS 16555-4-2014 «Менеджмент инноваций – Часть 4: Менеджмент прав интеллектуальной собственности» (Innovation management - Part 4: Intellectual property management), http://www.doc88.com/p-3418472846673.html

    В России документ адаптирован как ГОСТ Р 56273.4-2016 «Инновационный менеджмент. Часть 4. Управление интеллектуальной собственностью», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=198064

  • CEN TS 16555-5-2014 «Менеджмент инноваций – Часть 5: Менеджмент сотрудничества» (Innovation management - Part 5: Collaboration management), http://www.doc88.com/p-3418472846603.html

    В России документ адаптирован как ГОСТ Р 56273.5-2016 «Инновационный менеджмент. Часть 5. Менеджмент сотрудничества», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=198058

  • CEN TS 16555-6-2014 «Менеджмент инноваций – Часть 6: Менеджмент творческой деятельности» (Innovation management - Part 6: Creativity management), http://www.doc88.com/p-1085212939694.html

    В России документ адаптирован как ГОСТ Р 56273.6-2016 «Инновационный менеджмент. Часть 6. Менеджмент креативности», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=197945

  • CEN TS 16555-7-2015 «Менеджмент инноваций – Часть 7: Оценка менеджмента инноваций» (Innovation management - Part 7: Innovation Management Assessment), http://www.doc88.com/p-8701762173315.html

    В России документ адаптирован как ГОСТ Р 56273.7-2016 «Инновационный менеджмент. Часть 7. Оценка инновационного менеджмента», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=197953
У нас есть также ряд собственных национальных стандартов по менеджменту инноваций:
Технический комитет TC 279 «Менеджмент инноваций» (Innovation management) Международной организации по стандартизации (ИСО) также активно разрабатывает стандарты менеджмента инноваций серии ISO 56000. Часть этих документов явно готовится «по мотивам» технических спецификаций CEN:
Источник: сайт CEN / сайт ИСО / сайт Росстандарта
https://standards.cen.eu/dyn/www/f?p=204:110:0::::FSP_PROJECT,FSP_ORG_ID:35932,671850&cs=13A816A57184977C465944D2F2E2C5645

четверг, 13 июня 2019 г.

Дэвид Розенталь: Обзор технологии хранения данных в ДНК


Заметка д-ра Дэвида Розенталя (David Rosenthal – на фото, см. также https://www.lockss.org/contact-us/dshr/ ) была опубликована на его блоге (DSHR's Blog) 16 мая 2019 года.

Луис Сезе (Luis Ceze), Джефф Нивала (Jeff Nivala) и Карин Штраус (Karin Strauss) из Вашингтонского университета и исследовательской группы Microsoft опубликовали захватывающий обзор истории и современного состояния молекулярного хранения цифровых данных с использованием ДНК (Molecular digital data storage using DNA, https://doi.org/10.1038/s41576-019-0125-3 ). В аннотации на статью сказано:
«Молекулярное хранение данных является привлекательной альтернативой для целей плотного и долговечного хранения информации, которое крайне необходимо для преодоления растущего разрыва между производством информации и возможностями для хранения данных. ДНК является ярким примером эффективного архивного хранения данных в молекулярной форме.

В настоящем обзоре мы даём обзор самого процесса, текущего положения дел в этой области и проблем, которые необходимо решить для массового внедрения данной технологии.

Мы также даём обзор области систем молекулярной памяти in vivo (в живом организме – Н.Х.), которые записывают и хранят информацию в ДНК живых клеток, и которые, вместе с хранением данных в ДНК in vitro (вне живого организма, в культуре клеток – Н.Х.), принадлежат к расширяющейся области пересечения компьютерных систем и биотехнологий.»
Обзор включает в себя обширную библиографию.

На данном этапе развития технологии крайне полезно иметь авторитетный обзор этой области, особенно для борьбы с ажиотажем, который, по-видимому, всегда возникает вокруг хранения данных в ДНК. Специалисты совместной исследовательской группы Вашингтонского университета и Microsoft (UW/MSFT) по своей квалификации лучше, чем кто-либо, подходят для подготовки такого обзора.

Некоторые, возможно, считают, что я в своих постах преувеличивал сложность продвижения продукта для хранения данных в ДНК на рынок, когда писал (см. https://blog.dshr.org/2018/02/dnas-niche-in-storage-market.html ):
«Инженеры, перед Вами стоит вызов за менее чем 10 лет увеличить скорость синтеза в четверть триллиона раз при одновременном снижении стоимости в пятьдесят триллионов раз, при этом расходуя не более 24 миллионов долларов в год.» (1 триллион = 10**12 – Н.Х.)
Одна из вещей, относительно которых группа UW/MSFT всегда была впечатляюще реалистичной, - это масштаб технологических проблем, с которыми они сталкиваются. Они более-менее согласны с моей оценкой, когда пишут (см. https://doi.org/10.1038/s41576-019-0125-3 ):
«Текущая результирующая пропускная способность при записи данных в систему хранения на основе ДНК, скорее всего, будет порядка нескольких килобайт в секунду.

По нашим оценкам, система, способная через 10 лет конкурировать с популярными облачными системами архивного хранения, должна будет обеспечивать пропускную способность при записи и чтении, измеряемую гигабайтами в секунду. Это разрыв на 6 порядков в части синтеза и примерно на 2–3 порядка в части расшифровки последовательности генов (sequencing).

Что касается разницы в затратах, то стоимость хранения на ленте в 2016 году составляла около 16 долларов США за терабайт, и ежегодно снижается примерно на 10% в год. Затраты на синтез ДНК, как правило, не раскрываются, но ведущий аналитик отрасли Роберт Карлсон (Robert Carlson) оценивает стоимость синтеза массива приблизительно в 0,0001 долл. США за базовую аминокислоту, что в итоге составляет 800 млн. долл. США за терабайт – т.е. на 7–8 порядков выше, чем у ленты.»
К сожалению, чтобы вытеснить ленту с рынка, недостаточно обеспечить конкурентоспособную стоимость записи по сравнению с лентой. ДНК-хранение должно быть значительно дешевле.

Обзор в академическом журнале - не место для маркетингового анализа, который я провел в своей публикации «Ниша ДНК-решений на рынке хранения» (DNA's Niche in the Storage Market, https://blog.dshr.org/2018/02/dnas-niche-in-storage-market.html ), поэтому следующие три придирки - это именно придирки.

Во-первых, Сезе и соавторы не учитывают самый важный фактор стоимости, когда пишут:
«Плотность, долговечность и расходы на энергию в состоянии покоя являются основными факторами для архивного хранения, целью которого является хранение огромных объемов данных для использования в будущем в долговременной перспективе.»
Одной из фундаментальных экономических проблем, которую я не обсуждал в статье «Архивные носители информации – не самый процветающий бизнес» (Archival Media: Not A Good Business, https://blog.dshr.org/2018/03/archival-media-not-good-business.html , перевод на русский язык см. https://rusrim.blogspot.com/2018/03/blog-post_15.html - Н.Х.),  является барьер, связанный с эпидемией ориентации общества на краткосрочную перспективу (short-termism, см. https://blog.dshr.org/2014/07/discounting-far-future.html ).

Как показала наша работа над экономическими моделями долговременного хранения (The Economics of Long-Term Digital Storage, http://www.lockss.org/locksswp/wp-content/uploads/2012/09/unesco2012.pdf ), долговечные носители информации, требующие высоких капитальных затрат и затрат на запись, но с низкими эксплуатационными расходами, - находятся в крайне невыгодном положении по сравнению с недолговечными носителями с низкими капитальными затратами, но более высокими эксплуатационными расходами (включая затраты на регулярную миграцию на носители следующего поколения).

Во многом именно из-за данного барьера лента занимает столь небольшую часть общего рынка средств и систем хранения. В приведенной выше цитате авторам следовало включить «капитальные затраты на систему».

Во-вторых, стоимость роботизированного жидкостного оборудования для записи и чтения в системах ДНК-хранения, вероятно, будет оставаться довольно высокой. Как и в случае с «холодным» Blu-Ray-хранилищем Facebook (см. https://blog.dshr.org/2014/09/more-on-facebooks-cold-storage.html ), эти расходы необходимо амортизировать посредством хранения большого объема данных. Таким образом, с экономической точки зрения ДНК-хранение, вероятно, лучше всего подойдёт для систем масштаба центров обработки данных, что делает маркетинговые проблемы еще более сложными, потому таких потенциальных клиентов очень немного. Все они намного крупнее любого поставщика устройств хранения данных и, ввиду этого, способны отжимать маржу поставщика устройств, как  они это делают на рынках жестких дисков и флеш-памяти (см. https://blog.dshr.org/2019/05/demand-is-even-less-insatiable-than-it.html ).

В-третьих, Сезе и соавторы пишут (см. https://doi.org/10.1038/s41576-019-0125-3 ):
«Использование ДНК для хранения данных обеспечивает плотность до 10**18 байт на кубический мм, что примерно на шесть порядков плотнее, чем у самых плотных носителей информации, доступных сегодня.»
В своей заметке «Ниша технологий на основе ДНК на рынке хранения информации» (DNA's Niche in the Storage Market, https://blog.dshr.org/2018/02/dnas-niche-in-storage-market.html ) я сравнил плотность ДНК-носителя с плотностью жёсткого диска:
«Современные жёсткие диски хранят 1,75 ТБ пользовательских данных на пластину в магнитном слое толщиной 20 нм с каждой стороны. Пластина диаметром 95 мм имеет в центре отверстие диаметром 25 мм, поэтому объем слоя, который фактически содержит данные, равен π * (95**2-25**2) * 40 * 10**(-6) ≅ 1 кубический мм. Этот том содержит 1,4 * 10**13 используемых битов, соответственно, каждый бит занимает около 7 * 10**(-14) кубических мм.»
Таким образом, реально нужно сопоставлять 1,25 * 10-(19) мм**3 / бит против 7 * 10**(-14) мм**3 / бит, таким образом, разница составляет около 5,6 * 10**5. Различие в шесть порядков возможно, но оно вводит в заблуждение по двум причинам. Во-первых, сравнивается максимальная теоретически возможная плотность ДНК-носителя с реальной плотностью жёстких дисков 2018 года в массовом производстве. Во-вторых, как я писал в том же посте ( https://blog.dshr.org/2018/02/dnas-niche-in-storage-market.html ), плотность устройств хранения намного ниже, чем плотность «первичной» среды хранения. Для жесткого диска:
«Накладные расходы на упаковку, окружающую первичные биты, примерно в полмиллиона раз больше, чем на сами биты. Если бы эти издержки можно было устранить, мы могли бы хранить 7 экзабайт в накопителе 3,5-дюймового формата.

В системе ДНК-хранения будут аналогичные накладные расходы.»
Насколько большими окажутся накладные расходы на упаковку, зависит от ряда вопросов проектирования системы, которые еще предстоит решить, но в конечном итоги системы ДНК-хранения вряд ли будут в миллион раз плотнее, чем их конкуренты.

Дэвид Розенталь (David Rosenthal)

Источник: DSHR's Blog
https://blog.dshr.org/2019/05/review-of-data-storage-in-dna.html

Китай: Опубликована статья Шерри Сье и Фань Гуан-янь, анализирующая понятие аутентичности применительно к электронным документам и электронным доказательствам


Статья представителей факультета управления информационными ресурсами Народного университета Китая ( 中国人民大学, Renmin University of China) Шерри Сье (Sherry Li Xie, 谢丽) и Фань Гуан-янь (范冠艳, Fan Guanyan – о ней см. также http://faberresidency.com/project/guanyan-fan/ ), под названием «Анализ понятия аутентичности в сфере электронных документов и электронных доказательств» (电子文件与电子证据领域中的真实性概念分析,"Authenticity" in the Fields of Electronic Records And Electronic Evidence), была опубликована в первом номере за 2019 год журнала «Архивы провинции Чжэцзян» (浙江档案, Zhejiang Archives). 

Статья тем более интересна, что Шерри Сье фактически является представителем авторитетной архивной школы Университета Британской Колумбии (Канада).

Статья доступна по адресу: http://blog.sina.com.cn/s/blog_599ea7890102z4y5.html , или, в виде графических образов, здесь: http://www.doc88.com/p-4415083496772.html . Имеется краткое содержание на английском языке, в котором сказано следующее:
«В настоящей статье сообщается о результатах исследования, в ходе которого взятые за основу определения понятия «аутентичность» (真实性, authenticity) и требования к ней китайского права сравнивались с трактовкой данного понятия национальным архивным сообществом, - а также с соответствующим толкованиями, используемыми в Канаде.

В ходе исследования выяснилось, что термин «аутентичность» трактуется иначе, чем в положениях китайского законодательства о доказательствах, и эта трактовка отличается от той, что используется в соответствующем канадском законодательстве.

По итогам исследования высказано предложение о том, чтобы сообщество специалистов в области управления документами и архивного дела более активно включалось в дискуссии, связанные с электронными доказательствами, и воспользовалось возможностью внести свой вклад в развитие обеих областей.»

Ключевые слова: электронные документы; электронные архивы; электронные доказательства; правила доказывания; Канада
В аннотации на китайском языке последний параграф сформулирован несколько иначе:
«Исследование показало, что отсутствие концептуальной строгости и системности является проблемой, с которой сталкиваются как представители юридической профессии, так и национальное архивное сообщество. Существующие положения о доказательствах предъявляют строгие требования к аутентичности, но молчат о том, как конкретно оценивать аутентичность.

Авторы считают, что архивно-документационное сообщество в интересах совершенствования своей понятийной системы должно адаптировать понятие аутентичности и методы её оценки из сферы электронных доказательств, с тем, чтобы его профессиональные знания и навыки содействовали систематичности и работоспособности на практике законодательства об электронных доказательствах.»
С «архивной» стороны в статье рассматриваются определение из национального стандарта DA/T 58-2014 «Управление электронными документами – Основные термины» («电子档案管理基本术语», Electronic records management basic terms), выбранное в качестве наиболее репрезентативного, и из стандарта GB/T 18894-2016 «Требования к архивации и управлению электронными документами» («电子文件归档与电子档案管理规范», Specification on electronic documents archiving and electronic records management). Они сопоставлялись с 12 национальными законами, упоминающими аутентичность. Также эти определения сопоставлялись с соответствующими определениями, используемыми в Канаде, которая была отмечена как лидер в области управления документами и архивного дела.

В статье приведен ряд цитат из стандартов и национального законодательства. В частности, определение из DA/T 58-2014 звучит следующим образом:
3.12 Аутентичность (真实性, authenticity)

Контент, структура и контекст создания электронного архивного документа соответствуют его оригинальному состоянию на момент его формирования.

Примечание: Аутентичные электронные архивные документы создаются конкретной организацией с использованием безопасного и надёжного системного программного обеспечения.
С моей точки зрения, это не самое блестящее определение. Впрочем, если посмотреть на российские определения (например, здесь: http://www.ciscra.org/mat/mat/term/2098 , http://www.ciscra.org/mat/mat/term/2090 и http://www.ciscra.org/mat/mat/term/6672 ), то видно, что и у нас с «аутентичностью» не всё хорошо.

Для сравнения с канадской практикой, авторы использовали Закон Канады о доказывании (Canada Evidence Act, https://laws-lois.justice.gc.ca/eng/acts/c-5/ ) и стандарт CAN/CGSB-72.34-2017 «Электронные документы как документальное доказательство» (Electronic Records as Documentary Evidence), https://www.scc.ca/en/standardsdb/standards/28933 , см также мой пост https://rusrim.blogspot.com/2017/05/cancgsb-7234-2017.html ).

Проведенное авторами сопоставление показало, что в одних случаях (законодательство Китая) под «аутентичностью» понимается верность содержания, а в других (законодательство Канады) – знание происхождения документа, достоверность сведений о его идентичности. Не секрет, что в и России имеют место обе эти трактовки – и более старая, используемая в китайском праве, и более современная международная трактовка, используемая в праве Канады.

На мой взгляд, статья интересная как в теоретическом плане, так и в плане знакомства с законодательством и стандартами Китая. Её вполне пристойно переводят автопереводчики, так что я бы рекомендовала отечественным специалистам обратить на неё внимание.

Источники:
http://blog.sina.com.cn/s/blog_599ea7890102z4y5.html
http://www.doc88.com/p-4415083496772.html

среда, 12 июня 2019 г.

Андриан Каннингем: Обзор книги «Варианты будущего архивов», часть 3


(Окончание, предыдущую часть см. http://rusrim.blogspot.com/2019/06/2_11.html )

Глава 6, написанная Соньей Ранаде (Sonia Ranade), посвящена теме «Технологии доступа для инновационного электронного архива». Электронно-цифровые технологии обещают захватывающие и, казалось бы, бесконечные возможности для революционных улучшений систем и процессов для доступа к архивным документам и их использования. Читая, как Ранаде обсуждает многие из этих возможностей, меня удивило то, что она игнорирует, пожалуй, самый трансформационный электронный архив последних лет – Викиликс (WikiLeaks). Несомненно ведь, что в книге о вариантах будущего архивов заслуживает рассмотрения нечто столь важное, как WikiLeaks, который, как можно утверждать, делает режим доступа государственных архивов совершенно ненужным, не так ли?

Австралийская идеология континуума документов нашла отражение в главе 7 «Различные права в документах: роль делопроизводческой информатики», подготовленной Барбарой Рид (Barbara Reed) вместе с её соавторами Джиллиан Оливер (Gillian Oliver), Фрэнком Апвордом (Frank Upward) и Джоан Эванс (Joanne Evans).

Делопроизводческая информатика (recordkeeping informatics) - это модель, следующая стратегиям Бирмана по проектированию документных систем «с нуля», с тем, чтобы удовлетворить выявленные разнообразные кратко- и долгосрочные потребности в документах и обеспечить права на документы. Она сочетает в себе анализ информационной культуры, бизнес-процессов и потребностей в доступе, - и все это становится возможным благодаря метаданным.

Модель проиллюстрирована на примере гипотетического случая управления документами в интернатах. Рид и др. указывают на недавние скандалы в Австралии и на комиссии по расследованию, которые высветили трагические недостатки в унаследованном делопроизводстве в подобных ситуациях. Обоснование для того, чтобы использовать подход делопроизводческой информатики, является убедительным - по крайней мере, в данной ситуации с обездоленными детьми. Однако наша способность применять такие подходы в других ситуациях и контекстах неизбежно будет ограничена готовностью принимающей организации расширять возможности субъектов документов.

В тех случаях, когда при проектировании документных систем встаёт вопрос о контроле и власти (а так бывает всегда), мы должны взаимодействовать на политическом уровне, обеспечивая, чтобы защита и поддержка прав субъектов были заложены при проектировании таких систем. Некоторые из подобных битв мы выиграем, многие проиграем, - но мы должны попытаться. Наличие хорошей модели вроде делопроизводческой информатики крайне важно, но он неё не будет пользы, если у нас не хватит смелости включиться в борьбу за права субъектов с самого начала, а не через тридцать лет после событий.

В главе 8 «Материалы, попавшие в архив случайно» Майкл Мосс (Michael Moss) и Дэвид Томас (David Thomas) весьма занимательно аргументируют, что независимо от того, что там думает Брюстер Кале (Brewster Kahle – видный американский компьютерный специалист и предприниматель, основатель «Интернет Архива» (Internet Archive) и «Алексы» (Alexa) – Н.Х.), интернет нельзя архивировать, поскольку он сам является архивом. Более того, все наши усилия в области архивации в настоящее время документируются в «архиве», которым является Интернет.

Статья Мосса и Томаса сфокусирована на философских вопросах, а несчастный Кале просто послужил в качестве боксёрской «груши» при переходе к их более широкому тезисы, касающемуся онтологии архивов. Согласно этой онтологии, архивы являются свободными, органичными, существующими во времени (temporal), ограниченными конкретными обстоятельствами (contingent), «проницаемыми» (permeable) и находятся в состоянии постоянных метаморфоз. Они не являются закрытыми, абсолютными, привилегированными и фиксированными.

Последняя глава 9 «Конец архивных идей?»  - самая интригующая. Её автор Крэг Гоулд (Craig Gauld) спрашивает, не достигли ли мы той точки в нашем коллективном путешествии, когда архивные идеи оказались исчерпанными?

Он описывает эпоху с 1980-х до начала 2000-х годов как век идей для архивной отрасли. Это было время, когда устоявшиеся (и несколько скучное и предсказуемое) ремесло управления архивами было выведено из равновесия и подверглось турбо-зарядке огромными дозами теории, начиная от постмодернизма, через пост-кастодиализм (post-custodialism – подход, предусматривающий управление и/или методическую поддержку деятельности по обеспечению сохранности материалов на месте, без передачи их на хранение в архив – Н.Х.) и теорию континуума (continuum theory - разработанная австралийскими архивистами концепция, которая, в противовес теории жизненного цикла документов, где срок их существования делится на четко определенные периоды, рассматривает его как непрерывный поток, где различные этапы существования документов могут пересекаться, и даже происходить одновременно, см. http://www.ciscra.org/mat/mat/term/2804/3399 - Н.Х.), и вплоть до явного интереса к обеспечению социальной справедливости.

То, что когда-то считалось радикальным и конфронтационным, стало теперь общепринятой ортодоксией (Крэг Гоулд на стр.142 называет такое положение дел «уютным консенсусом»), причем в последнее десятилетие наблюдается заметное истощение новых критических теоретических идей. Хотя количество выпускников архивных вузом заметно выросло, где, спрашивает автор, новые личности, такие как Терри Кук (Terry Cook), Верн Харрис (Verne Harris), Джанет Бастиан (Jeanette Bastian), Эрик Кетелаар (Eric Ketelaar), Том Несмит (Tom Nesmith), Сью МакКемиш (McKemmish) и Рэндалл Джимерсон (Randall Jimerson)? Согласно Гоулду, мы достигли «пика теории» (стр. 147).

Мой комментарий: Меня, откровенно говоря, уже в наших российских условиях очень беспокоит то, что постепенно из отрасли уходят яркие личности, как теоретики, так и практики, и этот отток сегодня не компенсируется притоком талантливой молодёжи (хотя, к счастью, такая молодежь у нас всё-таки есть!).

Не думайте, это вовсе не заламывание рук кого-то из представителей старшего поколения, впавшего в отчаяние из-за легкомыслия и недостатков современной молодежи. Мир изменился, - и сегодняшние архивисты предпочитают, по вполне серьёзным основаниям, посвятить свои усилия консолидации и внедрению более ранних теоретических достижений. Нельзя ожидать того, чтобы всё время жить в состоянии постоянного теоретико-познавательного (эпистемологического) потока. Гоулд не может не беспокоиться по воду того, не перестали ли мы мыслить, потому что «знание имеет более непосредственную ценность» (стр. 144). Однако он признаёт, что реальность ситуации на рабочем месте для нынешних архивистов такова, что спонсоры диктуют то, что «рыночный язык использования и эффективности является ключевым, в то время, как идеал менеджеризма (managerialism – теория, подразумевающая руководство экономикой управляющими-профессионалами/технократами – Н.Х.) отсекает вопросы этики и морали от государственных услуг» (стр. 145).

Эпистемологический поток - это роскошь (возможно, необходимость), которую мы можем себе позволить в периоды, когда архивные службы находятся на подъёме. Но в те периоды, когда само их существование находится под угрозой из-за сокращения финансирования и менеджеризма, вероятно, лучшим подходом является перестать причитать по поводу теории и вместо этого направлять свои силы на формулирование и пропаганду более высоких целей и методов развёртывания, которые соответствуют новым и нарождающимся обстоятельства, с целью достижения конкретных целей.

Несколько иронично то, что книга о вариантах будущего архивов завершается разговором о том, что для выживания стало необходимым минимизировать самокопание и переосмыслить то, о чём с радостью говорится в остальных частях книги. Похоже, что общим лозунгом являются слова «Сохраняйте спокойствие и продолжайте работать»,

Даже если Вы один из тех архивистов, которые предпочитают «сохранять спокойствие и продолжать работать», Вам будет приятно и полезно потратить время на чтение этой небольшой, но очень стимулирующей книги.

В любой книге такого рода неизбежно есть умолчания и упущения. Сдвиг архивных усилий от обслуживания больших и влиятельных правительств в сторону архивация на уровне рядовых людей и сообществ почти ли упоминается. Также не отражены точки зрения, существующие вне пределов Северной Америки, Великобритании и Австралии. Где авторы из Африки, Латинской Америки, Азии и островов Тихого океана? Не представлена даже континентальная Европа! Возможно, когда некоторые из предсказаний, сделанных в данном томе на основании заглядывания в хрустальный шар, окажутся – что весьма вероятно – ошибочными, будет иметь смысл подумать о публикации второго тома…

Книгу «Варианты будущего архивов» можно приобрести в издательстве Facet Publishing.

Андриан Каннингем (Adrian Cunningham)

Литература

[1] David Bearman, “Archival Strategies,” The American Archivist 58, no. 4 (Fall 1995): 380-413.

[2] International Organization for Standardization, ISO 15489:2016 Information and documentation — Records management — Part 1: Concepts and principles; ISO TR 21946:2018 Information and documentation – Appraisal for managing records (Geneva: International Organization for Standardization, 2018).

[3] David Bearman, Archival Methods (Pittsburgh: Archives and Museum Informatics, 1989).

[4] David Bearman, “Documenting documentation,” Archivaria 34 (Summer 1992): 33-49.

[5] International Council on Archives, web page for resources on ‘Records in Contexts’ conceptual model, https://www.ica.org/en/egad-ric-conceptual-model

Источник: сайт «Recordkeeping Roundtable»
https://rkroundtable.org/2019/05/13/a-review-of-archival-futures-caroline-brown-ed-by-adrian-cunningham/

Американские военные собираются создать архив из 350 миллиардов сообщений в социальных сетях и организовать его изучение


Данная заметка Пита Нормана была опубликована 25 мая 2019 года на сайте компании Bloomberg.

Военные США планируют собрать и проанализировать 350 миллиардов постов в социальных сетях со всего мира, в надежде, что это поможет им отслеживать развитие популярных движений.

Тендер на проект, который предполагается выполнять на базе Военно-морской аспирантуры (Naval Postgraduate School) в г. Монтерее (Monterey), штат Калифорния, предусматривает отбор сообщений от не менее 200 миллионов пользователей из более чем 100 стран на более чем 60 языках, с целью лучшего понимания «коллективного самовыражения». Сообщения (включающие имена пользователей), будут проверены на наличие комментариев, метаданных, сведений о географическом регионе и родном городе.


Хотя этот проект является частью существующей аналитической программы Министерства обороны США по использованию возможностей больших данных для социальных исследований, «масштабы и глобальный охват этой программы поражают», - отметил в своём электронном письме старший преподаватель международных отношений в Университете Лондона Антуан Буске (Antoine Bousquet).

В соответствии с техническим заданием на тендер, цель исследования заключается в том, чтобы проанализировать сообщения социальных сетей, опубликованные публично в период с июля 2014 года по декабрь 2016 года на одной платформе. Как уверяют американские ВМФ, частная переписка в базу включена не будет, и отдельные пользователи не будут идентифицироваться в рамках проводимых исследований.

Что мобилизует людей?

На основной платформе компании Facebook Inc. ежедневно работает более 1,2 миллиарда активных пользователей, на платформе компании Twitter Inc. - более 300 миллионов пользователей в месяц. Если их напечатать на стандартных листах бумаги, 350 миллиардов отдельных сообщений составят стопку высотой около 10 тысяч миль (по моим расчётам получается вдвое больше – 35 тысяч км – Н.Х.).

Научный руководитель проекта Т. Кэмбер Уоррен (T. Camber Warren) сказал, что эти данные будут использованы для более глубокого понимания общения между людьми и того, как со временем меняются типовые сценарии обмена мнениями.

Он ранее изучал внутренние конфликты в Африке, показывая, как средства массовой информации, такие как радиопередачи, могут оказывать умиротворяющее воздействие, в то время как социальные сети способны разжигать коллективное насилие.

«Данные из социальных сетей впервые позволяют нам измерить, как разговорные выражения и сленг развиваются с течением времени в разнообразных человеческих обществах, так что мы можем начать понимать, как и почему сообщества формируются вокруг определенных форм обмена мнениями. а не каких-то других», пояснил Уоррен с воём электронном письме.

По его словам, эти данные могут быть использованы для обучения алгоритмов понимать «все более тонких сдвиги в культурном контексте».

Сеяние раздора и как с этим бороться

Подобные проекты важны для защиты от противников, стремящихся подорвать демократию и посеять раздор в западных обществах, подчеркнул заместитель директора по технической политике Центра стратегических и международных исследований в Вашингтоне Уильям Картер.

«Чтобы защитить себя от подобных атак, нам нужно лучше понять, как складываются стереотипы и формируются онлайн-сообщества», - сказал он.

Тем не менее, сбор и анализ больших массивов общедоступных данных может открыть дорогу для злоупотреблений.

«Существует риск того, что когда мы научимся использовать эти данные для управления взаимодействием людей в онлайн-среде, это даст правительствам и злонамеренным действующим лицам инструменты, которые они смогут использовать для манипулирования нашими мыслями и поведением», - отметил Картер.

Пит Норман (Pete Norman)

Мой комментарий:
Я не склонна к паранойе – не все исследование американских и иных военных преследуют какие-то злонамеренные цели. В то же время мы хорошо знаем (и помним по «цветным» революциям) – если полученное знание можно будет использовать как оружие, оно будет обязательно использовано таким образом. Хорошо, что хотя бы научный руководитель проекта понимает, что любой новый вид оружия обязательно появится и у «другой стороны» (или сторон) и может быть использован и против самих США.

Однако больше всего данная новость заинтересовала меня как ещё одно подтверждение того, как может измениться роль и значение архивов в современных условиях (а речь идёт о крупном электронном архиве, который – если результаты проекта оправдают ожидания военных – будет затем регулярно пополняться).

Источник: сайт Bloomberg
https://www.bloomberg.com/news/articles/2019-05-25/u-s-military-to-trawl-through-350-billion-social-media-messages

вторник, 11 июня 2019 г.

Андриан Каннингем: Обзор книги «Варианты будущего архивов», часть 2


(Продолжение, начало см. http://rusrim.blogspot.com/2019/06/1_10.html )

Во второй главе «Чья истина? Документы и архивные документы как свидетельства в эпоху пост-правды и дезинформации» Лючиана Дюранти (Luciana Duranti)  предлагает для сегодняшних и будущих архивистов другую важную роль – в качестве защитников и хранителей истины. Способность обеспечить целостность, надежность, аутентичность и достоверность информации всегда была ключевым элементом нашей профессиональной миссии. Слухи, фальсификации и дезинформация не являются чем-то новым, они так же стары, как человечество. Социальные сети, однако, способствовали расширению многообразия средств, каналов и платформ, посредством которых распространяется дезинформация.

Добавьте это к мрачным реалиям того, как крупный бизнес, крупное правительство и другие зловещие агенты «пылесосят», агрегируют и анализируют наши персональные данные (причём эти данные могут быть, а могут и не быть точными или надёжными), с тем, чтобы использовать эти данные против нас. Дюранти предлагает «вычислительную архивную науку» (computational archival science) в качестве междисциплинарной стратегии для использования наших базовых знаний и навыков, выступая в роли защитников доказательств с целью продвижения дела истины и прозрачности в мире «пост-правды» (post truth).

Коллега Дюранти по Университет Британской Колумбии и проекту InterPARES Виктория Лемьё (Victoria Lemieux) в главе 3 изучает «Будущее архивов как сетевых, децентрализованных, автономных и глобальных», уделяя особое внимание преобразующим возможностям, предоставляемым технологией блокчейна.

Наиболее известный как технология, лежащая в основе таких криптовалют, как Биткойн, блокчейн хранит аутентифицированные документы о транзакциях в одноранговой (peer to peer) сети распределенных компьютеров. Технология блокчейна, учитывая её нацеленность на независимое обеспечение аутентичности документов о транзакциях, представляет очевидный интерес и является потенциально полезной для архивистов.

Сможет ли блокчейн сделать нас ненужными или же станет той «серебряной пулей», которая поможет нам выполнять нашу работу в цифровом сетевом мире, где очень мало какой информации можно слепо доверять? Хотя блокчейн может оказаться просто преходящим увлечением, кажется более вероятным, что он окажет очень серьёзное воздействие на наш мир. Ввиду этого, мы должны быть готовы в максимальной степени использовать его возможности и работать над тем, чтобы хранящиеся в блокчейнах документы могли быть использованы и поняты в длительной перспективе с учетом их более широкого контекста и взаимосвязей.

Если у архивистов будет какое-либо будущее, ключевым является вопрос о том, есть ли в этом будущем место для экспертизы ценности, - и если да, то как эту экспертизу можно будет проводить. Совершенно очевидно, что прежние и нынешние подходы к экспертизе ценности терпят неудачу. ИТ-специалисты и некоторые архивисты регулярно утверждают, что экспертиза не нужна, поскольку у нас теперь есть средства, чтобы сохранять все и навсегда. Написанная Джеффри Ео (Geoffrey Yeo) глава 4 «Можем ли мы сохранить всё? Будущее экспертизы ценности в мире цифрового изобилия» посвящена изучению этого важного вопроса.

Конечно, возможности для хранения цифровых данных увеличиваются в геометрической прогрессии, в то время, как удельные затраты на хранение данных экспоненциально снижаются. Аналитика больших данных изменила ценность и полезность того, что когда-то рассматривалось как данные большого объема / малой ценности или как данные преходящей ценности. Но это, тем не менее, не означает, что мы можем сохранять всё и навсегда. Несмотря на упомянутые выше достижения, способность нашего мира создавать новые данные продолжает опережать нашу способность их хранить. И хотя удельные затраты на хранение продолжают неуклонно падать, общая стоимость хранения всех этих данных по-прежнему представляет для общества серьезные проблемы.

Новые центры хранения и обработки данных обычно требуют строительства новых электростанций для удовлетворения их ненасытных потребностей в энергии. Даже с учётом всех достижений в области технологий возобновляемых источников энергии, планета Земля не может выдержать сценарий, при котором все данные хранятся вечно. Но даже если бы это и было возможно, и это было бы оправданно, расходы на хранение данных - это только одна из составных частей затрат на сохранение электронных документов. Активный менеджмент, осмысление и обеспечение долговременной сохранности данных обходятся значительно дороже, чем простое хранение, и за всё это нужно каким-то образом платить.

Так что же нам делать? Можем ли мы просто сидеть сложа руки, позволяя естественной деградации идти своим чередом, и стараться при этом делать всё возможное для уцелевших цифровых обломков? Существуют ли какие-либо активные варианты обеспечения сохранности одних архивных документов за счёт других, при этом уцелевшие неизбежно окажутся «подпорченными» нашими произвольными и субъективными предубеждениями - и, следовательно, несостоятельными? Имеем ли мы право брать на себя роль бога таким образом?

Конечно, одна вещь, которая точно должна измениться, - это наша тенденция «снимать сливки», отбирая на долговременное хранение группы документов из более крупных массивов или из документных систем. Эта практика ужасала сэра Хилари Дженкинсона (Hilary Jenkinson - британский классик архивной науки – Н.Х.), который считал, что такой подход нарушал органическую целостность и внутренние контекстуальные взаимосвязи в документных системах.

В случае электронных документов обычно дешевле и проще сохранить весь контент документной системы. В тех же случаях, когда «снятие сливок» всё ещё может быть полезным, мы можем использовать технологии э-раскрытия вместо того, чтобы просить людей выполнить эту неблагодарную задачу вручную. В будущем решения в рамках экспертизы ценности будут приниматься не внутри документных систем, а в отношении целых документных систем. Какие системы содержат документы, заслуживающие того, чтобы сохранить их целиком, а какие не стоят затрат и усилий на активное архивное обеспечения сохранности?

Трудные выборы по-прежнему должны быть сделаны в рамках защитимой и прозрачной системы принятия решений. Экспертиза ценности всегда была такой - или, по крайней мере, должна была быть. Должны измениться наши методы проведения экспертизы ценности. Также должно измениться наше представление о том, что такое экспертизе ценности (appraisal). Экспертиза не может быть просто рядом принятых «пост фактум» решений по отбору документов, которые, как считается, подошли к концу их «активной жизни», - хотя потребность в принятии подобных решений, вероятно, никогда не исчезнет.

Более подходящее представление об экспертизе ценности (которую теперь лучше называть документационным анализом) сформулировано во втором издании международного стандарта управления документами ISO 15489: 016 и в сопровождающем его техническом отчете о документационном анализе, ISO TR 21946:2018 [2]. В этих документах Международной организации по стандартизации (ИСО) документационный анализ рассматривается как непрерывно идущий итерационный процесс определения потребностей в документах. Если заинтересованному стороне известно, какие документы необходимы (частным лицам, организациям и/или обществу), она может проектировать информационные и архивные системы, которые создают, захватывают, описывают, управляют, хранят, обеспечивают долговременную сохранность этих документов и позволяют их использовать. Эта работа является (или, по крайней мере, должна стать) одним из наших основных навыков - и это тот навык, который будет иметь еще большую ценность для общества по мере того, так оно будет пытаться справиться с перепроизводством данных.

Упомянутое выше сочинение Дэвида Бирмана служит пробным камнем для подготовленной Дженни Бан главы 5 «Рамки и будущее архивной обработки».

Выказанные Бирманом в конце 1980-х и начале 1990-х годов призывы заново изобрести архивные методы продолжают и сегодня находить отклик [3]. Бирман предлагал архивистам прекратить полагаться на свои собственные, созданные вручную описания, и вместо этого повторно использовать созданные в документных системах метаданные, дополняя их метаданными, предоставленными пользователями [4]. Он утверждал, что архивистам нужно заниматься не описанием документов, а, скорее, документировать деятельность по их созданию. Значительная часть идей Бирмана в настоящее время является архивным каноном – если не в плане практического внедрения, то, по крайней мере, на словах. Недавним примером может служить работа экспертной группы по архивному описанию Международного совета архивов (МСА) и её проект концептуальной модели «Документы в контекстах» (Records in Contexts) [5].

Но у Бан есть свои сомнения. Её беспокоит жизнеспособность подхода к архивным документам, который опирается на создание и поддержание систем с целью поддержки отдельных взаимосвязанных, интероперабельных описаний различных сущностей, вовлечённых в процессы создания документов. Она считает, что для архивистов более реалистичным подходом была бы работа «осмыслителей» (sense-makers), извлекающих и показывающих смысл на основе огромного количества документов, которые мы стремимся сохранить, - используя умные масштабируемые технологии автоматизированной обработки, которые сейчас становятся доступными (стр.72-74).

Её дозу реализма можно лишь приветствовать, и «осмысление», несомненно, является ценным вкладом, получению которого архивисты всегда должны помогать. Тем не менее, меня беспокоит то, что если мы сузим рамки наших целей, отступив в мир анализа документов по завершении их активного использования в деловой деятельности, то тот смысл, который мы могли бы придать этим документам, будет в лучшем случае замутнён и запутан.

(Окончание следует, смю http://rusrim.blogspot.com/2019/06/3.html )

Андриан Каннингем (Adrian Cunningham)

Источник: сайт «Recordkeeping Roundtable»
https://rkroundtable.org/2019/05/13/a-review-of-archival-futures-caroline-brown-ed-by-adrian-cunningham/

Великобритания, проект ARCHANGEL: Защита национальных архивных документов с помощью искусственного интеллекта и блокчейна


Данная заметка была опубликована 29 мая 2019 года на сайте InvestorIdeas.com

Мой комментарий: О проекте ARCHANGEL, осуществляемом Национальными Архивами Великобритании, см. также посты https://rusrim.blogspot.com/2017/09/blog-post_70.html , https://rusrim.blogspot.com/2018/07/blog-post_12.html , http://rusrim.blogspot.com/2018/08/2-archangel-1.html и https://rusrim.blogspot.com/2018/10/1.html

Университет Суррея (University of Surrey) использует свои разработки в сфере новейших технологий блокчейна и искусственного интеллекта для защиты электронных государственных документов, хранящихся в национальных архивах различных стран мира, включая Великобританию, Австралию и Соединённые Штаты Америки.

В статье (см. https://arxiv.org/abs/1904.12059 - речь идёт о статье группы авторов «Проект Архангел: Защита видеоархивов от несанкционированных изменений с использованием сохраняемых в блокчейне хешей темпорального контента» (ARCHANGEL: Tamper-proofing Video Archives using Temporal Content Hashes on the Blockchain), представленной 26 апреля 2019 года – Н.Х.), доклад по которой будет представлен на конференции по компьютерному зрению и распознаванию образов (Computer Vision and Pattern Recognition, CVPR) в Лос-Анджелесе в июне этого года (см. http://cvpr2019.thecvf.com/ ), представители Центра зрения, речи и обработки сигналов при университете Суррея (Centre for Vision, Speech and Signal Processing, CVSSP, https://www.surrey.ac.uk/centre-vision-speech-signal-processing ) рассказывают о том, как они сотрудничают с Институтом открытых данных (Open Data Institute) и Национальными архивами Великобритании над созданием системы «Архангел» (ARCHANGEL) - высокозащищенной, децентрализованной, основанной на блокчейне системой (использующей также некоторые наработки в области компьютерного зрения), которая обеспечит защиту долгосрочного будущего электронных видеоархивов.

Полный текст статьи доступен по адресу https://arxiv.org/abs/1904.12059

Блокчейн - это технология, лежащая в основе криптовалют, таких, как Биткойн. Университет Суррея изучает альтернативное, нефинансовое использование технологии блокчейна для общественной пользы. Блокчейн в решении ARCHANGEL работает как база данных, поддерживаемая многими архивами; каждый может проверять и добавлять документы, но никто не может их изменить. Поскольку никакие данные не могут быть изменены, целостность исторических документов остаётся неизменной.

Мой комментарий: Если я правильно понимаю, то предполагается сохранять в блокчейне хеши архивных документов. Блокчейн-компонента, таким образом, фактически будет выполнять роль доверенного поставщика штампов времени. Сами документы в блокчейн записываться не будут. В конечном итоге блокчейн поможет контролировать целостность, но не сможет сам по себе обеспечить сохранность.

Решение ARCHANGEL специально создано для выявления случаев случайного или злонамеренного внесения изменений в электронные государственные документы, и оно поддерживается блокчейн-системой с консенсусом на основе доказательства полномочий (proof-of-authority). Новая система была опробована в национальных государственных архивах Великобритании, Эстонии, Норвегии, Австралии и США (NARA).

Профессор Джон Колломоссе (John Collomosse, на фото, о нём см. https://www.surrey.ac.uk/people/john-collomosse ), который возглавляет проект в Университете Суррея, отмечает: «Архивы по всему миру накапливают огромные объемы цифрового контента, и очень важно, чтобы они могли доказать  общественности происхождение и целостность этого контента защищённым и прозрачным способом.»

«Объединив технологии блокчейна и искусственного интеллекта, мы показали, что возможно обеспечить целостность архивных данных в электронную эпоху. По сути, наше решение создает цифровые «отпечатки пальцев» архивных документов, что позволяет проверять их аутентичность».

Мой комментарий: Кто-то - либо уважаемый профессор, либо журналист – путает целостность, которую блокчейн действительно помогает контролировать, с аутентичностью, которую одними хешами (и блокчейном) не обеспечить.

Проект ARCHANGEL был недавно признан одним из ключевых исследований, осуществлённых за 10 лет существования программы по цифровой экономике Британского органа по научным исследованиям и инновациям (UK Research and Innovation, UKRI, https://www.ukri.org/ - организация, в задачи которой входит координация финансирования научных исследований – Н.Х.), которая финансирует проект через Научный совет по инженерным и физическим наукам (Engineering and Physical Sciences Research Council, EPSRC, https://www.epsrc.ac.uk/ ). ARCHANGEL входит в «комплект» тестового блокчейн-стенда в Университете Суррея ( https://blockchain.surrey.ac.uk/ ). Данный стенд используется группой проектов на основе инновационной технологии блокчейна с общим финансированием через UKRI и Евросоюз на сумму более 3,5 млн. фунтов стерлингов.

Директор по электронным технологиям Национальных Архивов Великобритании Джон Шеридан (John Sheridan) сказал: «Изучая технологию блокчейна в сотрудничестве с несколькими ведущими мировыми архивами, проект ARCHANGEL показал, как архивы реально могут объединять свои усилия для защиты и сохранения жизненно важных электронных доказательств для будущего. Проект ARCHANGEL стал выдающимся примером партнерских взаимоотношений, которые позволили провести новаторское исследование практических возможностей использования блокчейна для обеспечения доверия к крупномасштабным электронным архивам».

Исполнительный директор Института открытых данных Джени Теннисон (Jeni Tennison, на фото слева) отмечает: «Манипулировать электронными документами становится всё проще и проще, поэтому для учреждений, курирующих эти документы, крайне важно иметь возможность доказать свою надёжность».

Директор Центра CVSSP профессор Адриан Хилтон (Adrian Hilton, на фото справа, о нём см. https://www.surrey.ac.uk/people/adrian-hilton ), в свою очередь прокомментировал: «Это прекрасный пример того, как проводимые Центром CVSSP исследования свели воедино опыт в сфере искусственного интеллекта (ИИ) и блокчейн, ради  обеспечения возможности применения этих технологий на благо общества. Лидерство Суррея в технологиях блокчейна и исследованиях ИИ является для Великобритании отличной возможностью лидерства на международном уровне в применении технологий распределенных реестров для защиты архивов личных и национальных данных».

Более подробная информация о проекте ARCHANGEL доступна на сайте www.archangel.ac.uk

Проект ARCHANGEL получает государственное финансирование в рамках Программы цифровой экономики UKRI/EPSRC по гранту EP/P03151X/1 (см. https://gow.epsrc.ukri.org/NGBOViewGrant.aspx?GrantRef=EP/P03151X/1 ).

Источник: Investorideas.com
https://www.investorideas.com/news/2019/blockchain/05291ARCHANGEL.asp