среда, 31 октября 2018 г.

ЮНЕСКО создает электронный онлайн-архив


Приведенное ниже сообщение Адамы Али Пама (Dr. Adama Aly Pam - на фото) было разослано 11 октября 2018 года через список рассылки Международного совета архивов (МСА).

Дорогие коллеги,

Я рад объявить о запуске нашей платформы для оцифровки архивов ЮНЕСКО (организация Объединенных наций по вопросам образования, науки и культуры, UNESCO – Н.Х.). Это программа продвижения наших фондов в рамках проекта «Наша общая память» (Our shared memory).

Документы в настоящее время выкладываются в сети, и по мере того, как материалы становятся доступными, коллекция материалов становится богаче.

Пожалуйста, поделитесь с нами своими замечаниями и предложениями. Мы будем рады узнать Ваше мнение.

Сайт находится по адресу https://digital.archives.unesco.org/en/

Д-р Адама Али Пам (Dr. Adama Aly Pam)
Главный архивист – руководитель архивно-библиотечной службы и службы управления документами, Департамент управления знаниями и информационных систем
E-mail: a.pam@unesco.org

На фото: главная страница электронного архива ЮНЕСКО

Источник: сайт ЮНЕСКО
https://digital.archives.unesco.org/en/

вторник, 30 октября 2018 г.

Великобритания: Создание модели архивных данных - взгляд со стороны


Заметка Аннабель Бейнс (Annabel Baynes – на фото) специалиста по разработке программного обеспечения Национальных Архивов Великобритании (The National Archives, TNA) была опубликована на сайте TNA 17 октября 2018 года.

В течение последних нескольких месяцев мы работали над моделью архивных данных с целью сделать ее достаточно гибкой, чтобы её можно было использовать для наших собственных потенциальных будущих потребностей и сделать доступной для всех наших пользователей - см. наши предыдущие посты «Моделирование наших электронных архивных данных» (Modelling our digital archival data,  https://blog.nationalarchives.gov.uk/blog/modelling-digital-archival-data/ , перевод на русский язык см. http://rusrim.blogspot.com/2018/02/blog-post_6.html - Н.Х.) и «Электронная архивация: семь столпов метаданных» (Digital archiving: the seven pillars of metadata, https://blog.nationalarchives.gov.uk/blog/digital-archiving-seven-pillars-metadata/ , перевод на русский язык см. https://rusrim.blogspot.com/2018/04/blog-post_19.html - Н.Х.).

В этом проекте участвовала разнородная группа сотрудников организации, начиная от ряда ведущих экспертов в предметной области и заканчивая простыми людьми вроде меня. Я начала свою работу в качестве стажёра примерно год назад. У меня не было никаких предварительных знаний или понимания того, как будет работать архив, поэтому с самого начала я посвятила массу своего времени изучению архивной терминологии и концепций. Эти знания оказались полезными при разработке модели наших архивных данных, и это позволило мне привнести в проект свежий взгляд и видение, отдающее приоритет цифровым технологиям.

Сейчас мы находимся в такой точке работы, где благодаря коллективным усилиям и итеративному процессу наша модель вызрела в солидный первоначальной проект документа.

Рис.1. Первоначальный проект модели данных

Лично я не считаю, что эта наша первая итерация модели (на рис.1) уже достаточно гибкая и доступная; и в последние несколько месяцев я сама столкнулась с рядом проблем:
  • Трудности с пониманием архивной терминологии и понятий (таких, например, как «набор документов» и «серия») влияют на доступность для тех, кто еще не привык к архивам;

  • Глубокие и негибкие корни физической архивной структуры влияют на всё, что мы делаем, даже на наши электронные продукты.
Чтобы «разложить по полочкам» первую проблему, мне нужно поделиться некоторыми из используемых Национальными Архивами терминов, которые оказались для меня трудными, и тем, как я их сейчас понимаю:
Коллекция (collection) - это искусственно созданная подборка материалов / документов, основанная на категоризации, которую архивист считает значимой. (сравните российские определения, см. http://www.ciscra.org/mat/mat/term/2219 - Н.Х.)

Набор (set) / Серия (series) - это массив материалов / документов, управление которыми обычно осуществляется исходя из их естественного происхождения (provenance - см. ниже) от создателя документов.

Происхождение (provenance) - организация, из которой происходят документы, и причина их создания (сравните с определением здесь: http://www.ciscra.org/mat/mat/term/2782 - Н.Х.)

Документ (record) / Информационный объект. материал (document) - объект, важный с точки зрения архивного дела.  

Дело (file) – объект, представляющий собой группу собранных вместе документов
Во-первых, хотя слово «происхождение» не обязательно сразу узнаваемо для непрофессионала, однако стоящая за ним концепция в целом понятна. Словарь (имеется в виду словарь типа Оксфордского, см, например, здесь: https://en.oxforddictionaries.com/definition/provenance - Н.Х.) определяет этот термин как «место происхождения или самая ранняя известная история чего-либо», - поэтому, по сути, он отражает взаимосвязь между вещами и местами.

Во-вторых, «архивное» определение слова «file» (в значении «дело» - Н.Х.) сейчас очень отличается от его общераспространенного понимания. Это может быть связано с участившимся использованием данного слова в качестве ссылки на цифровые файлы (такие, например, как текстовой документ или PDF-файл), а не на «контейнер», содержащий набор документов. В этой связи термин «file» должен быть зарезервирован прежде всего для использования в его общепринятом смысле, а не для ставшей теперь малоупотребительной архивной трактовки.

Как и в ситуации с приведенными выше двумя терминами, я считаю, что исключение из нашей модели понятий «коллекция», «серия» и «набор документов» в определенной степени облегчит понимание богатства имеющейся у нас информации. Когда я впервые начала пользоваться онлайн-каталогом Национальных Архивов «Открытие» (Discovery, http://discovery.nationalarchives.gov.uk/ ), я сильно путалась из-за этих терминов ; они просто неинтуитивны в мире, где люди привыкли искать нужную им информацию (с помощью Google и другие современных поисковых служб) по ключевым словам, а не указывая близкие термины и контексты.

Но каким словом заменить «серию»? Возможно, если бы мы, - как это делают упомянутые современные службы поиска, - допустили бы естественную группировку документов в соответствии с их взаимосвязями с рядом контекстуальных элементов (происхождение, время, люди, контент, форма, тема и т.д.), это помогло бы пользователям более эффективно понимать документы.

Всё это прекрасно сочетается со второй проблемой, с которой я столкнулась, - жесткой хваткой, которой «бумажные» методы архивации держат нашу нынешнюю концептуальную модель. Если мы удалим очень физическое понятие «коллекции» или «набора» как места хранения документов, во что превратится документ? И как он может быть отсортирован?

Если мы изолируем как самостоятельные отдельные элементы сущности «документ», «происхождение», «время», «люди», «контент», «форма» и «тема», нам не нужно будет устанавливать такое же наследование или иерархию. Документы будут представлять собой самостоятельные объекты данных (конечно же, со связями с другими документами), тем самым давая пользователям возможность получать доступ к нашим данным гораздо более «цифровым по умолчанию» способом.

Мой комментарий: Жаль, что в Национальных Архивах Великобритании девушке никто не подсказал, что при таком подходе чрезвычайно легко – случайно или умышленно – совершенно иначе, неверно интерпретировать документы и сделать огромное количество «великих открытий».

Мы можем пойти еще дальше в деле концептуализации, и разделить «документ» на
  • Физическое / цифровое воплощение документа.

    Пример: электронный файл (например, DOC), содержащий пять страниц в формате Microsoft Word Document

  • Концептуальную идею документа.

    Пример: знание того, что этот Word-документ является инструкцией «Выдача пособий лицам, ищущим работу» (Job Seeker’s Allowance Interventions), раздел 7: «Отсутствие отдела рынка труда» -  и всего следующего из этого контекста.
В интересах использования доступной терминологии, фактические воплощения документа можно называть «файлами» в соответствии с общеупотребительным толкованием слова «файл». Концептуальную идею документа мы можем и далее называть «документом», который отражает архивное значение «файла».

Если мы избавимся от всех ограничений «физического короба» («коллекция» / «серия» / «набор документов») в отношении наших цифровых данных, у нас останется ряд важных контекстуальных элементов:
  • документы
  • файлы
  • люди
  • места
  • события
  • органы / организации
  • функции / задачи
  • форматы
Например, элементы: копия завещания Шекспира на пергаменте – архивный код ER1/49/4 («документ»), Стратфорд-на-Эйвоне («место») и «Фонд родины Шекспира» (The Shakespeare Birthplace Trust) («орган») фактически существуют независимо друг от друга, при этом существуют важные контекстуальные взаимосвязи между ними, предполагающие, что одно следует из другого.

Таким образом, мы имеем «стартовую точку» из восьми сущностей для включения в первую итерацию модели; это может измениться по мере её применения, - но, тем не менее, это достаточно общая отправная точка.

В данном примере применения предлагаемой мной модели Вы можете увидеть, как, путем включения в модель обязательных сущностей, документу могут быть приданы как контекст, так и форма.

Связи будут самой богатой и разнообразной частью графа, поскольку - отражая реальную жизнь – они представляют собой контекстуальные связи между всеми сущностями. Естественно, что, связывая сущности посредством правдивого представления их взаимосвязей, мы можем раскрывать и исследовать неявные «серии», не имея при этом необходимости навязывать цифровым носителям информации унаследованную от физических документов концепцию «набора» (как своего рода «ящика» или системы размещения документов в дела).

Отчасти вопреки интуиции, для того, чтобы эта модель была максимально расширяемой и гибкой, эти взаимосвязи не стоит явным образом описывать до тех пор, пока дело не дойдёт до внедрения модели – и их, вероятно, будет слишком много, чтобы спланировать эту работу!

Богатый, детальный контекст, который обеспечивают эти взаимосвязи, будет способствовать исполнению естественно сформулированных языковых запросов, а не только тех, которые касаются названия или описания документа. Если кому-то нужно будет найти все документы о конкретном событии, в определенном диапазоне дат, связанных с конкретным человеком, то будет возможность эффективно запросить эту информацию.

Надеюсь, это поможет людям отыскать и понять те документы, на которые они хотят взглянуть; с этим вопросом тесно связана кандидатская диссертация, работа над которой в настоящее время проводится в Национальных Архивах с тем, чтобы получить представление о том, как «пользователи представляют себе устройство электронных архивов». По ходу этой работы изучается понимание нашими пользователями понятий, которые вводятся архивами.

Наконец, в ходе изучения концепции и понятий меня заинтересовал вопрос о том, достаточно делаем для выполнения нашего долга по обеспечению доступа общественности в плане нашей терминологии / концептуальной структуры. Должны ли мы рассматривать это как возможность выявить «бумажные» основы, на которых мы построили наш онлайн-каталог, и преобразовать их таким образом, чтобы получить более понятный, «цифровой по умолчанию» инструмент поиска?

Аннабель Бейнс (Annabel Baynes)

Мой комментарий: Больше всего меня заинтриговало то, что Национальные Архивы Великобритании сочли полезным разместить этот пост на своём блоге, в который абы что не попадает. Понятно, что некоторые идеи автора весьма спорны; но также ясно и то, что электронные архивы будущего неизбежно будут очень отличаться от традиционных архивов, и британцы, надо отдать им должное, активно ищут новые решения, с учетом меняющихся привычек и запросов своих пользователей.

Источник: Блог Национальных Архивов Великобритании
https://blog.nationalarchives.gov.uk/blog/modelling-archival-data-outsiders-perspective/

понедельник, 29 октября 2018 г.

Меняющаяся роль специалистов по управлению документами


Заметка президента и генерального директора южноафриканской компании Concept Searching, Inc. Мартина Гарланда (Martin Garland – на фото) была опубликована 5 октября 2018 года на сайте компании.

У профессии управления документами были свои взлёты и падения. Много лет тому назад по какой-то необъяснимой причине функция управления документами была отнесена к нижней части «тотемного столба» при определении приоритетности направлений деловой деятельности. Я никогда не мог этого понять, так как специалисты по управлению документами в организации играю ключевую роль.

Можно надеяться, что это отношение изменилось. Новые законодательно-нормативные требования, которые необходимо исполнять, всё более глобальный характер деловой деятельности, растущее значение защиты неприкосновенности частной жизни, полномасштабное управление информацией в различных средах, киберпреступность и социальные сети – все эти явления (и этот список далеко не исчерпывающий) повлияли на ту роль, которую сегодня должен играть специалист по управлению документами.

При проведении экспертизы более старых корпоративных приложений, решения об их выводе из эксплуатации вызывают беспокойство за сохранность содержащегося в них контента. По мере того, как организации начинают проекты по обновлению своей инфраструктуры, особенно в тех случаях, когда новое программное обеспечение, предоставляемое как услуга (SaaS) и облачные приложения становятся жизнеспособными альтернативами устаревшим системам с большими инфраструктурными потребностями, ИТ-специалисты, юристы и специалисты по управлению документами должны оценивать риск утраты информации, накопленной в устаревших системах. Решения о поддержании устраивавших систем в режиме «только чтение», о миграции данных в более новые системы или о полном уничтожении устаревших систем должны приниматься в соответствии с законодательно-нормативными требованиями и деловыми потребностями. Такого рода решения не являются одноразовыми и требует участия представителей различных функциональных групп внутри организации.


Уверенность в надлежащем уровне корпоративного управления документами, э-раскрытия, обеспечения безопасности и защиты персональных данных, а также соблюдения законодательно-нормативных требований остается низкой, поскольку организации сталкиваются с тем, что терминология и предположения, основанные на бумажной практике, не удаётся масштабировать. Следует признать статус документов за новыми формами информации и применить к ним меры управления жизненным циклом - от захвата до архива.

С одной стороны, руки специалистов по управлению документами связаны техническими проблемами, и они не имеют полномочий принимать стратегические решения. С другой стороны, теперь от них требуется разработать новые дорожные карты управления жизненным циклом, охватывающие локальные, облачные и мобильные решения. Для многих это открывает новые горизонты, и они, похоже, сталкиваются в своей организации с дилеммой «утонуть или выплыть».

По мере расширения своего присутствия в социальных сетях, Вам следует обеспечить управляемость и эффективность используемого Вами способа захвата документов в социальных сетях. Подобно традиционным документам, их нужно индексировать и заархивированы с сохранением контекста, с тем, чтобы облегчить их поиск. Для этой цели используются метаданные, которые связываются с контентом.

Независимо от отрасли или организации, ручной ввод метаданных занимает много времени и является непродуктивным. В последнее время на рынке появились программные решения, способные обрабатывать сообщения в социальных сетях и захватывать соответствующие метаданные, однако они обычно ориентированы на конкретные сайты социальных сетей и недостаточно гибки, чтобы охватить сразу несколько различных социальных сетей. Это ставит организации в затруднительное положение, поскольку просто невозможно закупать и использовать множество приложений для выявления и захвата документов из социальных сетей. Ещё одна связанная с социальными сетями проблема заключается в том, что организации по-прежнему смотрят на эти сообщения как на «диких животных», и затрудняются решить, то ли им сохранить все эти сообщения, то ли все их удалить. Ни один из этих вариантов не выглядит разумным.

Такие же проблемы возникают при использовании электронной почты и коллективной работы. Электронная почта обычно администрируется, но она не обязательно рассматривается как часть процесса управления документами, например, в плане определения контекстуального значения сообщения электронной почты, содержания присоединенных файлов и т.п.

То же самое касается коллективной работы. Лишь немногие организации отслеживают, кому и к какой информации предоставляется доступ, как внутри организации, так вне её. Оба эти упущения могут открыть «ящик Пандоры» с проблемами, последствия которых трудно и иногда невозможно в полной мере устранить. Утечка в фирме Target была связана с компанией-партнером, выполнявшей на одном из объектов фирмы Target работы по наладке систем отопления, вентиляции и кондиционирования воздуха (HVAC). Последствия, как мы видели, были разрушительными.

Мой комментарий: За период с 27 ноября 2013 г. по 15 декабря 2014 г. хакерам удалось похитить персональные данные (номера телефонов, электронные и почтовые адреса, номера и PIN-коды кредитных и дебетовых карт) 110 млн клиентов компании Target, владеющей третьей по величине торговой сетью США. В результате американские финансовые институты понесли убытки в размере более 200 млн долларов США. (источник: https://tass.ru/info/2619230 ).

В различных отраслях многие локальные приложения, такие, как системы управления корпоративным контентом (ECM), подошли к концу своего жизненного цикла. То же самое происходит и с приложениями для управления записями документами. Большинство разработчиков программного обеспечения не поспевали за переменами и не переходили в облако, предпочитая насильно втискивать свои функциональные возможности в облачную модель, чтобы только оставаться в игре. В конце концов, они будут «съедены» теми поставщиками, которые смогут предложить «готовые для использования в облаке» приложения с функциональными возможностями, намного превосходящими возможности традиционных локальных приложений.

Обеспечение сохранности более старых документов должно быть предметом внимания и оцениваться с точки зрения точности. Нельзя исходить из того, что если в течение ряда лет служба управления документами «со скрипом» справлялась со своими обязанностями, то никаких изменений не требуется. Организации сталкиваются с постоянным изменениями, являющимися следствием множества внешних и внутренних факторов, и, если их игнорировать, уровень организационного риска значительно возрастает. То, что когда-то было сочтено документом, сегодня уже может перестать быть таковым, а в то же время в процесс управления документами должна быть включена новая информация.

Наконец, проблема, которая будет продолжать расти, - это риск утраты корпоративной памяти, «электронное средневековье», которое может наступить скорее раньше, чем позже. Организации уже сталкиваются с тем, что электронная информация, созданная в последние годы 20-го века, не читается или недоступна из-за устаревания аппаратных средств, деградации дисков и лент, и ввиду прекращения поддержки старых форматов. Даже крупные, стабильные поставщики, такие как Microsoft, судя по всему, не обеспечили сохранения исходного кода для поддержки файловых форматов и спецификаций для более старых продуктов, таких как PowerPoint 4.0.

Я всегда чувствовал симпатию к специалистам по управлению документами, которых, похоже, не ценят по достоинству; тем более, что сейчас они сталкиваются с проблемами, с которыми им никогда раньше не приходилось иметь дело. Для того, чтобы идти в ногу с растущим потоком контента, его типов контента и различных сред, потребуется изменить менталитет руководства, усилить организационную поддержку и наладить сотрудничество между несколькими функциональными группами. Несомненно, это очень непростая задача.

Мы приглашаем Вас познакомиться с некоторыми из наших примеров из практики, показывающих, как мы помогли клиентам решить свою конкретную проблему управления документами ( https://www.conceptsearching.com/solutions/records-management/ ):
Мы будем рады рассказать Вам о том, как мы можем решить Ваши проблемы, поэтому, пожалуйста, не стесняйтесь связаться с нами на странице https://www.conceptsearching.com/contact-us/ .

Мартин Гарланд (Martin Garland)

Источник: сайт компании Concept Searching, Inc.
https://www.conceptsearching.com/records-management-the-changing-role-of-records-managers/

воскресенье, 28 октября 2018 г.

Архивация государственных документов штатов США в электронную эпоху: Руководство по обеспечению долговременной сохранности электронных документов


Данная заметка была опубликована 18 октября 2018 года на сайте Совета руководителей архивных служб штатов и территорий США (Council of State Archivists, CoSA).

Совет руководителей архивных служб штатов и территорий США (Council of State Archivists, CoSA) и Национальная ассоциация ИТ-директоров штатов США (National Association of State Chief Information Officers, NASCIO) разработали руководство по обеспечению долговременной сохранности государственных электронных документов штатов.

В руководстве рассмотрены «правила игры» по 11 направлениям – это краткие высокоуровневые описания того, как решать ключевые проблемы, связанные с обеспечением электронной сохранности, которые должны помочь руководителям служб информационных технологий и архивных служб, а также другим руководителям штатов продумать наилучшие способы обеспечения сохранности архивных документов в нашу электронную эпоху.

CoSA и NASCIO поддерживают предпринимаемые в настоящее время ИТ-директорами штатов усилия в плане обеспечения электронной сохранности государственных электронных документов штатов. Данное руководство также поощряет сотрудничество; например, персонал архивной службы и специалисты по управлению документами штата могут помочь руководителям ИТ-служб штатов действовать более эффективно в области сохранения электронных данных, делясь своими знаниями о законодательно-нормативных требованиях и текущей практике.

Руководство подготовлено в ходе проекта «Сотрудничества и кооперации архивов с внешними заинтересованными сторонами» (Archives Collaborating and Cooperating with External Strategic Stakeholders, ACCESS), который является частью осуществляемой CoSA «Инициативы штатов в области электронных документов» (State Electronic Records Initiative, SERI). Проект финансируется Институтом музейно-библиотечных услуг (Institute of Museum and Library Services, IMLS, https://www.imls.gov/ - независимый орган правительства США, оказывающий поддержку музеям и библиотекам всех видов – Н.Х.) через его программу грантов национальным лидерам (National Leadership Grant program). Полученный грант помогает CoSA углубить взаимодействие с заинтересованными организациями, повысить осведомленность и улучшить текущее курирование электронных документов.

Документ под названием «Архивация государственных документов штатов США в электронную эпоху: Руководство по обеспечению долговременной сохранности электронных документов» (State Archiving in the Digital Era - A Playbook for the Preservation of Electronic Records) объёмом 15 страниц можно скачать по адресу https://www.statearchivists.org/files/9815/3989/0743/StateArchivingInTheDigitalEra_PlaybookForThePreservationOfElectronicRecords_2018-10.pdf .

Источник: сайт Совета руководителей архивных служб штатов и территорий США
https://www.statearchivists.org/connect/blog/2018/10/state-archiving-digital-era-playbook-preservation-electronic-records/

суббота, 27 октября 2018 г.

ИСО: Кто поддерживает 4-ю промышленную революцию?


19 октября 2018 года Международная организация по стандартизации (ИСО) в своем разделе в Твиттере ( https://twitter.com/isostandards ) выложила вот такую картинку, озаглавленную «4-я промышленная революция» и показывающие те технические комитеты ИСО и направления стандартизации, которые эту революцию поддерживают.


Картинку сопровождал следующий текст:
«Взгляните на Технические комитеты, создающие стандарты, которые помогают стимулировать рост этих новых и нарождающихся технологий в рамках 4-й промышленной революции! Благодаря стандартам, технологии могут процветать, обеспечивая большую интероперабельность, качество и безопасность!»
В число этих технических комитетов и подкомитетов попали:
  • TC22/SC31 «Дорожный транспорт - Передача данных» (Data communication)

  • TC307 «Технологии блокчейна и распределенных реестров» (Blockchain and distributed ledger technologies)

  • TC299 «Робототехника» (Robotics)

  • TC229 «Нанотехнологии» (Nanotechnologies)

  • TC261 «Технология послойного синтеза» (Additive manufacturing)

  • TC22/AG1 целевая группа «Дорожный транспорт – Автоматическое вождение» (Road vehicles / Automatic driving)

  • TC204 Интеллектуальные транспортные системы «Intelligent transport systems»

  • JTC1/SC42 «Искусственный интеллект» (Artificial intelligence)

  • TC276 «Биотехнологии» (Biotechnology)
Понятно, что список не претендует на полноту, и может удивить отсутствие в нём таких, например, подкомитетов, как JTC1/SC41 «Интернет вещей и взаимосвязанные технологии» (Internet of Things and related technologies)…

Я, однако, бы хотела привлечь внимание коллег к тому, что мы не видим здесь ни одного их комитетов, традиционно разрабатывающих стандарты для управления документами и архивного дела (однако есть комитет по блокчейну, который, в сущности, представляет собой новую технологию управления документами!), - и это плохая примета для будущего нашей профессии…

Мы должны стремиться позиционировать себя как важный элемент что реформ государственного управления, что новой промышленной революции! :)

Источник: Твиттер
https://twitter.com/isostandards

пятница, 26 октября 2018 г.

Беседы об управлении документами, эпизод 4: Искусственный интеллект, подотчётность и архивы, часть 2


(Окончание, начало см. https://rusrim.blogspot.com/2018/10/4-1.html )

Касси Финдлей: И мы, что меня очень радует, таким образом, быстро переходим к вопросу, который я считаю одним из наиболее важных – к проблеме недостаточно    й подотчетности и прозрачности алгоритмов, принимающих решения, способные повлечь за собой столь значительные последствия. Я не знаю, кто создал приложение COMPAS, - была ли это частная компания?

Эллен Брод: Раньше она называлась Northpointe, а сейчас, насколько я знаю, она именуется Equivant.

Касси Финдлей: Да, и с учетом всех тех сложностей, о которых Вы упомянули, связанных с тем, как этот алгоритм делает выводы, какие данные анализируется, откуда эти данные поступают, каково их происхождение, какие предубеждения могли быть в них отражены, - чего мы, я думаю, справедливо будет сказать, в большинстве случаев просто не знаем… Не хотели бы Вы немного остановиться на этом вопросе?

Эллен Брод: Абсолютно и определенно одна из тех вещей, с которых я предпочитаю начинать обсуждение, когда речь заходит о непрозрачном характере многих этих систем, заключается в том, что порой процесс принятия решений человеком даже труднее «разложить по полочкам», что влечёт за собой похожие последствия, - так что все эти системы должны учиться на накопленном опыте человеческих решений и человеческих моделей поведения. Так, например, в контексте правоохранительной деятельности судьи, лица, ответственные за условно-досрочное освобождения и разработчики политик десятилетиями (почти целое столетие!), используя для различные способы, пытались предсказать, кто из преступников с большой вероятностью будет совершать преступления повторно. Ведь действительно важная часть уголовного правосудия и полицейской деятельности заключается в том, чтобы по возможности быстро и без проволочек возвращать людей в общество, если они не представляют собой дальнейшего риска, одновременно выявляя среди населения опасных людей и защищая сообщество от связанного с ними риска.

И это очень эмоциональный вопрос. В книге я сказала несколько слов о том, что это действительно трудно решаемая проблема, и мы пытаемся справиться с ней уже в течение длительного времени. Таким образом, у алгоритма компании Northpointe / Equivant на самом деле наблюдаются проявления того же подхода к принятию решений, за исключением того, что теперь этот процесс осуществляется в программном обеспечении. И поскольку. Как Вы сказали, процесс был в каких-то аспектах умышленно непрозрачным, было очень сложно было точно определить, какие переменные использовались компанией Northpointe / Equivant в её алгоритме прогнозирования. Было трудно понять, какие данные использовались для обучения алгоритма, трудно найти информацию о проведенном тестировании, оценить точность результатов. Это всё проприетарная информация, которую было довольно сложно получить с течением времени. Кое-какие сведения продолжают извлекаться. Хотя по сути это умышленно созданный «черный ящик», но, поскольку это программное обеспечение, мы можем, по крайней мере, количественно определить и идентифицировать источники или причины определенной предвзятости и принятия определенных решений, которые в случае принятия решений людьми, мы интуитивно понимаем, но не можем систематически «разложить по полочкам».

Что действительно интересно в алгоритме COMPAS, это не только то, что он служит примером проприетарного алгоритма, разработанного с намерением повлиять на реальный мир, но то, что он принимает решения - или, скажем так, должен помогать принимать решения судьям и лицам, ответственным за условно-досрочное освобождение, - поэтому они полагаются на него при принятии иных решений, и это трудно контролировать. Для меня особенно интересным в примере Northpointe было то, что последующие исследования показали, что несмотря на всю сложность алгоритмов и использование этих сотен переменных для подготовки прогнозов, уровень точности получается очень близким к тому, который можно достичь, используя всего 5-6 переменных. Добавление всех этих дополнительных данных не обязательно улучшают качество работы Вашей системы. И я думаю, что это очень важный момент, к которому следует возвращаться, особенно когда речь заходит о больших данных: эти более сложные алгоритмы, использующие огромное количество исходных данных, могут быть не лучше, чем опрос из пяти пунктов.

Мой комментарий: В точных науках давным-давно известно, что «малые» целенаправленно собранные, высококачественные данные неизменно позволяют получить более точные конечные результаты, чем попытки выявления скрытых закономерностей в огромных массивах данных, часто неизвестно кем и как собранных. В гуманитарных дисциплинах процесс прохождения «грабель» пока продолжается …

Касси Финдлей: Это очень интересно. Давайте вернёмся к ранее высказанной Вами мысли о том, что ранее все эти решения принимали люди, на основе располагаемой ими информации и при всём связанным с этим потенциалом для совершения ошибок. Она напоминает о подходе, который мы используем для тщательного изучения и оценки правильности процесса принятия решений «старого мира» посредством применения законодательства о свободе доступа к государственной информации (FOI), изучения свидетельств принятия решений - однако с распространением частно-государственных партнёрств утрачиваются некоторые из этих возможностей для тщательного анализа данных (пусть даже раньше это были данные в аналоговой форме). Наблюдаете ли Вы какие-либо свидетельства более совершенной практики в деятельности государственных органов, в том плане, чтобы заставить частных партнеров обеспечить подотчётность там, где они оказывают государственные услуги?

Эллен Брод: Если говорить конкретно о прогностических системах и ИИ в Австралии, то не особенно. В США, однако, появляется ряд действительно интересных разработок, касающихся регулирования автоматизированных услуг, предоставляемых частными компаниями в партнерстве с государственными органами. Я с интересом слежу за деятельностью алгоритмической целевой группой Нью-Йорка. Эта группа изучает вопрос о том, как обеспечить подотчётность поставщиков автоматизированных услуг Нью-Йорка и что сюда может быть включено. Думаю, мы могли бы изучить возможности использования различных механизмов и структур, правил, законов, принципов, ожиданий для того, чтобы повлиять на характер партнерства компаний частного сектора с государством при оказании услуг в других областях. Если Вы поставляете, например, медицинские инструменты или оказываете медицинские услуги от имени государственного поставщика, Вы обязаны соблюдать ряд правил, которые определяют, как Вы предоставляете эту услугу.

У нас есть правила, регламентирующие то, как говорят и действуют сотрудники, выполняющие функции государственных служащих. Это поле деятельности никогда не было открытым для всех. Для представителей частного сектора – участников частно-государственных партнерств, никогда не было абсолютной свободы. Собственно, для меня странным выглядит спор о правах интеллектуальной собственности по отношению к автоматизированным системам. Законодательство об интеллектуальной собственности – это не абсолютные законы природы, которые нужно лишь открыть; это всегда был баланс между доступностью информации в общественных интересах и защитой информации, и мы поддерживаем этот баланс в каждом секторе, используя как явные исключения из законов о защите интеллектуальной собственности, так и правила, которые должны способствовать формированию ответственного поведения в этом секторе.

Фармацевтические компании, например, не могут хранить в абсолютной тайне всё, что делается ими в связи с фармацевтическими препаратами, которые они предлагают публике, потому что они несут ответственность за предотвращение вреда для населения, и частью этого является раскрытие информации тестировании их продуктов, прохождение аудита, необходимость продемонстрировать свою подотчётность, - поэтому я считаю  неуместной ссылку на права интеллектуальной собственности в отношении технологий, поскольку эти права никогда не предназначались для ограничения доступа к информации, приносящей пользу общественности, помогающей нам обеспечить защиту людей от вреда и способствующей совершению людьми осознанного выбора в отношении того, что происходит с ними.

Касси Финдлей: По собственному опыту работы в сфере управления документами в государственных органах я знаю, что переговоры и договоренности о передаче какой-либо государственной функции на выполнение частному партнеру всегда затрагивают вопросы хранения документов. Однако сравнительно недавно, пять лет тому назад, когда я всё ещё работал в государственном учреждении, это выглядело достаточно старомодно, типа, «по окончании контракта Вы передадите нам все документы», вместо создания механизмов обмена информацией в реальном времени или, как минимум, обеспечения большей прозрачности при выполнении программы, непосредственно влияющих на государство посредством принятия решений «по доверенности». Так что, как я понимаю, Вы говорите о том, что должны быть какие-то дополнительные рычаги и механизмы, и это должно стать нормой при заключении государственными органами подобных соглашений?

Эллен Брод: Да, я бы провела классификацию закупаемого государством программного обеспечения. Когда речь идёт об искусственном интеллекте и прогностических системах, эти программные продукты всё ещё находятся в стадии разработки, и, с моей точки зрения, мы пока ещё не достигли зрелости в части того, как мы закупаем программное обеспечение, - отчасти из-за того, что нет ясного понимания того, как работает это программное обеспечение, и что следует знать и понимать, чтобы иметь возможность разобраться, как это программное обеспечение работает, развивать его и привлечь кого-либо ещё для его исправления. В Англии я много занималась вопросами закупок данных. Нередко одна из реальных проблем, с которой мы сталкивались, была весьма похожей на требование передать все документы по окончании контракта – в случае наборов данных, это звучало как требование о передаче в конце всех собираемых данные, без указания, каких именно.

Иногда вы можете встретить в контрактах положения о том, что в конце проекта Вы обязаны анонимизировать и передать набор данных, но для организации более полезным было бы требование передать методологию, использованную при сборе данных. Тогда, если Вы захотите повторить этот процесс, это будет легко сделать. Вам нужно понимать, как были собраны данные. Вы также хотите знать, где и кого они были собраны, она случай, если Вам нужно будет вернуться и воссоздать набор данных. Как правило, Вам недостаточно получить лишь «конечный результат», причем даже получение этого результата, возможно, не даст Вам прав, необходимых для его свободного использования. Как мне представляется, мы все ещё пытаемся осознать, что именно нам нужно получить в процессе проведения закупок.

Касси Финдлей: В книге, как я понимаю, Вы сказали о важности понимания механизмов и методологий сбора данных, как с точки зрения справедливости, так и с точки зрения «умолчаний» в данных, типа того, как в фондах архивах раньше не отражались определенные группы и слои общества, особенно маргинализированные группы. Иметь возможность сильнее повлиять на деятельность государственного органа, который, как можно надеяться, стремиться действовать в интересах общества, посредством раннего вовлечения в разработку этих методов сбора информации – с моей точки зрения, наиболее подходящий способ действий.

Эллен Брод: Насколько я помню, Вы и Джон Шеридан затронули этот вопрос в одной из предыдущих бесед. Сама я им специально не занималась… Да, наши с ним беседы о данных в архивах всегда были захватывающими и наводящими на размышления. Помню одну из наших бесед об обеспечении долговременной сохранности данных и принятии решений, а также о влиянии технологий защиты персональных данных и изменения отношений к неприкосновенности частной жизни на будущее долговременной сохранности. В отношении государственных документов, помню, как мы обсуждали, что вследствие аутсорсинга многих связанных с данными функций вопрос обеспечения долговременной сохранности этой информации выходит из-под контроля уполномоченного органа по вопросам управления документами. Знаете, это напоминает ситуацию, когда Вы пытаетесь изучать какой-то проект, Вы можете найти отчет, ссылающийся на определенные исследования, это у Вас есть, - но у вас нет доступа к самим результатам исследований, которые легли в основу отчёта, и Вы не можете сами проанализировать эти данные. Я всё чаще сталкиваюсь с этой проблемой. Мы можем получать результаты, можем архивировать отчеты и «снимки»; однако обеспечение сохранности собранных частными компаниями данных, при оказании ими по сути государственных услуг, действительно дело сложное. Вопрос о защите персональных данных сам по себе интересный, но он своего рода отдельный ...

Касси Финдлей: О, не волнуйтесь. Перед, чем закончить нашу беседу, у меня будет быстрый вопрос о неприкосновенности частной жизни.

В следующем эпизоде мы действительно обсудим вопрос данных в связи с защитой неприкосновенности частной жизни, а Эллен выскажет ряд идей о том, в каком направлении всё это движется.

Беседу вела Касси Финдлей (Cassie Findlay)

Источник: сайт «Recordkeeping Roundtable»
https://rkroundtable.org/2018/10/06/recordkeeping-roundcasts-episode-4-ai-accountability-and-archives/

четверг, 25 октября 2018 г.

Беседы об управлении документами, эпизод 4: Искусственный интеллект, подотчётность и архивы, часть 1


Заметка авторитетного австралийского специалиста Касси Финдлей (Cassie Findlay) была опубликована 6 октября 2018 года на сайте дискуссионной группы «Круглый стол по вопросам управления документами» (Recordkeeping Roundtable).

В очередном эпизоде бесед об управлении документами мы встречаемся с Эллен Брод (Ellen Broad), автором книги «Сделано людьми: Состояние ИИ» (Made by Humans: The AI Condition – обложку см. на рис.), - о том, как быстро развивающиеся технологии, такие, как искусственный интеллект и машинное обучение, начинают применяться в деловой деятельности, в государственном управлении и в обществе, а также о различных последствиях их внедрения. Эллен и представитель «Круглого стола по вопросам управления документами» (Recordkeeping Roundtable) Касси Финдлей обсуждают реальные результаты принятия решений машинами, подотчётность за использование таких систем, роли управления документами и архивного дела, и изменение отношения к неприкосновенности частной жизни в условиях экономики данных.

Книгу «Сделано людьми: Состояние ИИ» можно приобрести в издательстве Университета Мельбурна (Melbourne University Press) по адресу https://www.mup.com.au/books/made-by-humans-paperback-softback ), а также во всех крупных книжных онлайн-магазинах.
Об Эллен Брод

Эллен является руководителем отдела по технической реализации стандартов пользовательских данных (Head of Technical Delivery, Consumer Data Standards) в осуществляемом Организацией научно-технического содружества австралийского Содружества (Commonwealth Scientific and Industrial Research Organisation, CSIRO – австралийская государственная организация, см. https://www.csiro.au/ - Н.Х) проекте Data61 (который позиционирует себя в качестве ведущей австралийской инновационной научно-исследовательской сети во вопросам доверия к данным и технологий их обработки, см. https://www.data61.csiro.au/ - Н.Х.).

В конце 2018 года она вернулась в Австралию из Англии, где возглавляла отдел политик Института открытых данных (Open Data Institute, ODI) - международной некоммерческой организации, основанной сэром Тимом Бернерсом-Ли (Tim Berners-Lee) и сэром Найджелом Шадболтом (Nigel Shadbolt).

В Англии Эллен также была экспертом-советником по данным члена кабинета министров правительства Великобритании Элизабет Трасс (Elisabeth Truss). В прошлом она также исполняла обязанности менеджера по цифровой политике и проектам Международной федерация библиотечных ассоциаций и учреждений, ИФЛА (International Federation of Library Associations and Institutions, IFLA, Голландия) и исполнительного директора Австралийского цифрового альянса (Australian Digital Alliance).

Эллен писала и выступала об искусственном интеллекте, открытых данных и проблемах коллективного использования данных в изданиях «Нью сайентист» (New Scientist) и «Гардиан» (Guardian), в программах австралийской радиостанции ABC Radio National «Большие идеи» (Big Ideas) и «Будущее время» (Future Tense), а также на конференции SXSW (от South by Southwest – в штате Техас, США – Н.Х.). Помимо своей основной работы, Эллен вместе с руководителем ODI Джени Теннисоном (Jeni Tennison) разработала настольную игру по тематике открытых данных Datopolis, в которую играют в 19 странах (см. также https://boardgamegeek.com/boardgame/206759/datopolis - думаю, это предложение в резюме сохранилось по недосмотру, поскольку данная игра уже благополучно забыта – Н.Х.).
Мой комментарий: аудиозапись доступна на странице по адресу https://rkroundtable.org/2018/10/06/recordkeeping-roundcasts-episode-4-ai-accountability-and-archives/

Касси Финдлей: Я очень рада беседовать сегодня с Эллен Брод. Эллен является автором книги «Сделано людьми: Состояние ИИ» (выше дана ссылка на сайт, где есть информация о книге и о том, где её купить). Я от всей души рекомендую эту книгу, она появилась очень своевременно. Посмотрите на этические и социальные последствия ускоряющегося «галопа» к использованию искусственного интеллекта и машинного обучения во многих различных аспектах нашей жизни. И, конечно же, у таких людей, как я, – а также, надеюсь, у слушателей и читателей наших «бесед», - которые занимаются управлением документами, имеется множество вопросов, связанных с внедрением этой технологии, заставляющих нас задуматься о том, что представляет наша работа сегодня и какой она потенциально может стать в будущем, начиная от сохранения свидетельств того, как эти системы создаются, и вплоть до усилий по обеспечению подотчетности в отношении решений о развертывании технологии.

Итак, Эллен, добрый день, и большое спасибо за то, что Вы присоединились ко мне.

Эллен Брод: Большое спасибо за приглашение.

Касси Финдлей: У меня есть три вопроса, и, как мне кажется, первый из них, вероятно, даст Вам возможность помочь нашим слушателям понять, о чем именно мы говорим, потому что не у всех из нас имеются достаточные базовые знания.

Итак, первый из моих трех вопросов следующий: Вы в своей книге пишете о том, что мы, судя по всему, переходим от использования систем ИИ в менее ответственных областях к их применению в более ответственных приложениях. Можете ли вы немного подробнее объяснить, что Вы под этим понимаете, и привести нам несколько примеров более ответственных систем?

Эллен Брод: Конечно. Возможно, стоит немного отступить назад и сначала сказать о контексте, в котором я говорю о более и менее ответственных системах, поскольку книга посвящена не «вообще» искусственному интеллекту (существует множество разных технологий, которые охватываются этим зонтичным термином – например, виртуальная реальность, робототехника, беспилотные летательные аппараты-дроны…).

В контексте книги, меня интересует всё более широкое использование данных для составления прогнозов и принятия решений, которые затрагивают людей. Мы всё чаще и чаще делаем это в нашей повседневной жизни. Таким образом, менее ответственные системы, о которых я упоминаю, - это системы, помогающие нам, например, выбрать следующий материал для просмотра в Netflix; или же информация, которую Google использует для формирования того, что мы видим в результатах поиска.

В определенных случаях даже эти примеры Вы бы не назвали «малоответственными применениями». Например, идёт всё более активное обсуждение того, как Google формирует информацию, которую он нам выдаёт; но мы сейчас переходим от этих систем, которые по существу используются для индивидуализированных прогнозов о контенте, который нам, возможно, будет интересно посмотреть; о других книгах, которые могли бы нас заинтересовать, раз мы купили данную книгу, - к тому, чтобы начать использовать те же методы для принятия высокоответственных решений (higher stakes decisions). Это решения о том, что мы представляем из себя как личность - заслуживаем ли мы доверия, хорошо ли мы подходим для работы, на которую претендуем, стоит ли нас принимать в университет и какие специальности нам следует изучать.

И причина, по которой я называю эти решения «ответственными», это то, что они влекут за собой последствия в реальном мире. Я имею в виду, то, что Netflix, рекомендуя мне ужасный фильм и не понимая толком мои предпочтения, не воздействует на мою жизнь в такой степени, как ошибочная оценка пригодности к выполнению работы, поэтому в последнем случае последствия более значительны, а прогнозы такого рода действительно очень трудно делать. Предсказания, например, о работе, в которой мы можем быть заинтересованы или которая нам подходит, определяются целым рядом факторов, и наши прошлые предпочтения и опыт являются лишь частью этих факторов. Именно это я имею в виду, говоря о переходе от менее ответственных систем к более ответственным, а также о необходимости в большей степени сосредоточить внимание на более ответственных системах.

Касси Финдлей: Прочитав Вашу книгу, я знаю, что Вы немало путешествовали по миру, общались со многими людьми, и Вы упомянули множество очень специфических примеров. Не могли бы Вы привести пример такой системы, решающей серьёзные вопросы вроде подбора работы или принятия решения по заявлению о приёме в университет – тех, что уже реально работают?

Эллен Брод: Одна из самых ключевых по важности систем, о котором я рассказываю в своей книге, о которой много говорят, и которая действительно привлекла внимание к сложностям этих решений - это алгоритм оценки COMPAS, используемый для прогноза того, кто из преступников вероятнее всего совершит преступления повторно. Это пример решений, в которой сотни переменных используются для оценки вероятности того, что человек станет рецидивистом, - однако на практике было обнаружена определенная предвзятость результатов работы этого алгоритма. Вероятность рецидива оказалась завышенной у афро-американцев и занижена у белых преступников.

Причины этого сложны и трудно выявляются, и решения этой проблемы также сложны. Сейчас в области машинного обучения всё больше обсуждается вопрос о том, как количественно оцениваете такого рода результаты работы системы, как можно пытаться повлиять на них или, по крайней мере, объяснить, почему результаты получаются именно такими. Я также затронула растущее использование прогнозов при найме на работу, однако COMPAS, вероятно, является в книге наиболее ярким примером высокоотвественной системы.

(Окончание следует, см. https://rusrim.blogspot.com/2018/10/4-2.html )

Беседу вела Касси Финдлей (Cassie Findlay)

Источник: сайт «Recordkeeping Roundtable»
https://rkroundtable.org/2018/10/06/recordkeeping-roundcasts-episode-4-ai-accountability-and-archives/

среда, 24 октября 2018 г.

Конференция SAA/CoSA/NAGARA 2018 года: Секция 605 «Перспективы прозрачного управления и экспертизы ценности в веб-архивах»


Данная заметка аналитика Национальных Архивов США Бет Крон (Beth Cron – на фото) была опубликована 5 октября 2018 года на блоге секции по вопросам управления документами Общества американских архивистов.

Мой комментарий: Конференция «Архивы/документы 2018: Содействие прозрачности» (Archives*Records 2018: Promoting transparency), совместно организованная Советом руководителей архивных служб штатов и территорий США (Council of State Archivists, CoSA), Национальной ассоциацией специалистов по управлению государственными архивами и документами (National Association of Government Archivists and Records Administrators, NAGARA) и Обществом американских архивистов (Society of American Archivists, SAA) в 2018 году прошла 12-18 августа в Вашингтоне. Подробнее о конференции см. http://rusrim.blogspot.com/2018/08/blog-post_9.html

Секция 605 «Приручение интернета: перспективы прозрачного управления и экспертизы ценности в веб-архивах» (Taming the Web: Perspectives on the Transparent Management and Appraisal of Web Archives, https://archives2018.sched.com/event/ESme/605-taming-the-web-perspectives-on-the-transparent-management-and-appraisal-of-web-archives-rim# ) предложила различные точки зрения ряда организаций на вопросы управления и экспертизы ценности в веб-архивах – в том числе позиции муниципалитета, университета, штата и федерального правительства США.

Точка зрения властей города Остина (Austin), штат Техас

Выступавшая первой Кэтрин Кренфорд (Katherine Cranford, о ней см. https://archives2018.sched.com/speaker/katherine.cranford1 ) описала типы документов, которые были выявлены на веб-сайтах города - многие из них постоянного срока хранения. Она объяснила, как заинтересованные стороны смотрят на веб-архивацию с разных точек зрения.

Управление веб-контентом осуществляется путем подключения городской системы управления документами, OpenText eDocs ( https://www.opentext.com/products-and-solutions/industries/legal/legal-content-management-edocs ), к веб-сайтам через API-интерфейс. Это обеспечивает защиту документов и их хранение в соответствии указаниями по срокам хранения документов. Также используется решение  ArchiveSocial (решение для архивации контента социальных сетей государственными органами, см. https://archivesocial.com/ - Н.Х.) в соответствии с политикой использования социальных сетей. Чтобы обеспечить сохранение в своей системе управления контентом Drupal (решение с открытым кодом, см. https://www.drupal.org/ - Н.Х.) только необходимой информации, городское правительство использует политики.

В случае, если политики не «работают», Кэтрин рекомендует использовать руководство по стилю. Она подчеркнула постоянную важность аудита контента и стратегического управления им.

Точка зрения университета им. Джона Гопкинса (Johns Hopkins University)

Следующим выступал Джордон Стил (Jordon Steele,  о нём см. https://archives2018.sched.com/speaker/jordon_steele.1xzf2hzz ). Он поделился опытом использования сервиса архивации Archive-It («Заархивируй это», вход в раздел университета - по адресу https://archive-it.org/organizations/626 ) «Интернет-архива» (Internet Archive) для захвата веб-сайтов и материалов из социальной сети Facebook , Работа в области веб-архивации включает в себя:
  • Определение представляющих интерес источников (взаимодействие со службой ИТ и студенческим центром для формирования списка всех официально зарегистрированных групп);

  • Выполнение тестового сбора материалов (crawls) с веб-сайтов;

  • Устранение выявленных проблем;

  • Сохранение захваченных материалов;

  • Контроль качества;

  • Создание метаданных;

  • Обеспечение долговременной сохранности архивных документов;

  • Регулярное проведение повторной экспертизы ценности;

  • Весь процесс регулярно повторяется (ежегодно или раз в полгода)
Джордон затронул этические соображения при документировании студенческих групп. Они стараются найти баланс между своей этической обязанностью документировать жизнь кампуса и этической обязанностью запрашивать разрешение. Если принимается решение не спрашивать разрешения, то можно ли смягчить риски путем цензурирования или ограничения доступа? Применимы ли стандартные ограничения к платформе веб-архивации? Они пытаются определить, что им следует делать, исходя из своих приоритетов.

Джордон упомянул следующие ключевые ресурсы, которые университет использовал при разработке своей программы:
Точка зрения штата – Библиотека штата Северная Каролина

В свою очередь Криста Соренсон (Krista Sorenson,  о ней см. https://archives2018.sched.com/speaker/krista_sorenson ) рассказала, как Библиотека вместе с Архивами штата решает вопросы управления официальными публикациями штата, контентом и государственными документами. Они начали использовать Archive-It в 2005 году и ArchivesSocial в 2012 году. Раз в два месяца проводится сбор и захват веб-сайтов органов исполнительной власти штата и их контента, включая публикации, которые доступны только в Интернете.

После 13 лет работы Библиотека и Архивы пересмотрели свой подход. Сейчас они основное внимание обращают удобство работы пользователей, поскольку знают, что тем может быть сложно найти то, что им нужно. Был проведен аудит, по итогам которого подход к метаданным и документации пересматривается. Партнеры решили, что им следует периодически пересматривать свой подход и создавать четкую документацию с тем, чтобы обеспечить хорошо управляемое, прозрачное присутствие в Интернете.

Презентация к докладу Кристы выложена по адресу https://schd.ws/hosted_files/archives2018/66/session605-SorensonA.pdf

Точка зрения штата – Архивы штата Северная Каролина

Джейм Патрик-Бернс (Jaime Patrick-Burns, о ней см. https://archives2018.sched.com/moderator/jamie_patrick_burns.1xzf2ibw ) сообщила о том, как осуществляется захват сайтов и блогов официальных государственных организаций. А также контента их учетных записей в социальных сетях с использованием решений Archive-It и ArchiveSocial. Для обеспечения качества с помощью ArchiveSocial ведётся мониторинг учётных записей. В Archive-It загружаются захваченные материалы, данные просматриваются и сверяются с первоисточниками, чтобы увидеть, как они отображаются. Затем определяются правила и выполняется тестовый процесс сбора и захвата 700 активных источников.

Затем выбираются источников 5% с наибольшим и 5% - с наименьшим числом ошибок, анализируются все ошибки, проверяется, как материалы отображаются в «Машины прошлого» (Wayback Machine, компания «Интернет Архив»), и документируются предпринятые меры. При таком подходе анализируются те источники, которые вероятнее всего могут вызывать проблемы.

Сейчас внедряется новый подход, при котором список источников делится на группы, и каждый раз проверяется очередная группа, с тем, чтобы за год провести проверку всех источников. Текущих проблемы, с которыми сталкиваются Архивы, включают проблему зрелости веб-архивов, масштабируемость, поддержание связи с заинтересованными сторонами и ограниченность количества учетных записей, поддерживаемых ArchiveSocial.

Федеральная точка зрения – Национальные Архивы США (NARA)

Кайл Дуглас (Kyle Douglas,  о нём см. https://archives2018.sched.com/speaker/kyle_douglas.1xzf2i10 ) представил обзор руководств и рекомендаций Национальных Архивов США (NARA) по управлению веб-документами. Хотя «Руководство Национальных Архивов по управлению веб-документами» (NARA Guidance on Managing Web Records, https://www.archives.gov/records-mgmt/policy/managing-web-records-index.html ) было опубликовано ещё в 2005 году, оно по-прежнему применимо. NARA работает над новым руководством и рассматривает различные варианты, в том числе разрабатывая метод, подобный методу Capstone («Верхушка пирамиды») для управления электронной почтой, к управлению наиболее ответственными веб-документами.

В ходе проведенной в 2017 году ежегодной самооценки федеральными органами исполнительной власти положения дел в управлении документами (Records Management Self-Assessment, RMSA) Национальные Архивы задали им вопрос о том, как они управляют документами на своих веб-сайтах. В ответ 55% опрошенных государственных органов сообщили, что управляют своими сайтами как документами. Также 45% государственных органов проводит автоматический захват веб-документов; а 28% осуществляет передачу таких документов на архивное хранение в NARA.

Национальные Архивы ведут разработку «Вариантов использования для документов на веб-сайтах» (Use Cases for Website Records) в рамках инициативы FERMI (  https://www.archives.gov/records-mgmt/policy/fermi ). «Варианты» могут применяться федеральными органами исполнительной власти для оценки способности поставщиков управлять веб-документами. В качестве полезного ресурса Кайл также назвал страницу веб-сайта Национальных Архивов «Документирование Вашей деятельности на государственной службе» (Documenting Your Public Service, https://www.archives.gov/records-mgmt/publications/documenting-your-public-service.html ).

Бет Крон (Beth Cron)

Источник: Блог секции по вопросам управления документами Общества американских архивистов
https://saarmrt.wordpress.com/2018/10/05/saa-cosa-nagara-2018-recap-session-605/

вторник, 23 октября 2018 г.

Конференция SAA/CoSA/NAGARA 2018 года: Секция 305 «Разработка и внедрение рекомендаций по работе с информацией в эпоху открытого правительства»


Данная заметка Хилари Гатлин (Hillary Gatlin, на фото - специалист по управлению документами Архивов Университета Дьюк - Duke University, штат Северная Каролина, США) была опубликована 27 сентября 2018 года на блоге секции по вопросам управления документами Общества американских архивистов.

Мой комментарий: Конференция «Архивы/документы 2018: Содействие прозрачности» (Archives*Records 2018: Promoting transparency), совместно организованная Советом руководителей архивных служб штатов и территорий США (Council of State Archivists, CoSA), Национальной ассоциацией специалистов по управлению государственными архивами и документами (National Association of Government Archivists and Records Administrators, NAGARA) и Обществом американских архивистов (Society of American Archivists, SAA) в 2018 году прошла 12-18 августа в Вашингтоне. Подробнее о конференции см.
http://rusrim.blogspot.com/2018/08/blog-post_9.html

Секция 305: «Заставить политику работать: Разработка и внедрение рекомендаций по работе с информацией в эпоху открытого правительства» (Making Policy Work: Creating and Implementing Information Guidance in the Age of Open Government) https://archives2018.sched.com/event/ESm7/305-making-policy-work-creating-and-implementing-information-guidance-in-the-age-of-open-government-rim

Работа сессии началась с выступления Кристофера Маги (Christopher Magee) из Национальных Архивов США (NARA), в котором обсуждалась важность политик: они могут помочь Вам улучшить согласованность действий в Вашей организации. При разработке политик обязательно вовлекайте в этот процесс как можно больше пользователей и будьте прозрачными относительно своей работы и общей цели. Обязательно учитывайте, как непосредственные, так и долгосрочные потребности деловой деятельности.

Гейл Сноу (Gail Snow) из архивно-документационной службы округа Кинг (King County) в городе Сиэтле, штат Вашингтон, говорила о содействии прозрачности в процессе создания и реализации политик. Округ Кинг - крупный и сложный муниципальный орган власти, в котором чрезвычайно сложно обеспечить внедрение какой-либо политики во всех его структурах. Среди проблем - то, что политики технически применимы только к органам исполнительной ветви власти; а также разработка политических руководств для сотрудников, которые не сидят, как это традиционно было принято, за столом в офисе. Одно из решений, которое сработало для округа, предусматривало приоритизацию общей политики управления документами, а также политик на случай ввода сотрудника в должность и его перемещения/ухода, поскольку это были общие функции для всего округа. Услуги, предоставляемые архивно-документационной службой, использовались для получения поддержки и повышения заинтересованности других органов власти и выборных должностных лиц. Кроме того, Комитет по государственным документам округа (Public Records Committee) использовался округом в качестве инструмента поддержки политик. Чтобы повышения прозрачности и подотчетности, все политики управления документами были выложены в Интернете.

Шелайя Браус (Sheliah Brous) из министерства транспорта штата Мэриленд (Maryland Department of Transportation, MDOT) в своём докладе сообщила о процессе разработки политик в министерстве. MDOT уделяет большое внимание потребностям конечных пользователей. Все остальные политики поддерживают эту общую миссию. В 2015 году министерство претерпело ряд изменений, в том числе в связи с выходом новых законов о государственной информации и об управлении документами, из-за чего стала приоритетной разработка новой прозрачной политики. Министерству приходится иметь дело с унаследованными документами, начиная с проведения инвентаризации, с тем, чтобы знать, что у него есть. Хотя разработка политик и программ управления документами пользуется хорошей поддержкой высшего руководства, однако имеются проблемы финансирования и финансового бремени, поскольку разработка программы управления документами может восприниматься как «отъём» денег у других ключевых проектов, таких, как проекты по улучшению состояния дорог. При принятии решений министерство ориентировалось на быстрое получение отдачи и на наем опытных специалистов по управлению документами с тем, чтобы те помогли в налаживании этой программы. Сейчас министерство приступило к разработке проектов политик и указаний по срокам хранения документов и действий по их истечении.

Венди Крауч (Wendy Crouch) из Министерства торговли США основное внимание в своём докладе обратило на то, как архивировать «золотые самородки» и пересматривать устаревшую политику. Прежняя политика министерства была избыточной и морально устаревшей. Пересмотр начался с простой идеи: какова цель политики и что должно быть включено в неё? Была проведена оценка целевой аудитории для политики, определены заинтересованные стороны – в первую очередь представители высшего руководства. Коллеги приступили к разработке политики, имея виду конечную цель – её полезность для организации. Проблемы, с которыми они столкнулись, включали стремительный рост объёмов документов, как в бумажном, так и в электронном формате; а также большое количество данных. Выяснилось, что большинство политик неплохо работали в отношении бумажных документов, но были совсем не так хороши для обработки данных, особенно проприетарных. Специалисты министерства хотели бы разработать более эффективные политики для решения проблем с изолированными источниками данных, поскольку возможность коллективного использования данных сильно повышает их ценность.

После выступления панелистам были заданы вопросы о неудачах при разработке политик. Гейл рассказала, как от политики использования текстовых сообщений для округа Кинг отказались в последнюю минуту и, таким образом, она стала справочно-методическим документом. Также был задан вопрос о том, есть ли у представляемых панелистами организаций штатные историки. Хотя в некоторых организациях действительно имеются такие штатные историки, с которым специалистам по управлению документами следует поддерживать хорошие отношения, был затронут вопрос и о «неформальных» историках в организациях, а также о том, как программы [управления документами] могли бы захватывать соответствующую информацию с помощью таких методов, как запись устных воспоминаний.

Хилари Гатлин (Hillary Gatlin)

Источник: Блог секции по вопросам управления документами Общества американских архивистов
https://saarmrt.wordpress.com/2018/09/27/saa-nagara-cosa-2018-recap-session-305/

Уточнен порядок предоставления кредитного отчета


Федеральный закон от 03 августа 2018 года № 327-ФЗ «О внесении изменений в Федеральный закон «О кредитных историях» уточнил положения статьи 6 «Предоставление кредитного отчета», регламентирующие порядок направления запроса субъектом кредитной истории (части 6.1 - 6.6).

Запрос субъекта кредитной истории - физического лица, за исключением индивидуального предпринимателя, о предоставлении кредитного отчета может быть направлен (п.6.1):
  • В письменной форме на бумажном носителе с его собственноручной подписью при представлении им в бюро кредитных историй паспорта или иного документа, удостоверяющего личность;

  • В форме электронного документа, подписанного одним из следующих способов:

  • Усиленной квалифицированной электронной подписью;

    • Простой электронной подписью, ключ которой получен при личной явке в соответствии с правилами использования простой электронной подписи при обращении за получением государственных и муниципальных услуг в электронной форме, установленными Правительством РФ;

    • Простой электронной подписью или усиленной неквалифицированной электронной подписью в случае, если использование соответствующей ЭП предусмотрено соглашением между ним и бюро кредитных историй, при условии проведения бюро его идентификации;

    • Простой электронной подписью или усиленной неквалифицированной электронной подписью в случае, если использование соответствующей ЭП предусмотрено соглашением между субъектом кредитной истории, находящимся на обслуживании в кредитной организации, и этой кредитной организацией, через которую он обращается за получением кредитного отчета и которая заключила договор об оказании информационных услуг с бюро кредитных историй, в которое направляется запрос, после проведения указанной кредитной организацией его идентификации при приеме на обслуживание.

  • В письменной форме на бумажном носителе с его собственноручной подписью, подлинность которой засвидетельствована нотариусом в соответствии с законодательством РФ о нотариате;

  • В форме телеграммы, заверенной оператором связи в соответствии с законодательством РФ в области связи при предъявлении им оператору связи паспорта или иного документа, удостоверяющего личность.
Мой комментарий: Аналогичные требования установлены и для запросов субъектов кредитной истории - индивидуальных предпринимателей и юридических лиц (п.6.4), за исключение двух последних вариантов - нотариально заверенного и в форме телеграммы.

При представлении запросов в письменной форме на бумажном носителе вместе с заявлением ИП и представитель юридического лица должны представить паспорт или иной документ, удостоверяющий личность, а уполномоченный должен также представить документ, подтверждающий его полномочия.

В запросы, направляемые субъектом кредитной истории - индивидуальным предпринимателем либо юридическим лицом должна включаться следующая информация о них (п.6.6):
  • Об индивидуальном предпринимателе - фамилия, имя, отчество (при наличии), серия и номер документа, удостоверяющего личность, а также дата рождения и сведения о государственной регистрации физического лица в качестве индивидуального предпринимателя, индивидуальный номер налогоплательщика;

  • О юридическом лице - наименование, фирменное наименование (сокращенное фирменное наименование при наличии) юридического лица, основной государственный регистрационный номер юридического лица, идентификационный номер налогоплательщика. В запросы, направляемые субъектом кредитной истории - юридическим лицом в соответствии с пунктом 4 части 6.4 настоящей статьи, также должна включаться информация об уполномоченном представителе указанного юридического лица (фамилия, имя, отчество (при наличии), серия и номер документа, удостоверяющего личность, и сведения о документе, подтверждающем его полномочия).
Кроме того, в законе уточнен порядок идентификации субъекта кредитной истории (п.7.)

Идентификация субъекта кредитной истории - физического лица, за исключением индивидуального предпринимателя, в целях предоставления ему кредитного отчета проводится бюро кредитных историй одним из следующих способов (п.7.2):
  • Посредством личного представления паспорта или иного документа, удостоверяющего личность;

  • Посредством прохождения авторизации в единой системе идентификации и аутентификации при использовании УКЭП или простой электронной подписи, ключ которой получен при личной явке в соответствии с правилами использования простой электронной подписи при обращении за получением государственных и муниципальных услуг в электронной форме, установленными Правительством РФ. Идентификация проводится на основании следующих сведений о субъекте кредитной истории, предоставленных из единой системы идентификации и аутентификации, - фамилии, имени, отчества (при наличии), серии и номера документа, удостоверяющего личность, а также даты рождения;

  • На основании информации о субъекте кредитной истории, содержащейся в запросах кредитных организаций.
Идентификация субъекта кредитной истории - индивидуального предпринимателя или юридического лица в целях предоставления им кредитного отчета проводится бюро кредитных историй одним из следующих способов (п.7.3):
  • Посредством личного представления субъектом кредитной истории - индивидуальным предпринимателем паспорта или иного документа, удостоверяющего личность, а уполномоченным представителем юридического лица, являющегося субъектом кредитной истории, паспорта или иного документа, удостоверяющего личность, а также документа, подтверждающего его полномочия;

  • С использованием квалифицированного сертификата ключа проверки электронной подписи при направлении запроса о предоставлении кредитного отчета в форме электронного документа, подписанного УКЭП;

  • На основании информации о субъекте кредитной истории, содержащейся в запросах кредитных организаций.
Новые положения вступают в силу с 31 января 2019 года.

Источник: Консультант Плюс
http://www.consultant.ru/cons/cgi/online.cgi?req=doc;base=LAW;n=304063

понедельник, 22 октября 2018 г.

Внутри здания, хранящего ядерные секреты Великобритании


Данная заметка Ричарда Прайдея (Richard Priday) была опубликована 8 октября 2018 года на сайте британского журнала Wiredhttps://www.wired.co.uk/ ).

Мой комментарий: ранее я уже писала о данном архиве, см. http://rusrim.blogspot.com/2015/04/blog-post_13.html и http://rusrim.blogspot.com/2017/02/blog-post_17.html .

Вывод из эксплуатации ядерных объектов – процесс длительный, поэтому архив «Ядро» (Nucleus) был построен с расчетом на длительной существование.

Фото: Tricia Malley/Ross Gillespie

Семьдесят лет британской ядерной истории хранятся за этими бетонными, каменными и алюминиевыми стенами. С момента открытия в феврале 2017 года, совместный архив Агентства по выводу из эксплуатации ядерных объектов (Nuclear Decommissioning Authority, NDA) архив «Ядро» (Nucleus) и местечка Кейфнесс (Caithness) (расположен в горной северо-западной Шотландии (Highlands), недалеко от города Вик (Wick) -  где как раз находится старая крупная атомная электростанция – Н.Х.) собирает тысячи записей, изображений и планов, касающихся деятельности британской гражданской ядерной промышленности. Кроме того, ему передаются документы из 17 архивов по всей стране, поскольку NDA планирует собрать все материалы такого рода в этом специально построенном хранилище.

В архиве содержатся документы, начиная с 1950-м годов, причём некоторые из них сохраняют гриф «Совершенно секретно». Документы хранятся в трех экземплярах: один на бумаге, один на микроплёнке, и один в виде PDF-файла, чтобы уменьшить износ оригиналов.

Некоторые из документов находятся в плохом состоянии, но они будут нужны в течение ближайших столетий, поскольку взаимосвязаны с медленными процессами вывода ядерных объектов из эксплуатации. Именно поэтому архив Nucleus был построен в расчёте на длительную перспективу. «Мы решили архивные помещения возводить из монолитного бетона»,  - говорит Лаура Киннэрд (Laura Kinnaird), партнер в базирующейся в  Эдинбурге  архитектурной фирме Reiach and Hall Architects, которая спроектировала здание. «Это способствовало быстроте возведения, прочности и долговечности конструкции».

Архив спроектирован в расчёте на то, чтобы одновременно выдерживать и использовать ненастную погоду Шотландии. Материалы здания и его угловая форма помогают свести к минимуму ущерб от ветра, а дождевая вода собирается и используется для смыва туалетов в здании. Дизайн получил несколько наград, в том числе премию RIAS Award 2018 (это премия Королевского общества архивистов Шотландии, Royal Incorporation of Architects in Scotland, см.  https://www.rias.org.uk/awards/rias-awards/rias-awards-2018/ - Н.Х.) и RIBA Award для Шотландии 2018 года (это премия Королевского института британских архитекторов, Royal Institute of British Architects , см. https://www.architecture.com/awards-and-competitions-landing-page/awards/riba-regional-awards/rias-award-winners/2018/nucleus-the-nuclear-decommissioning-authority-and-caithness-archive ).

Фото: Broad Daylight Ltd

Внутри прочных стен здания поддерживаются контролируемые температура и влажность в архивохранилищах, чтобы обеспечить долговременную сохранность бумаг. Чтобы эти условия оставались стабильными, двери, окна и стены архива Nucleus являются модульными: их можно быстро заменить, не подвергая документы воздействию внешней среды. «Нам не нужно закрываться на время технического обслуживания», - объясняет Джон Нортон (John Norton), проект объектов и портфолио NDA. «Всё действительно спроектировано так, чтобы двери архива оставались открытыми в течение следующих нескольких столетий».

Через эти двери ожидается большое движение. Nucleus располагает 26 погонными километрами стеллажей, а к хранящимся на них документам часто обращаются профессионалы гражданской атомной отрасли. «Люди часто представляют себе архивы как пыльные полки, - говорит Саймон Такер (Simon Tucker), руководитель отдела стратегического управления информацией NDA. «Но это очень активный архив».

Ричард Прайдей (Richard Priday)

Источник: сайт журнала Wired
https://www.wired.co.uk/article/nucleus-archive-uk-nuclear

Перечень стандартов ИСО в области управления документами и контентом, адаптированных в России и переведенных на русский язык


Вопросы организации хранения электронных документов сейчас выступают на первый план в связи с программой «Цифровой экономики». Однако у нас до сих пор отсутствуют какие-либо методические документы по данному вопросу.

В этой связи, как мне кажется, многим коллегам могут пригодиться стандарты - в том числе стандарты ИСО в области управления документами и контентом, переведенные на русский язык и адаптированные в России как ГОСТы.

Базовые стандарты управления документами и контентом
  • ГОСТ Р ИСО 30300-2015 «Система стандартов по информации, библиотечному и издательскому делу. Информация и документация. Системы управления документами. Основные положения и словарь», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=194658 

  • ГОСТ Р 7.0.101-2018 / ИСО 30301:2011 «Система стандартов по информации, библиотечному и издательскому делу. Информация и документация. Системы управления документами. Требования», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=222670

  • ГОСТ Р ИСО 30301-2014 «Информация и документация. Системы менеджмента записей. Требования», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=181007 

  • ГОСТ Р ИСО 15489-1-2007 «Система стандартов по информации, библиотечному и издательскому делу. Управление документами. Общие требования», http://www.internet-law.ru/gosts/gost/461/ или http://www.consultant.ru/document/cons_doc_LAW_135548/

  • ГОСТ Р ИСО 23081-1-2008 «Система стандартов по информации, библиотечному и издательскому делу. Процессы управления документами. Метаданные для документов. Часть 1. Принципы», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=166090 

  • ГОСТ Р ИСО 15836-2011 «Информация и документация. Набор элементов метаданных Dublin Core» объёмом 12 страниц, http://protect.gost.ru/v.aspx?control=8&baseC=6&id=172127

  • ГОСТ Р 55681-2013 / ISO/TR 26122:2008 «Информация и документация. Анализ процессов работы с точки зрения управления документами», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=178714 

  • ГОСТ Р ИСО 22310-2009 «Система стандартов по информации, библиотечному и издательскому делу. Информация и документация. Руководство для разработчиков стандартов, устанавливающих требования к управлению документами», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=167711 

  • ГОСТ Р 57551-2017 / ISO/TR 18128:2014 «Информация и документация. Оценка рисков для документных процессов и систем», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=210200

  • Проект стандарта ГОСТ Р/ИСО//МЭК ISO/IEC 27050-1:2016 «Информационные технологии – Методы обеспечения безопасности - Выявление и раскрытие электронной информации – Часть 1: Обзор и концепции») ISO/IEC 27050-1:2016 Information technology - Security techniques - Electronic discovery - Part 1: Overview and concepts). Подготовлен по Программе национальной стандартизации на 2018 год.
Обеспечение долговременной сохранности, целостности и аутентичности электронных документов
  • ГОСТ Р 54989-2012 / ISO/TR 18492:2005 «Обеспечение долговременной сохранности электронных документов», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=172688 

  • ГОСТ Р 54471-2011/ISO/TR 15801:2009 «Информация, сохраняемая в электронном виде. Рекомендации по обеспечению достоверности и надежности», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=172001 

  • ГОСТ Р ИСО 13008-2015 «Информация и документация. Процессы конверсии и миграции электронных документов» объёмом 70 страниц, введён с 01.10.2016 года, см. http://protect.gost.ru/v.aspx?control=8&baseC=6&id=193476 

  • ГОСТ Р ИСО/МЭК 27037-2014 «Информационная технология. Методы и средства обеспечения безопасности. Руководства по идентификации, сбору, получению и хранению свидетельств, представленных в цифровой форме», http://protect.gost.ru/v.aspx?control=8&baseC=6&id=179958 

  • Перевод стандарта ISO 14641-1:2012 Electronic archiving - Part 1: Specifications concerning the design and the operation of an information system for electronic information preservation (ISO 14641-1:2012 Управление электронными документами. Проектирование и эксплуатация информационных систем для обеспечения долговременной сохранности электронных документов. Часть 1. Спецификации). Планируется включить в Программу национальной стандартизации на 2019 год.