среда, 30 октября 2019 г.

Машинное обучение, архивы и специальные коллекции: Высокоуровневая точка зрения, часть 1


Данная статья исполнительного директора Коалиции сетевой информации (Coalition for Networked Information, CNI, https://www.cni.org/ ) и пионера исследований в области искусственного интеллекта и цифровой информации в учреждениях культуры (главным образом в библиотеках) Клиффорда Линча (Clifford A. Lynch – на фото, о нём см. также https://www.cni.org/about-cni/staff/clifford-a-lynch ) была опубликована 2 октября 2019 года на блоге Международного совета архивов ( https://blog-ica.org/ ).
От редакции блога: Данная статья впервые была опубликована в № 38 бюллетеня Международного совета архивов (МСА) Flash за сентябрь 2019 года. Чтобы подробнее ознакомиться с материалами данного номера, посвящённого искусственному интеллекту в связи с архивным делом, члены МСА могут воспользоваться ссылкой https://www.ica.org/en/member/login?destination=node/18294 (или прямой ссылкой https://ica.us13.list-manage.com/... ). Если Вы не состоите в членах МСА, то можете вы можете воспользоваться ссылкой https://www.ica.org/en/join-international-council-archives , чтобы присоединиться к нам.
Сейчас делаются экстравагантные прогнозы в отношении того, что в популярных средствах массовой информации называют «искусственным интеллектом» (ИИ). Утверждают, что он станет причиной ликвидации миллионов рабочих мест; приведёт к широкому распространению беспилотных автомобилей; возьмёт на себя медицинскую диагностику и назначение лечения, а также принятие решений в ходе деловой деятельности и государственного управления. Создаётся ощущение, что ИИ каким-то образом – каким именно, пока чётко никто сказать не может - преобразует деятельность, связанную с созданием и управлением знаниями, а также деятельность организаций, занимающихся сохранением культурно-исторической памяти. Данная краткая статья является попыткой дать определенное разумно здравое и конкретное представление о соответствующих изменениях, которые реально могут произойти в течение следующего десятилетия (не вдаваясь при этом в технические подробности), и о том, что эти изменения могут означать для практической работы архивов и специальных коллекций, и, более широко, для учреждений, сохраняющих культурную память.

Исполнительный директор Коалиции сетевой информации (Coalition for Networked Information, CNI) д-р Клиффорд Линч (Dr Clifford A. Lynch) на конференции Jisc/CNI  2018 года (Фото: Jisc)

В последние годы были достигнуты замечательные успехи, в первую очередь, на достаточно специфическом и ограниченном направлении машинного обучения (machine learning). Говоря попросту, в машинном обучении используются наборы примеров для того, чтобы обучить программное обеспечение распознавать типовые ситуации и действовать в соответствии с этим. Например, использование этого подхода позволило компьютерной программе стать мировым чемпионом в игре «Го», которую большинство считает гораздо более сложной, чем шахматы; а также дало компьютерам возможность научиться блестяще действовать в различных видеоиграх. В настоящее время программное обеспечение не уступает человеку при анализе различных видов медицинских изображений с целью выявления определённых заболеваний. Многие из предсказанных и наиболее ожидаемых революционных решений объединяют в себе машинное обучение с различными формами робототехники и «компьютерного зрения» (реально подразумевающего применение широкого набора датчиков изображения и иных датчиков окружающей среды), особенно в таких приложениях, как беспилотные автономные автомобили, грузовики, корабли, дроны и военная техника.

Есть три побудительные причины для внедрения машинного обучения: снижение затрат за счет исключения людей (автономные транспортные средства), преодоление ограничений, связанных с возможностями человека (игры) и совершение действий, которые сегодня невозможны в желаемых масштабах с приемлемыми затратами (например, повсеместная слежка). Последняя из названных причин также открывает возможности для организаций, занимающихся охранением культурно-исторической памяти.

Мой комментарий: Я бы, со своей стороны, назвала их «возможностями для получения отдачи» и ранжировала бы, в порядке уменьшения величины отдачи, следующим образом:
  • Освоение совершенно новых и очень «лакомых» или абсолютно необходимых видов деятельности, которые невозможны без подобных технологий – в этом случае соответствующие затраты являются просто ценой вхождения в сферу деятельности; и привычные критерии типа TCO (полной стоимости владения) особого смысла не имеют;

  • Возможность для коммерческих предприятий заметно повысить прибыль от существующих видов деятельности;

  • Достижение намного большей эффективности, масштабной экономии и/или снижения риска в существующих видах деятельности;

  • Мелочная, часто сомнительная экономия и рационализация (аналог – экономия тонера при внедрении систем электронного документооборота).
С моей точки зрения, устранение человека самоцелью не является. Скорее наоборот – наиболее интересные перспективы, как мне кажется, будут у «гибридных» решений, позволяющие использовать сильные стороны как человека, так и машины, и взаимно-компенсировать их слабости и недостатки.

Среди приложений, имеющих непосредственное отношений к деятельности учреждений памяти, для которых внедрение машинного обучения привело к прорывам, можно назвать перевод с одного языка на другой; перевод печатного или рукописного текста в полностью распознанное машиночитаемое представление (его иногда называют (по традиции – Н.Х.) «оптическим распознаванием символов»); преобразование речи в текст; классификация изображений по их содержанию (например, выделение всех изображений, на которых есть собаки; или же перечисление всех объектов, которое программное обеспечение может распознать в изображении); и, как особый важный частный случай идентификации образов, распознавание лица человека.

Прогресс во всех этих областях подстёгивается и направляется государственным и/или коммерческим секторами, которые бесконечно лучше обеспечены финансовыми ресурсами, чем сфера сохранения культурно-исторической памяти. Например, многие национальные государства и крупные корпорации очень сильно заинтересованы в развитии технологии распознавании лиц. Ключевой стратегией для сектора сохранения культурно-исторической памяти будет использование этих достижений, адаптация и приспособление технологий для собственных нужд.

(Окончание следует, см. http://rusrim.blogspot.com/2019/10/2_31.html )

Клиффорд Линч (Clifford A. Lynch)

Источник: блог МСА
https://blog-ica.org/2019/10/02/machine-learning-archives-and-special-collections-a-high-level-view/

Комментариев нет:

Отправить комментарий