вторник, 11 сентября 2018 г.

Беседы об управлении документами, эпизод 3: Машинное обучение, часть 2


(Окончание, начало см. https://rusrim.blogspot.com/2018/09/3-1.html )

Касси Финдлей: Широкой общественностью уже поднимаются вопросы, связанные с использованием машинного обучения при принятии ответственных решений, затрагивающих государственные органы или отдельных лиц. Я полагаю, что архивам следует задуматься и принять на себя ответственность за последствия использования этих технологий в плане доверия и возможного ощущения предвзятости. Как я думаю, отчасти решением здесь является прозрачность. Есть ли у вас какие-либо соображения относительно восприятия широкой общественностью архивов, которые используют машинное обучение для выявления и управления документами, представляющими собой память общества?

Джон Шеридан: У этого вопроса есть два аспекта. Что касается способности [справиться с нарастающими объёмами электронных документов – Н.Х.], то, по моему мнению, машинное обучение является единственным масштабируемым решением, и мы придём к принятию с его помощью решений об отделении подлежащих постоянному хранению документов от информации, которую на хранение принимать не нужно и/или от которой следует избавиться. У органов правительства Великобритании – и мы наблюдаем такую же картину и в других местах - как правило, имеется электронная свалка, из которой каким-то образом необходимо извлекать государственные документы постоянного срока хранения, обеспечивая затем их долговременную сохранность и доступность. Когда речь идёт о десятках и, может быть, даже о сотнях терабайт разнородных электронных документов, электронных писем и документов, Word-документов и иного разнообразного контента, единственный способ справиться с этой работой – это использовать технологии машинного обучения.

Может даже оказаться, что подход к отбору на основе машинного обучения является более последовательным, более надежным и может быть более прозрачным, чем традиционный подход, при котором решения принимаются человеком. Но мы столкнемся с рядом жёстких ограничений, когда машинное обучение хорошо решает задачу классификации, но плохо справляется с пониманием контекста - сможем ли мы найти способы обучения систем, способных дать нам некое подобие понимания контекста тех материалов, которое нам нужно изучать и исследовать?

С другой стороны, мы видим, что системы машинного обучения будут все шире внедряться государственными органами и учреждениями, и можно себе представить, что эти глубинные сети сами станут государственными документами, - поэтому нам нужно понять, как нам проводить экспертизу ценности и отбор глубинной сети на хранение, как нам обеспечивать её долговременную сохранность и доступность.

Таким образом, есть у этого вопроса и такой аспект, - и опять же, единственный способ, с помощью которого мы можем начать оценивать, что это означает, это засучить рукава, повысить наше понимание технологии, попробовать ее, учиться на этом опыте, задавая все эти вопросы и пытаясь ответить на них. Безусловно, мы слишком маленькое учреждение, чтобы сделать всё это самостоятельно, и, как я считаю, архивы по всему миру должны коллективно накапливать знания, совершенствовать понимание и развивать  возможности, а также обсуждать эти проблемы, если мы действительно хотим накопить практический опыт, который нам явно понадобится.

Касси Финдлей: Да, это очень интересная область, и я уверена, что, когда Вы будете участвовать в конференции iPRES этого года, Вы, вероятно, услышите об экспериментах, выполняемых другими организациями и учреждениями. Надеюсь, что это приведёт к развитию партнерских отношений и сотрудничества в этой столь важной области.

Джон Шеридан: Надеюсь.

Касси Финдлей: Думаю, нам пора завершать эту увлекательную беседу. Я хочу поблагодарить Вас за то, что сегодня уделили нам столько времени и столь вдумчиво осветили все поднятые темы, мы очень это ценим. Большое вам спасибо, Джон Шеридан из Национальных Архивов Великобритании.

Джон Шеридан: Вам также большое спасибо.

Беседу вела Касси Финдлей (Cassie Findlay)

Источник: сайт «Recordkeeping Roundtable»
https://rkroundtable.org/2018/08/19/recordkeeping-roundcasts-episode-3-machine-learning/

Комментариев нет:

Отправить комментарий