пятница, 9 марта 2012 г.

Рендольф Кан об использовании технологии автоклассификации

Рендольф (Ренди) Кан (Randolph Kahn – на фото), создатель и владелец консультационной фирмы Kahn Consulting, хорошо известен в мире как оратор, консультант и автор десятков завоевавших популярность книг. Он также возглавляет команду профессионалов в области управления информацией, права, исполнения законодательно-нормативных требований и ИТ, которая консультирует крупнейшие мировые организации.

Данная статья Ренди Канна была опубликована 1 марта 2012 года на сайте его компании под заголовком «Поток автоклассификационного сознания от Рендольфа Канна, эксвайра» (A Stream of Auto-Classification Consciousness by Randolph Kahn, ESQ).
«Но как судья отнесется к тому, что мы используем технологию автоматической классификации для выполнения тяжелой работы по разделению информации на документы и «мусор»?»

«Я хочу быть уверенным в том, что применение нами технологии программной алгоритмической классификации для установления сроков хранения в соответствии с нашими правилами и для чистки содержимого общих дисков не приведет к тому, что нас «выпорет» регулятор или суд.»

«Меня беспокоит, что если мы избавимся от этих данных, не проведя их экспертизу «вручную» силами наших сотрудников, то окажемся открытыми для атаки в суде.»
У нас есть эмпирические данные, подтверждающие предположение о том, что сотрудники классифицируют и кодируют информацию хуже, чем компьютеры – намного хуже. Тем не менее, большинство компаний продолжают полагаться на своих сотрудников в вопросе управления информацией. «Опирающиеся на технологии процессы [поиска документов, отвечающих определенным критериям - Н.Х.], в которых лишь небольшая часть массива документов анализируется людьми, способны обеспечить большую точность и полноту, чем изматывающий процесс просмотра вручную, в ходе которого весь массив документов изучается и кодируется людьми.» (Маура Гроссман и Гордон Кормак, «Анализ с использованием технических средств в ходе поиска и представления электронных документов и информации в суде (e-Discovery) может эффективнее, чем полистный просмотр вручную» - Technology-Assisted Review in E-Discovery Can Be More Effective and More Efficient Than Exhaustive Manual Review, Maura R. Grossman, JD., Ph.D. and Gordon V. Cormack, Ph.D).

У большинства крупных компаний сейчас имеются петабайты структурированного и неструктурированного контента, это миллиарды файлов. Неужели Вы думаете, что какой-либо судья скажет, что «разумно» ожидать проведения сотрудниками классификации и анализа миллиардов файлов, прежде чем они могут быть уничтожены? По данным опроса «Информационный взрыв» (The Information Explosion Survey), проведенного Советом по автоматической классификации информации (Council of Information Auto-Classification), 98% опрошенных организаций сообщили о быстром росте объёмов информации, который, по их прогнозам, продолжится в будущем, - и о том, что этот рост создает множество проблем и последствий. Половина респондентов отметила, что они вынуждены воссоздавать ранее уже созданную информацию из-за того, что не могут её отыскать. 74% организаций сообщило, что ценная информация теряется (т.е. не может быть найдена, уничтожена, сохранена не там, где следовало) в связи с отсутствием надлежащих технологических решений. По мнению 73% респондентов, их организация упускает деловые возможности из-за того, что не способна обеспечить эффективный доступ к информации.

Технологии обладают удивительной мощью в плане выявления ценности информации и получения от неё отдачи, «соединения точек», - тогда как люди оказываются неспособными осмыслить горы данных. Люди доверяют свои жизни проекту изучения генома человека, который стал возможным благодаря технологиям, выявляющим взаимосвязи в данных, - а Вы не уверены в возможности использовать автоклассификацию для определения, является ли сообщение электронной почты документом...

В статье, озаглавленной «Будет ли ручной просмотр документов и поиск по ключевым словам заменен компьютеризованным кодированием» (Search, Forward: Will manual document review and keyword searches be replaced by computer-assisted coding) американский федеральный судья-магистрат (Magistrate Judge – в федеральных судах США, младшие судьи, обладающие ограниченными полномочиями – Н.Х.) Эндрю Пек (Andrew Peck) пишет: «Возможно, кое-кто ждёт судебного решения, в котором будет сделан вывод, что, по мнению суда, использование предсказательного кодирования (predictive coding) является надлежащим и приемлемым способом выполнения поиска, соответствующим положениям Федеральных правил гражданского судопроизводства, и, кроме того, что программное обеспечение для этой цели, разработанное фирмой [здесь вставить название вашего любимого поставщика] является, с точки зрения суда, наиболее подходящим». Если это так, то ждать придётся долго ... Пока не появится судебное решение, одобряющее (или даже критикующее) использование предсказательного кодирования, юристам придётся полагаться на данную статью как на знак судейского одобрения. С моей точки зрения, компьютерное кодирование следует использовать в тех случаях, когда это поможет «обеспечить справедливое, быстрое и недорогое» (цит. из Федеральных правил гражданского судопроизводства) рассмотрение дела в мире, где выемка и представление электронных документов вошли в судебную практику.

Судья Пек возвращается к этой теме в своем приказе от 22 февраля 2012 года по делу Moore против Publicis Groupe: «Компьютеризованный анализ, суда по всему, оказывается лучше, чем имеющиеся альтернативы, и поэтому его следует использовать в соответствующих случаях. Хотя данный суд признает, что компьютеризованный анализ несовершенен, но Федеральные правила гражданского судопроизводства и не требует совершенства ... Адвокату больше не нужно беспокоиться о том, что он окажется «первым» или «подопытным кроликом» в плане признания судом компьютеризованного анализа.»

И если компьютеризованный анализ приемлем как средство поиска нужной информации для судебного иска, то что мешает Вам использовать такого рода технологии для классификации документов? Совершенно очевидно, что применение правил делопроизводства [на основе результатов автоклассификации – Н.Х.] куда менее рискованно, чем исполнение обязательств по представлению в суд электронной информации. Автоматическая классификация является средством для того, чтобы лучше управлять огромными объемами данных, и, где уместно, уничтожать их (с возможностью обосновать законность уничтожения), когда люди уже не могут справиться с этой задачей. Позиция судов в настоящее время упрощает принятие такого решения [о применении автоклассификации – Н.Х.].

Рендольф Кан (Randolph A. Kahn)

Мой комментарий: С моей точки зрения, наиболее эффективным может оказаться подход, предусматривающий как традиционный ручной анализ сравнительно небольших объёмов наиболее ответственных документов, так и использование автоматической классификации для прочих документов - в первую очередь для классификации больших объёмов не рассортированной как следует электронной переписки.

Нужно отметить, что, – в отличие от задачи представления всех документов, отвечающих определенным критериям, - использование автоклассификации для установления сроков хранения все-таки менее актуально. Если удастся так наладить делопроизводство, что созданные или полученные документы сразу будут правильно «привязываться» к соответствующим рубрикам классификационной схемы (или, в терминах традиционного российского делопроизводства, к номенклатуре дел), то потребность в средствах автоклассификации может быть существенно снижена.

Источник: сайт компании Kahn Consulting
http://infonation.kahnconsultinginc.com/2012/02/stream-of-auto-classification.html

Комментариев нет:

Отправить комментарий