четверг, 20 апреля 2023 г.

Варианты использования искусственного интеллекта в сфере э-раскрытия, о которых Вы могли не знать

Данная заметка была опубликована 8 марта 2023 года на сайте компании KLDiscovery.

Термин «искусственный интеллект» (ИИ) стал весьма модным не только тогда, когда речь заходит о технологиях в целом, но и когда речь идёт об э-раскрытии.

Мой комментарий: Электронное раскрытие (э-раскрытие, англоязычный термин e-discovery) - это элемент процессуального права англосаксонских стран, представляющий собой процедуру обязательного выявления и раскрытия сторонами гражданского спора всех (именно – всех!) относящихся к рассматриваемому делу электронных документов и информации. Термин также применяется в отношении раскрытия информации перед регуляторами или правоохранительными органами в случае расследования. Электронное раскрытие является частью общей процедуры раскрытия (discovery), охватывающей все документы и информацию, находящиеся в распоряжении и под контролем организации.

Это заставляет многих юристов задуматься о том, как понять, какие ИИ-технологии были проверены и практически применены в процессах э-раскрытия, а какие являются спекулятивными и непроверенными. Хорошей новостью является то, что существует ряд практических применений ИИ-технологий, которые за ряд лет доказали свою эффективность в качестве средства оптимизации потоков рабочих процессов э-раскрытия.


Предсказательное кодирование (predictive coding)

Большинство коллег, когда они думают об применении искусственного интеллекта в рабочих процессах э-раскрытия, обычно вспоминают о предсказательном кодировании», то есть о применении технологии машинного обучения для ранжирования и категоризации документов на этапе проверки и отбора (review) электронной информации. Предсказательное кодирование - широко известное применение ИИ-технологии для целей э-раскрытия, одобренное судами более десяти лет тому назад, а отраслью - и ещё раньше. Если Вы принимали участие в ряде проектов э-раскрытия, то, скорее всего, в какой-то момент Вы уже использовали предсказательное кодирование.

Мой комментарий: У меня на блоге есть ряд постов, в которых упоминалось «предсказательное кодирование», см. подборку
http://rusrim.blogspot.com/search?q=%22predictive+coding%22

Другие варианты использования искусственного интеллекта для э-раскрытия

Однако предсказательное кодирование - не единственное проверенное практикой применение ИИ-технологий, доступное в настоящее время специалистам в области э-раскрытия. Есть несколько других вариантов применения ИИ, которые Вы можете использовать для оптимизации рабочих процессов э-раскрытия, в том числе:

Выявление «почти-дубликатов» (near-duplicate identification)

Многие документы могут быть похожими по содержанию и формату, не являясь при этом точными дубликатами - например, различные редакции одного и того же документа, или же представление документа в ином формате, например, в формате PDF (когда контент может быть тем же самым, но значение хеша, используемое в процессах удаления дубликатов, будет уже другим). Технология искусственного интеллекта может быть использована для автоматического группирования документов с похожим текстом, позволяя тем самым быстрее анализировать большие объёмы документов.

Выявление цепочек сообщений в электронной почте

Каждое электронное письмо представляет собой «снимок» обсуждения, имевшего место до этого момента, а это означает, что части этого обсуждения будут появляться неоднократно. Технология искусственного интеллекта Вам позволяет собирать вместе входящие в цепочку (thread) сообщения электронной почты, чтобы выявить наиболее полные версии электронной переписки и просматривать ход обсуждения более интуитивным образом, чем в традиционных рабочих процессах проверки и отбора.

Определение языка

Во многие проекты э-раскрытия вовлечены международные ответственные хранители документов и информации, а это означает, что коллекции документов часто включают материалы на нескольких языках. В некоторых документах используется несколько языков в самом документе. Технология искусственного интеллекта даёт Вашей группе возможность поддерживать многоязычные данные и повышать эффективность проверки и отбора за счет автоматического определения основного и вспомогательных языков во всех документах в вашем наборе данных, - тем самым давая Вам возможность направлять эти документы группам проверки и отбора, которые лучше всего способны сделать данную работу с материалами на этих языках.

Автоматическое цензурирование (redaction)

В связи с ужесточением законодательства о защите персональных данных, выявление и удаление персональных данных (personally identifiable information, PII) становится важной, как никогда ранее, задачей, - при этом остаётся также неизменной потребность в выявлении и удалении привилегированной и конфиденциальной информации. Ручное цензурирование является чрезвычайно трудоёмким и дорогостоящим. ИИ-технология может помочь автоматизировать цензурирование, с возможностью анализа результатов и «отката» некорректно применённых исправлений, тем самым помогая упростить известный своей трудоёмкостью процесс.

Обработка естественного языка (Natural Language Processing, NLP)

Каждая коллекция документов характеризуется уникальным набором мест, событий, ключевых людей и организаций, названий продуктов и других важных для дела характеристик. Обработка естественного языка (NLP) - это ИИ-технология работы с текстами на естественном языке, который позволяет Вам получить представление о Вашей коллекции документов, анализируя её на предмет выявления категорий объектов, а затем визуально группируя документы, ссылающиеся на одни и те же объекты, что даёт Вам возможность быстро локализовать и извлечь нужную информацию или же отфильтровать ненужные материалы.

Автоматизация рабочих процессов проверки и отбора


Рабочие процессы проверки и отбора часто сложны, требуют выполнения многочисленных шагов, а требования в отношении проверки и отбора раскрываемых электронных материалов для каждого случая часто уникальны. В результате управление рабочими процессами проверки и отбора может превратиться в работу на полный рабочий день, чтобы обеспечить маршрутизацию документов нужной группе проверки в нужное время, - при этом неизбежны частые ошибки. Технология искусственного интеллекта способна автоматизировать создание настраиваемых рабочих процессов для поддержки маршрутизации и распространения документов. Её применение упрощает проверку и отбор документов, обеспечивая максимальную точность и защитимость в суде и одновременно поддерживая выполнение уникальных требований, характерных для каждого судебного дела.

Перечисленные варианты использования являются доступными уже сегодня способами практического применением ИИ-технологий. Известность этих ИИ-технологий связана не с ажиотажем или спекулятивными рассуждениями; за ряд лет они доказали свою эффективность для оптимизации э-раскрытия в рамках многих проектов и судебных дел, особенно на этапе проверки и отбора подлежащих э-раскрытию материалов, который исторически был самым дорогостоящим этапом жизненного цикла э-раскрытия. Если Вы ещё не пользуетесь этими проверенными ИИ-возможностями, подумайте о том, чтобы добавить их с целью оптимизации Ваших рабочих процессов.

Чтобы узнать больше о продукте Nebula AI компании KLDiscovery и встроенных в него функциональных возможностях для э-раскрытия на основе ИИ, позволяющих юридическим подразделениям классифицировать миллионы документов с минимальным вмешательством человека, снижая тем самым затраты и обеспечивая, что важные документы не будут упущены. - посетите веб-сайт компании по адресу ( https://www.kldiscovery.com/solutions/ediscovery-analytics ).

Мой комментарий:
Стоит отметить, что практически все варианты использования ИИ для целей э-раскрытия в равной степени применимы и для целей управления документами.

Источник: сайт компании KLDiscovery
https://www.kldiscovery.com/blog/ai-use-cases-for-ediscovery

Комментариев нет:

Отправить комментарий