понедельник, 18 ноября 2024 г.

Использование искусственного интеллекта для целей управления документами: Семь ключевых вариантов выбора, часть 1

Данный пост известного британского консультанта и педагога в области управления документами Джеймса Лепена (James Lappin - на фото) был опубликован 24 октября 2024 года на его блоге «Thinking Records» (Думая о документах).

Если бы кто-то сказал мне, что собирается применять искусственный интеллект (ИИ) для управления документами, то, наверное, я бы первым делом открыл рот от изумления, - а затем задал ряд вопросов, чтобы точнее определить место предлагаемого использования ИИ.

Существует ряд типов ИИ, которые можно применять для выполнения различных действий, в отношении разных типов целевого контента, на различных уровнях агрегации, на разных этапах жизненного цикла документов, при различных видах контроля со стороны человека и преследуя различные цели управления документами.

Именно тот выбор, который делается по каждому из этих семи аспектов, и определяет характер применения ИИ.

1. Выбор ИИ-метода / метода обработки данных

Существует огромное разнообразие различных типов искусственного интеллекта (и методов обработки данных в целом), которые можно применять. Возможно, Вам захочется:

  • написать собственный набор правил; или

  • обучить модель машинного обучения с учителем (контролируемого машинного обучения) с использованием предварительно размеченных данных; или

  • запустить модель машинного обучения без учителя (неконтролируемого машинного обучения) непосредственно на Вашем целевом контенте (а затем начать контролировать её и проводить итеративное совершенствование, потому что модель не заработает как надо с первого раза!); или

  • использовать подсказки, настроить или дополнить большую языковую модель (large language model, LLM).

В качестве альтернативы (или дополнения) Вы можете пожелать запустить аналитические инструменты для получения основанных на статистических данных знания и представления о Вашем целевом контенте.

Лучше всего думать об этих вариантах использования как о наборе инструментов. Вам может потребоваться применять их в сочетании. Можно начать с одного типа использования и переключиться на другой, если результаты не соответствуют запланированным или если затраты оказываются слишком высоки.

2. Выбор взаимосвязи между контролем со стороны ИИ и контролем со стороны человека

Метод ИИ / обработки данных может:

  • обеспечивать поддержку принятия решений посредством подготовки для службы управления документами резюме контента, предлагаемых классификационных категорий (таксономий), выявления конфиденциального контента и т. д.;

  • непосредственное выполнять действия на основе контента посредством присваивания ему классификационной категории, установления сроков хранения, присваивания с целью защиты пометок и грифов и т.д. В таких случаях человеческий контроль принимает формы как тестирования ИИ-модели перед развёртыванием, так и постоянного мониторинга модели после развёртывания.

3. Выбор цели применения ИИ

Служба управления документами может использовать ИИ-технологии и методы обработки данных в целом в различных целях, в число которых входят:

  • Применение системы классификации (таксономии): Использование ИИ для назначения контенту классификационных категорий. Это может включать использование контролируемого (с учителем) машинного обучения с целью применения существующей системы классификации (таксономии). В качестве альтернативы, может использоваться неконтролируемое (без учителя) машинное обучение для формирования таксономии на основе самого целевого контента, и её последующего применения к этому целевому контенту. Чтобы таксономия была полезна для целей управления документами, она должна быть связана с правилами установления сроков хранения и действий по их истечении (или же должна быть возможность установления такой связи);

  • Проведение отбора на уничтожение: Использование ИИ для выявления материалов, не имеющих длительной и постоянной ценности для организации и/или соответствующих заинтересованных сторон;

  • Проведение экспертизы ценности и отбора на постоянное архивное хранение: Использование ИИ (обычно государственным органом, по истечении установленного законодательством периода времени) для выявления материалов, имеющих историческую ценность для общества и, следовательно, заслуживающих передачи на постоянное архивное хранение в исторический архив;

  • Определение степени секретности / конфиденциальности: Использование ИИ для выявления в материалах секретных и конфиденциальных сведений, требующих установления ограничений доступа и/или применения иных мер защиты.

4. Выбор осуществляемых ИИ действий

Для поддержки названных выше целей существует множество действий, которые могут выполняться искусственным интеллектом. В их число входят:

  • Разметка: Назначение классификационной категории (или же непосредственное назначение категории срока хранения) к объекту или их агрегации;

  • Резюмирование (реферирование): Подготовка резюме на основе содержания объекта, агрегации или набора агрегаций. Такое резюме может дать возможность службе управления документами быстро проверить предположения о контенте соответствующей агрегации/набора агрегаций. Резюме также могут дать возможность службе управления документами обосновывать и защищать решения, принятые в отношении этой агрегации/набору агрегаций;

  • Защита конфиденциальности: Действия по ограничению доступа к агрегациям, объектам или их частям, которые содержат информацию, признанную конфиденциальной или секретной;

  • Отбор не имеющих ценности материалов: Выявление сообщений чисто личного характера или относящихся к внерабочему взаимодействию в коллективе, нежелательных сообщений (спама), не переданных кому-либо документов и/или тривиальных по своему содержанию материалов, которые не нужно сохранять в составе определенной агрегации или набора агрегаций;

  • Кластеризация: Группировка воедино схожих объектов, агрегаций или наборов объектов для целей создания системы классификации (таксономии) и её применения, или же для обеспечения возможности совместного просмотра и обработки похожих элементов/агрегаций.

(Окончание следует, см. http://rusrim.blogspot.com/2024/11/2_0767219132.html )

Джеймс Лепен (James Lappin)

Источник: блог «Thinking Records» (Думая о документах)
https://thinkingrecords.co.uk/2024/10/24/using-ai-for-records-management-purposes-seven-key-choices/

Комментариев нет:

Отправить комментарий