Если бы кто-то сказал мне, что собирается применять искусственный интеллект (ИИ) для управления документами, то, наверное, я бы первым делом открыл рот от изумления, - а затем задал ряд вопросов, чтобы точнее определить место предлагаемого использования ИИ.
Существует ряд типов ИИ, которые можно применять для выполнения различных действий, в отношении разных типов целевого контента, на различных уровнях агрегации, на разных этапах жизненного цикла документов, при различных видах контроля со стороны человека и преследуя различные цели управления документами.
Именно тот выбор, который делается по каждому из этих семи аспектов, и определяет характер применения ИИ.
1. Выбор ИИ-метода / метода обработки данных
Существует огромное разнообразие различных типов искусственного интеллекта (и методов обработки данных в целом), которые можно применять. Возможно, Вам захочется:
- написать собственный набор правил; или
- обучить модель машинного обучения с учителем (контролируемого машинного обучения) с использованием предварительно размеченных данных; или
- запустить модель машинного обучения без учителя (неконтролируемого машинного обучения) непосредственно на Вашем целевом контенте (а затем начать контролировать её и проводить итеративное совершенствование, потому что модель не заработает как надо с первого раза!); или
- использовать подсказки, настроить или дополнить большую языковую модель (large language model, LLM).
В качестве альтернативы (или дополнения) Вы можете пожелать запустить аналитические инструменты для получения основанных на статистических данных знания и представления о Вашем целевом контенте.
Лучше всего думать об этих вариантах использования как о наборе инструментов. Вам может потребоваться применять их в сочетании. Можно начать с одного типа использования и переключиться на другой, если результаты не соответствуют запланированным или если затраты оказываются слишком высоки.
2. Выбор взаимосвязи между контролем со стороны ИИ и контролем со стороны человека
Метод ИИ / обработки данных может:
- обеспечивать поддержку принятия решений посредством подготовки для службы управления документами резюме контента, предлагаемых классификационных категорий (таксономий), выявления конфиденциального контента и т. д.;
- непосредственное выполнять действия на основе контента посредством присваивания ему классификационной категории, установления сроков хранения, присваивания с целью защиты пометок и грифов и т.д. В таких случаях человеческий контроль принимает формы как тестирования ИИ-модели перед развёртыванием, так и постоянного мониторинга модели после развёртывания.
3. Выбор цели применения ИИ
Служба управления документами может использовать ИИ-технологии и методы обработки данных в целом в различных целях, в число которых входят:
- Применение системы классификации (таксономии): Использование ИИ для назначения контенту классификационных категорий. Это может включать использование контролируемого (с учителем) машинного обучения с целью применения существующей системы классификации (таксономии). В качестве альтернативы, может использоваться неконтролируемое (без учителя) машинное обучение для формирования таксономии на основе самого целевого контента, и её последующего применения к этому целевому контенту. Чтобы таксономия была полезна для целей управления документами, она должна быть связана с правилами установления сроков хранения и действий по их истечении (или же должна быть возможность установления такой связи);
- Проведение отбора на уничтожение: Использование ИИ для выявления материалов, не имеющих длительной и постоянной ценности для организации и/или соответствующих заинтересованных сторон;
- Проведение экспертизы ценности и отбора на постоянное архивное хранение: Использование ИИ (обычно государственным органом, по истечении установленного законодательством периода времени) для выявления материалов, имеющих историческую ценность для общества и, следовательно, заслуживающих передачи на постоянное архивное хранение в исторический архив;
- Определение степени секретности / конфиденциальности: Использование ИИ для выявления в материалах секретных и конфиденциальных сведений, требующих установления ограничений доступа и/или применения иных мер защиты.
4. Выбор осуществляемых ИИ действий
Для поддержки названных выше целей существует множество действий, которые могут выполняться искусственным интеллектом. В их число входят:
- Разметка: Назначение классификационной категории (или же непосредственное назначение категории срока хранения) к объекту или их агрегации;
- Резюмирование (реферирование): Подготовка резюме на основе содержания объекта, агрегации или набора агрегаций. Такое резюме может дать возможность службе управления документами быстро проверить предположения о контенте соответствующей агрегации/набора агрегаций. Резюме также могут дать возможность службе управления документами обосновывать и защищать решения, принятые в отношении этой агрегации/набору агрегаций;
- Защита конфиденциальности: Действия по ограничению доступа к агрегациям, объектам или их частям, которые содержат информацию, признанную конфиденциальной или секретной;
- Отбор не имеющих ценности материалов: Выявление сообщений чисто личного характера или относящихся к внерабочему взаимодействию в коллективе, нежелательных сообщений (спама), не переданных кому-либо документов и/или тривиальных по своему содержанию материалов, которые не нужно сохранять в составе определенной агрегации или набора агрегаций;
- Кластеризация: Группировка воедино схожих объектов, агрегаций или наборов объектов для целей создания системы классификации (таксономии) и её применения, или же для обеспечения возможности совместного просмотра и обработки похожих элементов/агрегаций.
(Окончание следует, см. http://rusrim.blogspot.com/2024/11/2_0767219132.html )
Джеймс Лепен (James Lappin)
Источник: блог «Thinking Records» (Думая о документах)
https://thinkingrecords.co.uk/2024/10/24/using-ai-for-records-management-purposes-seven-key-choices/
Комментариев нет:
Отправить комментарий