Поскольку организации сейчас внедряют искусственный интеллект (ИИ) в свою оперативную деятельность, специалистам по управлению документами необходимо понимать воздействие ИИ на управление информацией. Генеративный (порождающий) ИИ особенно преобразует эту область, расширяя возможности для классификации, поиск и реферирование. В данной статье представлены пять ключевых идей о том, как применение ИИ в сфере управления информацией преобразует управление документами. Статья предлагает важную информацию для профессионалов, стремящихся эффективно использовать эти достижения, одновременно решая потенциальные проблемы.
1. Порождающий (генеративный) ИИ: Текущий центр внимания при использовании ИИ в управлении информацией
Искусственный интеллект (ИИ) - это большая предметная область с глубокой историей, однако в настоящее время всё внимание сосредоточено на технологиях порождающего (генеративного) ИИ, который представляет собой модели машинного обучения, обученные на чрезвычайно больших массивах текста, изображений, аудио и видеоматериалов. Например, такие решения как DALL-E 2 и ChatGPT, базируются на модели GPT-3 компании OpenAI. Инструменты генеративного ИИ могут быть ориентированы на выполнение определённых задач, таких как генерация текста или изображений, или же могут быть мультимодальными, способными как потреблять, так и порождать как текстовой, так и аудиовизуальный контент.
Инструменты генеративного ИИ предназначены не только для создания реалистичных изображений или убедительных диалогов. Они используются в разнообразных приложениях, включая перевод, реферирование, формирование субтитров, классификацию, извлечение информации, распознавание изображений, транскрибирование, анализ и формирование идей.
При оценке инструментов генеративного ИИ необходимо учитывать следующие основные факторы:
- Используемые ими базовые модели: В основе подобных инструментов лежат модели, которые были предварительно обучены на больших массивах контента – например, захваченного в интернете. Этот контент может быть источником рисков, таких как вредные предубеждения, неточности (известные моделям факты могут устареть) и проблемы с правами интеллектуальной собственности. Базовые модели могут быть различного масштаба (измеряемого миллионами или миллиардами параметров). Модели большего масштаба обычно выдают более качественные результаты, но их использование является более затратным.
- Способность к тонкой настройке: После предварительного обучения базовой модели часто проводится дальнейшее обучение с использованием меньших по объёму, но более качественных массивов данных. Эта тонкая настройка позволяет настроить инструмент для выполнения определённой задачи (например, выполнения роли чат-бота) и устранить проблемы (например, учесть наличие необъективности и предубеждений). Поскольку обучающие наборы для тонкой настройки намного меньше по объёму, этот процесс можно повторять часто. Некоторые сервисы позволяют клиентам использовать для тонкой настройки их собственные данные.
- Объём даваемых пользователем подсказок (указаний): «Контекстное окно» (context window) - это объём входных данных, с которыми может работать система, измеряемый в «токенах» (token). Размер контекстных окон обычно измеряются тысячами токенов, но некоторые новые сервисы могут принимать миллионы токенов, что эквивалентно нескольким книгам или нескольким часам видеозаписей. Более крупные контекстные окна позволяют настраивать получаемые ответы, загружая в рамках запроса соответствующие справочные/исходные материалы вместе с подсказками.
- Возможность интеграции: Некоторые инструменты поддерживают варианты интеграции, которые придают им новые возможности - например, возможность функционировать в качестве агентов (например, отправляя электронные письма или устанавливая напоминания в календаре) или выполнять такие действия, как поиск в Интернете, с целью повышения качества выдаваемых результатов. «Генерация, дополненная исследованиями» (research augmented generation) даёт конечным пользователям возможность заполнять базы данных собственным контентом, к которому затем выполняются запросы с помощью моделей.
2. Достижения в области порождающего (генеративного) ИИ и их влияние на управление информацией
Большой дебют генеративного ИИ состоялся в 2022 году, когда были запущены два революционных инструмента компании ( https://openai.com/ ): сервис преобразования текста в изображение DALL-E 2 и чат-бот ChatGPT на основе большой языковой модели. Впоследствии был выпущен целый поток новых инструментов и сервисов, включая Copilot (Microsoft, https://copilot.microsoft.com/ ), Gemini (Google, https://gemini.google.com/ ), Llama (Meta, https://llama.meta.com/ ), Mistral ( https://mistral.ai/ ) и Claude (Anthropic, https://www.anthropic.com/claude ).
Изображение на основе подсказки «специалист по управлению документами работает за своим ноутбуком, размышляя о будущем ИИ в управлении информацией» создано с помощью ИИ (Microsoft Copilot) 30 июля 2024 года
Примечательно, что пока что не наблюдается никаких признаков замедления темпов прогресса. Специалисты компании OpenAI в 2020 году написали статью ( https://openai.com/index/scaling-laws-for-neural-language-models/ ), в которой отметили, что «интеллект» больших языковых моделей предсказуемо масштабируется вместе с размером моделей, объёмам используемых для обучения моделей наборов данных и объемами вычислений. Это правило актуально и сегодня, и это означает, что нам не нужно ждать новых технических прорывов, чтобы увидеть дальнейшие достижения -достаточно просто увеличить размер моделей и объёмы используемых данных.
(Окончание следует, см. http://rusrim.blogspot.com/2024/08/2_0829789621.html )
Ричард Лехейн (Richard Lehane)
Источник: блоге австралийской компании Recordkeeping Innovation
https://records.com.au/five-key-insights-on-ai-in-information-management-for-records-managers/
Комментариев нет:
Отправить комментарий