(Окончание, начало см. http://rusrim.blogspot.com/2024/11/1_0621672935.html )
5. Выбор уровня агрегирования, на котором предполагается действовать
Документы состоят из объектов (файлов с контентом, сообщений, записей данных, изображений, видеозаписей и т.д.). Объекты существуют в рамках агрегаций (общих дисков/папок, сайтов/библиотек SharePoint, учётных записей электронной почты, наборов данных и т.д.).
Ключевым для любого применения ИИ в целях управления документами является решение о том, на каком уровне агрегирования следует принимать решение / выполнять действие.
Если ИИ используется для применения системы классификации (таксономии), то есть возможность применять эту систему классификации (таксономию):
- к отдельным объектам: классификационная категория назначается каждому файлу, сообщению и т.д.; или
- к агрегациям: классификационная категория назначается каждому сайту SharePoint / каждой учетной записи электронной почты / каждому общему диску (или каждой папке высокого уровня, либо вообще каждой папке).
В случае, если выполняются действия по уничтожению / передаче материалов после проведения экспертизы ценности, то возможны:
- Уничтожение / передача целых агрегаций: например, удаление целиком сайта SharePoint / всей учётной записи электронной почты / всего контента на общем диске / всего контента папки; или
- Уничтожение / передача отдельных объектов: например, уничтожение отдельных файлов, сообщений и т. д. (таким образом, что такое уничтожение не затрагивает остальной контент в той агрегации, частью которой эти объекты являются).
Если по итогам экспертизы ценности проводится отбор на архивное хранение, то возможны:
- Отбор на постоянное хранение целые агрегаций: например, отбираются целиком сайты SharePoint, весь контент учетных записей электронной почты (за исключением контента, не имеющего отношения к деловой деятельности), весь контент общих дисков или папок; или
- Отбор на постоянное хранение отдельных объектов: например, отбираются определённые отдельные файлы, сообщения и т.д. (таким образом, что такой отбор не затрагивает остальной контент в той агрегации, частью которой эти объекты являются).
6. Выбор стадии жизненного цикла документов
Ещё один ключевой выбор – принятие решения о том, планируется ли применять ИИ в отношении:
- активного контента в действующих системах (например, в отношении контента, хранящегося в действующих сайтах MS Teams/SharePoint, контента функционирующих учётных записей электронной почты и т.д.); или
- неактивного контента в действующих системах (например, контента закрытых/умирающих сайтов Teams/SharePoint, учётным записей электронной почты уволившихся сотрудников и т.д.); или
- неактивного контента в устаревших (унаследованных) системах (например, контента, созданного в устаревших системах и не перенесённого в действующие системы, включая контент унаследованных общих дисков, устаревших локальных реализаций SharePoint, устаревших систем управления электронными документами и контентом, устаревших систем электронной почты).
Применение ИИ к активному контенту в действующих системах сопряжено с совершенно иными проблемами, чем применение ИИ к контенту устаревших систем.
В случае применения ИИ к активному контенту в действующих системах, преимуществом является то, что суждения ИИ-модели могут быть показаны конечным пользователям, которые создали или получили этот контент. Таким конечным пользователям может быть предоставлена возможность оспорить или подтвердить суждения модели.
Большинство реально используемых сред, однако, основано на облаке, и они являются «вечнозелеными» - для них характерны частые и быстрые обновления, осуществляемые поставщиком облачных услуг. Организации-арендатору облачных услуг, чтобы развернуть ИИ-инструмент, работающий с облачным пакетом программ, таким как Microsoft 365, и чтобы сделать генерируемые ИИ суждения видимыми в интерфейсе конечного пользователя, - потребуется некоторая форма интеграции с этим пакетом программ. Подобная интеграция может привести к конфликту с будущими обновлениями пакета. Эта проблема интеграции не возникнет, если использовать возможности ИИ, предоставляемые самим пакетом программ, но тогда организация будет ограничена теми возможностями ИИ, которые предоставляются поставщиком облачных услуг в рамках этого пакета/продукта.
При работе с контентом в устаревших системах рядом может не быть конечных пользователей, которые могли бы подтвердить или исправить суждение ИИ-модели. Однако этот недостаток работы в устаревших системах компенсируется тем, что есть возможность перемещать или копировать целевой контент в среду по своему выбору, а также применять инструменты ИИ и методы обработки данных по своему выбору.
7. Выбор целевого контента
Как правило, большинство организаций накапливает большую часть своего неструктурированного контента в типичных системах и инструментах для связи и хранения документов и контента. На рынке таких инструментов в течение последних двадцати лет доминировала компания Microsoft.
В эпоху использования установленных локально программных систем доминировала среда Microsoft Windows. Наиболее распространенным решением хранения документов и контента были сетевые общие диски. В последние годы этой эпохи сайты SharePoint стали альтернативой сетевым общим дискам. Наиболее распространенной средой хранения сообщений в эпоху локальных вычислений были учетные записи электронной почты Microsoft Exchange.
В облачную эпоху компания Microsoft сохранила свое доминирование в области управления типичным деловым контентом и документами, поддержки коллективной работы и обмена информацией. Облачный пакет программ Microsoft 365 построен на основе онлайн-версий SharePoint и Exchange. Первым крупным облачным приложением, появившимся в облачном пакете Microsoft 365, было решение Microsoft Teams, но у Teams нет собственного хранилища - он использует для этой цели хранилища SharePoint и Exchange:
- Microsoft Teams использует сайты SharePoint и OneDrive для хранения любого размещенного в нём, загруженного в него или отправленного через него контента (сайты OneDrive используют хранилище SharePoint);
- Microsoft Teams использует учетные записи электронной почты Exchange для хранения сделанных через него почтовых сообщений или мгновенных сообщений.
Относительная однородность поставщика и среды означает, что большая часть контента, с которым большинству организаций, вероятно, придётся работать, будет представлена в виде контента:
- сетевых общих дисков (файлообменников) - они могут быть непрезентабельным пережитком эпохи локальных решений, но с ними всё равно придётся иметь дело;
- сайтов SharePoint - включая сайты из локальных реализаций SharePoint, сайты в реализациях Microsoft 365 SharePoint, сайты, созданные для сопровождения Microsoft Teams, и сайты OneDrive. Кроме того, многие организации перенесли / мигрировали контент некоторых или всех своих устаревших систем управления документами и контентом эпохи локальных решений, включая контент специализированных систем управления электронными документами, на сайты SharePoint;
- учётных записей электронной почты - включая учётные записи электронной почты локальных систем и учётные записи электронной почты в облачных пакетах программ. Учетные записи электронной почты в Microsoft Exchange в Microsoft 365 также включают в себя, в качестве невидимого для конечного пользователя элемента, сообщения чата Teams, которыми обменивается этот пользователь.
Если удастся найти подходы, позволяющие применять методы обработки данных для управления во времени контентом сетевых общих дисков, сайтов SharePoint и учётных записей электронной почты, - то огромные цифровые помойки, имеющиеся во многих организация, станут управляемыми.
Типология вариантов использования ИИ для целей управления документами
Самое интересное заключается в том, что каждый раз, когда делается выбор, нет правильного или неправильного ответа. Перечисленные варианты существуют, потому что не существует идеального ИИ, нет и идеального способа применения ИИ, - а также потому что совершенство в управлении недостижимо (даже при использовании ИИ). Приходится идти на компромиссы, которыми нужно управлять, и у каждого из вариантов имеются свои преимущества и недостатки.
Систематическое перечисление этих вариантов выбора позволяет сопоставить любое существующее или предлагаемое внедрение ИИ, с которым Вы сталкиваетесь (или о котором думаете), со всем «созвездием» вариантов применения, возможных для служб управления документами.
Джеймс Лепен (James Lappin)
Источник: блог «Thinking Records» (Думая о документах)
https://thinkingrecords.co.uk/2024/10/24/using-ai-for-records-management-purposes-seven-key-choices/