пятница, 3 ноября 2023 г.

Порождающий ИИ, третье поколение документных систем и выход за рамки роли «Цыплёнка Цыпы»

Данный пост австралийского специалиста в области управления документами и информацией Карла Мелроуза (Karl Melrose – на фото) был опубликован 23 сентября 2023 года на его блоге Meta-IRM (Мета-управление информацией и документами).

У меня есть рабочая модель, которую я собираюсь через пару недель представить на конференции Ассоциации специалистов Австралазии по управлению документами и информацией (Records and Information Management Professionals Australasia, RIMPA). По сути, она говорит о том, что мы сейчас наблюдаем появление третьего поколения документных систем.

  • Первым поколением были просто каталоги.

  • Второе поколение представляло собой каталог, взаимосвязанный с хранилищем. Такие системы предоставляли возможности, проистекающие из тесной взаимосвязи каталога и хранилища.

  • Третье поколение - это каталог, взаимосвязанный с классификатором (такова моя рабочая гипотеза).

Я полагаю, что третье поколение документных систем поможет нам лучше, чем когда-либо прежде, узнать наши документы. По сути, оно решает внутреннюю проблему знаний - как нам узнать, что содержится в наших документах, не заставляя при этом сотрудников прочитать каждый из них, имея при этом в виду специфические документные цели.

Такие системы помогают нам обращать внимание на важные вещи, говоря нам о том, что важно, а что нет - чтобы нам [специалистам по управлению документами – Н.Х.] не приходилось тратить время на то, чтобы заставлять сотрудников проводить такое разделение (что мы, собственно, делаем при использовании систем второго поколения).

Проблема в том, что в каждом примере, который я видел, от нас по-прежнему требуется сказать системам, на что важно обратить внимание – и на самом деле это не проблема, на самом деле это я смотрю на те ограничения, которые устраняет третье поколение, и думаю о том, где одно ограничение переходит в другое.

Мы различными способами говорим системам о том, что важно - но будь то машинное обучение на основе существующих данных, или какая-то форма обработки естественного языка / онтологического кодирования, мы всё равно говорим: «подобные вещи важны по такой-то причине».

Имеет определённый смысл то, что следующее поколение этой технологии (возможно, четвёртое; а может быть, поколение 3,5) не просто позволит нам сказать «обращайте внимание на подобные вещи», но и само скажет нам: «это вещи, на которые вам следует обратить внимание» - и, учитывая возможности порождающего ИИ, вполне логично, что именно он заполнит этот пробел.

На данный момент это правильная технология, поскольку простая истина заключается в том, что проблема сред данных всё большего и большего объёма – это явно не вопрос организации хранения этих данных. Речь идёт о том, чтобы осмыслить их, и это уже комбинированная проблема осмысления и управления знаниями.

Мы должны понимать нашу среду данных в контексте нашей среды деловой деятельности – с точки зрения возможностей получения прибыли, а также рисков и законодательно-нормативных требований.

Все это требует специфического опыта и знаний, всё это регулярно изменяется.

Ключевые вопросы – это вопросы о том, насколько быстро мы сможем осмыслить и извлечь знания из текущих данных, из деловой и законодательно-нормативной сред; каковы наши темпы потери и устаревания знаний; и как быстро мы сможем применить на практике то, что мы знаем - перейти от знания рисков к обработке рисков, чтобы не просто быть хорошо подготовленными выполнению роли «Цыплёнка Цыпы» (Chicken Little – этот цыплёнок, который предупреждал об опасностях, но его считали паникёром, и долгое время ему никто не верил, см. https://ru.wikipedia.org/wiki/Цыплёнок_Цыпа  - Н.Х.) - роли, которую, как можно утверждать, специалисты по управлению данными и документами играли в течение многих лет, и при этом на самом деле небо так не обрушилось на землю.

Я думаю, что именно такой благотворный цикл (virtuous cycle) позволит нам сыграть важнейшую роль в контексте порождающего ИИ.

В прошлом люди не могли действовать на основе имевшихся у нас знаний достаточно быстро и эффективно, чтобы изменить ситуацию.

Третье поколение документных систем сокращает разрыв между возникновением риска и реагированием на него до такой степени, что запаздывания почти не остаётся; и снижает стоимость реагирования до уровня, при котором она, вероятно, окажется незначительной для большинства организаций.

Следующая проблема - разобраться во всём, чтобы понимать, на что нам следует реагировать. Очевидная роль порождающего ИИ заключается в том, чтобы подсказать нам, какие имеются риски, на которые нам следует обратить внимание.

Как по-Вашему, имеет ли сказанное смысл? Что Вы об этом думаете?

Карл Мелроуз (Karl Melrose)

Источник: блог Meta-IRM
https://metairm.substack.com/p/generative-ai-the-third-generation

21 комментарий:

  1. Наташа, здравствуйте.
    Регулярно встречаю в Вашем блоге термин "порождающий ИИ". А можно определение этого термина? Яндекс его не знает.
    Google знает - а это и есть предмет обсуждения?
    https://ozero.market/catalog/photo/ee5dc638-f8c6-4c67-8802-96f24fa453c5
    Тем более, что даже термин "Цыпленок Цыпа" определили. ))
    С наилучшими пожеланиями,
    Савин Вячеслав

    ОтветитьУдалить
    Ответы
    1. Гартнер определяет порождающий ИИ так: «Порождающий (генеративный) ИИ может учиться на существующих артефактах для создания (в больших масштабах) новых, реалистичных артефактов, которые отражают характеристики обучающих данных, но не повторяют их.», см. https://www.gartner.com/en/topics/generative-ai

      Из статьи на сайте ZDNET: «Под порождающим (генеративным) ИИ понимают модели или алгоритмам, которые создают совершенно новые выходные результаты, такие как текст, фотографии, видео, код, данные или 3D-модели, исходя из огромных объёмов данных, на которых они обучаются. Модели «генерируют» новый контент, обращаясь к данным, на которых они обучались, и делая новые прогнозы», см. https://www.zdnet.com/article/what-is-generative-ai-and-why-is-it-so-popular-heres-everything-you-need-to-know/

      Удалить
  2. Спасибо за развернутый ответ.
    Так все-таки - генеративный или порождающий?
    Согласитесь, использование одновременно 2-ух терминов, причем в самом начале этого явления - это закладывать мину замедленного действия.
    Даже поиск будет давать разные результаты.
    С наилучшими пожеланиями,
    Савин Вячеслав

    ОтветитьУдалить
  3. Устоявшегося варианта термина пока нет (знаю, что в одном документе правительства РФ упомянут "генеративный ИИ"). Многие используют кальку с английского, а мне вот нравится более "русский" вариант :) С новыми терминами всегда так, у нас нередко используется по 3-4 варианта перевода международных терминов. Вот когда в профессиональном сообществе сложится консенсус (если сложится), - или если термин будет определен в законодательстве, - то будем все использовать один термин :)

    ОтветитьУдалить
  4. А что касается проблем поиска, то их решают "умные" системы (в т.ч. с элементами ИИ), "знающие" синонимы. Например, машина поиска в справочно-правовой системе Консультант+ довольно много синонимов знает. Навязать всем один-единственный вариант терминологии в настоящее время, с моей точки зрения, практически нереально - а, учитывая быстрые перемены в обществе и технологиях, терминология в любом случае быстро меняется, при этом ещё более усиливая неоднозначность ...

    ОтветитьУдалить
  5. Наташа,
    спасибо за развернутое объяснение.
    Особенно в части "навязать всем один-единственный вариант терминологии" и "еще более усиливая неоднозначность" !?
    Тогда о каких "технологиях" мы говорим?
    Впервые увидел определение стандарта как "навязывание"...
    Вы же сами приводите стандарты терминологии, в том числе международные.
    Вы же сами недавно давали ссылку в одном из Телеграмм-каналом на международный справочник терминологии.
    В принципе, Вы ответили: "порождающий" это "генеративный".
    У другого эксперта я вижу термин "креативный ИИ".
    Без проблем - все флаги в гости к нам! ))
    С наилучшими пожеланиями,
    Савин Вячеслав

    ОтветитьУдалить
    Ответы
    1. Стандарт, по идее, должен опираться на широкий консенсус специалистов соответствующей области – тогда он не будет навязыванием. В реальности, однако, всё выглядит иначе – всё чаще как международные, так и национальные стандарты разрабатываются «в узком кругу» с участием 3-5 авторов, точка зрения которых может быть весьма специфической. Качество стандартов в мире в среднем довольно-таки невысокое и продолжает падать. Ввиду этого я каждый стандарт оцениваю индивидуально – среди них попадаются очень хорошие, много средненьких (часто не стоящих тех денег, которые за них просят), а есть и просто никудышные… Так кто будет определять, какой термин "правильный"? Не вижу я сейчас учреждений, которым я бы была готова доверить это! :)

      Удалить
  6. Радует, что стандарт по термину "Цыплёнок Цыпа" не вызывает вопросов. ))

    С наилучшими пожеланиями,
    Савин Вячеслав

    ОтветитьУдалить
  7. Уточню свою позицию:
    ...определять, какой термин "правильный"?

    Я НЕ за "правильность" - я за ЕДИНЫЙ термин для точного понимания о чем речь.
    "Хоть горшком назови - только в печь не сажай".
    Понятно, что:
    Каждый пишет, что он слышит,
    Каждый слышит, как он дышит,
    Как он дышит, так и пишет,
    Не стараясь угодить.
    (С) Б. Окуджава
    Но это же не "технологии"... ))

    ОтветитьУдалить
  8. Недавно я участвовала в работе над переводным терминологическим стандартом, имеющим отношение к ИИ, и проверяла по разным источникам известные варианты перевода терминов и частоту их использования (в общей литературе, в статьях, в законодательстве, в ГОСТах). Очень много существует терминов с сопоставимыми по распространённости вариантами перевода. Разумным решением мне представляется признание «легитимности» хотя бы наиболее распространённых вариантов, поскольку коллегам по профессии вряд ли понравится, если не имеющая официальных полномочий регламентировать национальную терминологию группа разработчиков стандарта попытается сделать «нелегитимными» привычные им варианты терминов… Это, конечно, компромисс – но мне кажется, так лучше, чем устраивать на ровном месте отнимающие массу времени и сильно портящие личные отношения «терминологические войны», тем более, что через несколько лет большинство «двойных» терминов в любом случае умрёт своей смертью, а некоторые термины вообще исчезнут.

    ОтветитьУдалить
  9. Однозначную терминологию пыталась в законодательном порядке установить Франция, ещё с 19-го века. Не получилось.

    ОтветитьУдалить
  10. Наташа,

    Я точно не сторонник "терминологических войн".
    Я практик, причем не оранжерейный - "иду в народ" каждый день.
    И, например, когда внедряю МЧД - то слышу вопросы "а вот есть письмо ФНС по электронным доверенностям" - Письмо ФНС от 18.10.2023 № ЗГ-3-26/13425.
    МЧД и "электронная доверенность" - это одно и то же?
    А если разное - то где об этом узнать?
    Вот и приходится объяснять "простым людям" то, что на уровне терминологии нигде не определено.
    Просто каждый придумывает свой термин, а потом вся страна недоумевает - мы об одном и том же или о разном?

    Спасибо за Вашу работу и открытость к обсуждениям.

    С наилучшими пожеланиями,
    Савин Вячеслав

    ОтветитьУдалить
    Ответы
    1. МЧД - лишь один из возможных видов электронной доверенности. Электронная доверенность также может быть составлена, например, в виде неструктурированного (бумагоподобного) электронного документа.

      Удалить
  11. А эту инициативу Вы уж точно видели ))
    https://xn--n1adei3c.xn--p1ai/information/termins-edo/

    ОтветитьУдалить
  12. IMHO МЧД, как она описана сейчас в законодательстве, по сути обслуживает применение УКЭП физического лица для подписания документов в качестве представителя организации. Доверенности (в т.ч. электронные) к этому не сводятся – они дают лицу право выступать в роли представителя физического лица или организации, что одним подписанием документов УКЭП не ограничивается.

    ОтветитьУдалить
  13. Без захода на дискуссию ))
    Просто для справки:

    Электронная доверенность также может быть составлена, например, в виде неструктурированного (бумагоподобного) электронного документа.

    Нет, ФНС термин "электронная доверенность" использует строго в соответствии со своим Приказом Федеральной налоговой службы от 30.04.2021 № ЕД-7-26/445@ "Об утверждении формата доверенности, подтверждающей полномочия представителя налогоплательщика (плательщика сбора, плательщика страховых взносов, налогового агента) в отношениях, регулируемых законодательством о налогах и сборах, в электронной форме и порядка её направления по телекоммуникационным каналам связи".

    Кстати, показательно - как неопределенность термина порождает (генерирует) разные интерпретации. ))

    ОтветитьУдалить
  14. Об инициативе РОСЭУ: Я о ней слышала. Года через 3 посмотрим, что из неё выйдет :) Начать такие инициативы несложно (и эта далеко не первая), но очень мало тех, кто готов "тянуть лямку" в течение длительного времени, актуализируя терминологию по мере развития законодательства, стандартов, технологий...

    ОтветитьУдалить
  15. Некоторые определения РОСЭУ анекдотические или "каменного века" - например, "документ", "жизненный цикл документа", "гарантия целостности" ... Терминологией все-таки должны заниматься специалисты :)

    ОтветитьУдалить
  16. Я 4 года в РОСЭУ "тянул лямку" стандарта роуминга операторов ЭДО. И первую версию стандарта роуминга для ФНС писал тоже я.
    Так что РОСЭУ может давать реальные продукты...
    Хотя, если честно, насчет этой инициативы "Терминология ЭДО" я пока ... не определился.
    Согласен с Вами - тут нужны монстры, такие как Вы.

    С наилучшими пожеланиями,
    Савин Вячеслав

    ОтветитьУдалить
  17. Перл от РОСЭУ: "Квалифицированная электронная подпись (КЭП) – защищённый вид ЭЦП". Жаль, автор шедевра не указан :)

    ОтветитьУдалить
  18. Наташа,
    не стреляйте в пианиста - он играет как умеет... ))

    С наилучшими пожеланиями,
    Савин Вячеслав

    ОтветитьУдалить