(Окончание, начало см. http://rusrim.blogspot.com/2024/11/google-gemini-1.html )
Судя по протоколу общения в чате, была проведена живая демонстрация инструмента Vertex AI компании Google, в ходе которой тот выдавал себя за «эксперта-архивиста» - и ему задавались вопросы, связанные с убийством президента Джона Кеннеди (John F. Kennedy). Инструмент Vertex AI позволяет организациям обучать большие языковые LLM-модели на собственных наборах данных, и в данном случае ИИ обучался на данных Национальных Архивов. Были, в частности, заданы вопросы: «Кто убил Кеннеди?» и «Каким образом ЦРУ было вовлечено в убийство Кеннеди?» (см. рис. ниже).
Вопросы, заданные ИИ в связи с убийством президента Кеннеди «Почему генеративный ИИ называет себя «экспертом-архивистов»?» - спросил один из сотрудников. «Он так называет себя, потому что мы дали ему такую подсказку», - ответил кто-то из участников демонстрации.
«Меня серьёзно беспокоит титул «эксперт-архивист», - подчеркнул второй сотрудник.
«Меня тоже. Если у нас хотя бы была оговорка о том, что генеративный ИИ может выдумывать всякое и при этом называть себя экспертом-архивистом того же уровня, что и настоящие эксперты-люди…», - вмешался ещё один коллега.
В какой-то момент один из участников написал в чате: «Задайте ИИ вопрос, что случилось с мозгом Кеннеди» (это на самом деле известная загадка, см.
https://www.theguardian.com/world/shortcuts/2013/oct/21/presidents-brain-missing-mislaid-body-parts ).
Суда по всему, сотрудники Национальных Архивов были серьёзно обеспокоены демонстрацией и презентацией.
В какой-то момент один из сотрудников отметил: «Секретные данные нельзя предоставлять облачному ИИ». Другой его коллега спросил: «Сможем ли мы запретить Gemini доступ к данным на Google-диске и/или к нашей электронной-почте?».
Ещё один сотрудник написал: «Не опасаетесь ли Вы, что данный продукт будет работать со сбоями, подобными тем, что недавно произошли с Google Search AI?» (
имеется в виду нашумевшая история о том, как ИИ-чатбот выдумывал однобокие, явно политизированные ответы на заданные вопросы, не имевшие отношения к действительности – Н.Х.).
Также был задан вопрос: «Каким образом Вы планируете исключить возможность вовлечения Национальных Архивов в проблемы с нарушением авторских прав в результате использования ИИ-модели, обученной на веб-контенте? Такого рода проблемы уже имели место при использовании чатбота ChatGPT, обученного на пиратских копиях книг».
Слайд, рекламирующий гибкость Google Gemini и предлагающий рассматривать его как коллегу по работе На вопрос: «Видим ли мы демо-версию продукта, готовящегося к развертыванию для сотрудников NARA?» был дан ответ: «Мы сейчас проводим пилотный проект внедрения этой технологии, чтобы определить, следует ли Национальным Архивам как учреждению начать его широкое развёртывание».
«ИИ-чатбот призван сгенерировать нечто, что выглядит как ответ – и есть множество случаев, когда он с авторитетным тоном выдаёт нечто такое, что совершенно неверно», - подчеркнул один их участников. «В какой степени от нас потребуют полагаться на него в будущем?».
Три архивиста выразили обеспокоенность по поводу экологических аспектов и углеродного следа генеративного (порождающего) ИИ.
В электронном письме, которое мне было предоставлено в начале этого года, Национальные Архивы сообщили своим сотрудникам о том, что предпочитают решения Google Gemini и Microsoft Copilot вместо ChatGPT, потому что те обеспечивают «более контролируемую среду».
Представитель Национальных Архивов по связям с общественностью сообщил нашему изданию, что у архивного ведомства имеются большие планы относительно ИИ, в том числе запуск ИИ-чатбота для общественности под названием «Арчи» (Archie).
«Мы изучаем, каким образом ИИ может помочь нам повысить доступность наших фондов, хранящихся по всей стране. В настоящее время мы выполняем несколько пилотных проектов внедрения ИИ, направленных на улучшение наших услуг для общественности, одновременно укрепляя общественное доверие и уверенность», - сообщил он. «В конечном итоге мы хотим, чтобы пользователи могли легко отыскивать нужные им документы в нашей огромной по объёмам сокровищнице федеральных документов постоянного срока хранения. Независимо от того, являетесь ли вы ветераном вооружённых сил, семейным историком, преподавателем, исследователем или студентом, наша цель - как можно более беспрепятственно соединить Вас с документами».
Национальные Архивы планирует проинформировать пользователей о том, что, по сути дела, «Арчи» может предоставлять людям неверную информацию.
«Наш инструмент «Archie AI» будет напрямую говорить о вопросах точности и раскрытия информации», - сказал представитель Национальных Архивов. В правовой оговорке будет сказано: «
Точность: Сгенерированные ИИ сводки и результаты могут не отражать мнение Национальных Архивов, и их точность не гарантируется. Исторические документы часто содержат фактические ошибки или оскорбительный язык, который Archie AI может повторять или использовать».
Мой комментарий: Мне крайне интересно, в какой мере федеральные органы США будут доверять сгенерированным ИИ справкам, на основе которых будут назначаться пенсии и льготы :)
Администрация президента Байдена ранее поручила федеральным органам исполнительной власти изучить возможности ИИ и разработать политику его применения. Также Национальные Архивы США недавно провели презентацию об ИИ для Международного совета архивов.
В этой презентации (полуторачасовая видеозапись которой доступна по адресу
https://www.youtube.com/watch?v=ZXTe7oLK-mc ), директор Национальных Архивов по цифровым партнерствам и связям с общественностью Кэрол Лагундо (Carol Lagundo) представила чатбот «Арчи» и также объяснила, что Национальные Архивы использовали ИИ для «улучшения доступа к пенсионным файлам времен Войны за независимость», которые представляют собой массив из более чем 2,5 миллионов страниц рукописных документов 18-го и 19-го веков о солдатах времен Войны за независимость (Revolutionary War).
«При нынешних темпах полностью транскрибировать эту серию документов одними только людьми удастся лишь к 2046 году!», - отмечается в презентации Лагундо. Она сообщила, что точность транскрибирования набора данных ИИ-инструментом составила 90%, и что Национальные Архивы намерены сделать данные расшифровки доступными для общественности через свой официальный «Онлайн-каталог Национальных Архивов» в ноябре или декабре 2024 года.
Основные характеристики «Archie AI» - основан на решении Google Vertex, обрабатывает запросы на естественном языке. В настоящее время это пилотный проект, обученный на небольшом наборе данных Лагундо добавила, что Национальные Архивы разрабатывает «прототип ИИ-помощника исследователя» на базе Google Vertex под названием «Archie AI».
«Вы сможете задать «Арчи» вопросы и получить сгенерированные ИИ резюме со сносками и ссылками на оцифрованные документы в нашем каталоге», - рассказала она. «Мы надеемся запустить его через несколько месяцев».
«Как Вы можете видеть, «Archie AI» является краеугольным камнем нашего изучения возможностей И», - так сказал представитель Национальных Архивов в интервью нашему изданию.
Джейсон Коблер (Jason Koebler)Источник: сайт «404 Media»
https://www.404media.co/ai-mazing-tech-venture-national-archives-pushes-google-gemini-ai-on-employees/