Данный пост израильского специалиста Луизы Жаровски (Luiza Jarovsky – на фото) был опубликован 24 июля 2025 года в социальной сети LinkedIn.
Европейская комиссия (еврокомиссия) опубликовал типовую форму (шаблон) обязательного резюме о контенте, используемом для обучения моделей ИИ, и это меняет правила игры в вопросе обеспечения прозрачности в сфере ИИ [намёк: компаниям в сфере ИИ давно уже снились кошмары в связи этим]. Типовая форма доступна на странице сайта Еврокомиссии, см. https://digital-strategy.ec.europa.eu/en/library/explanatory-notice-and-template-public-summary-training-content-general-purpose-ai-models
Согласно статье 53 (1) (d) европейского Закона об ИИ (EU AI Act), поставщики универсальных моделей ИИ обязаны: «составить и сделать доступным для общественности достаточно подробное резюме (сводное описание) контента, использованного для обучения универсальной модели ИИ, в соответствии с шаблоном, предоставленным Европейским бюро по ИИ (AI Office)».
Цель этого резюме (которое должно быть общедоступным) - повысить прозрачность и способствовать соблюдению законов об авторском праве, защите персональных данных и других.
Почему это беспокоит компании, занимающимся ИИ?
Большинство компаний, занимающихся разработкой ИИ, не исполняют требования законодательства Евросоюза при обучении своих универсальных моделей ИИ и уходят от ответственности, используя расплывчатые и абстрактные публичные заявления, такие как «мы использовали общедоступные данные», «данные, которые мы использовали, уже имелись» и «так делают все остальные».
Помните лицо Миры Мурати (Mira Murati), когда журналист спросил её о том, какой контент OpenAI использует для обучения решения Sora?
В то время Мурати была техническим директором OpenAI, - но сделала вид, что не знает, какой именно набор данных использовался для обучения, дав самый расплывчатый ответ, какой только смогла придумать (но мы заметили это!).
Почему она так поступила? Потому что знала (и юристы OpenAI это знали), что если бы она дала точны ответ, то на следующий день против OpenAI были бы поданы десятки новых исков о нарушении авторских прав.
Евросоюз хочет изменить эту ситуацию. Вот что разъясняет пункт 107 Преамбулы Закона об ИИ по поводу этого резюме: «.. Это резюме должно быть в целом всесторонним по своему охвату, а не технически подробным, с тем, чтобы облегчить имеющим законные интересы сторонам, включая правообладателей, реализацию и защиту своих прав в соответствии с законодательством Евросоюза - например, путём перечисления основных наборов данных, использованных для обучения модели, таких как крупные частные или публичные базы данных или архивы данных, а также путем предоставления повествовательного объяснения, касающегося других использованных источников данных.».
Это кардинальное изменение в плане степени прозрачности, который будет ожидаться (и требоваться по закону) от компаний, занимающихся разработкой ИИ, и может привести к существенным изменениям в вопросе соблюдения авторских прав и защиты персональных данных (в особенности благодаря тому, что теперь компании не смогут намеренно использовать туманные формулировки, чтобы избежать контроля и надзора над их деятельностью).
Надеемся, что мы увидим в действии «эффект Брюсселя», и другие страны и регионы начнут включать в своё законодательство аналогичные требования к прозрачности обучения систем ИИ.
Напоминаем, что все поставщики универсальных моделей ИИ, подпадающих под действие европейского Закона об ИИ, обязаны исполнять обязательство по представлению резюме об обучающем контенте систем и моделей ИИ, включая модели, предоставляемые по лицензиям с открытым исходным кодом. Данное обязательство вступает в силу 2 августа 2025 года.
Луиза Жаровски (Luiza Jarovsky)
Источник: сайт LinkedIn
https://www.linkedin.com/posts/luizajarovsky_breaking-the-eu-published-the-template-activity-7354158825232375812-2D1b
Подписаться на:
Комментарии к сообщению (Atom)
Комментариев нет:
Отправить комментарий