воскресенье, 1 февраля 2026 г.

ИСО и МЭК: Выходит на завершающий этап работа над техническим отчётом ISO/IEC DTR 42106 «Обзор дифференцированного сравнительного анализа характеристик качества систем ИИ»

В начале января 2026 года сайт Международной организации по стандартизации (ИСО) сообщил о переходе на заключительный этап работы над новым техническим отчётом ISO/IEC DTR 42106 «Информационные технологии – Искусственный интеллект (ИИ) – Обзор дифференцированного сравнительного анализа характеристик качества систем ИИ» (Information technology - Artificial intelligence (AI) - Overview of differentiated benchmarking of AI system quality characteristics) объёмом 27 страниц, см. https://www.iso.org/standard/86903.html .

Над документом работает подкомитет SC42 «Искусственный интеллект» (Artificial intelligence), входящий в состав Объединенного технического комитета JTC1 «Информационные технологии» Международной организации по стандартизации (ИСО) и Международной электротехнической комиссии (МЭК).

Во вводной части документа отмечается

«В настоящем документе представлен обзор концептуальных рамок для ранжированного сравнительного анализа (graded benchmarking) показателей качества систем искусственного интеллекта. 

Его задача заключается в том, чтобы изучить возможность использования различных методов ранжированного сравнительного анализа (бенчмаркинга) показателей качества с учётом сложности и контекста использования системы ИИ.»

Содержание документа следующее:

Предисловие
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обзор соответствующих методов сравнительного анализа (бенчмаркинга)
5. Сравнительный анализ систем ИИ
6. Подходы к дифференцированному сравнительному анализу (бенчмаркингу)
7. Анализ осуществимости
Приложение A (справочное): Определения сравнительного анализа (бенчмаркинга)
Приложение B (справочное): Примеры уровней спецификации
Приложение C (справочное): Описание показателей
Библиография

Источник: сайт ИСО
https://www.iso.org/standard/86903.html 

суббота, 31 января 2026 г.

Южная Корея: Вступил в силу национальный закон об искусственном интеллекте

Данный пост израильского специалиста Луизы Жаровски (Luiza Jarovsky – на фото) был опубликован 22 января 2026 года в социальной сети LinkedIn.

Мой комментарий: Закон № 20676 «Основной закон о развитии искусственного интеллекта и создании фундамента для доверия» (인공지능 발전과 신뢰 기반 조성 등에 관한 기본법, см. https://tinyurl.com/ycyebv7u ) был принят 21 января 2025 года и вступил в силу 22 января 2026 года.

Южная Корея, таким образом, стала второй страной после Европейского Союза, создавшей всестороннюю законодательно-нормативную базу в сфере искусственного интеллекта, Страна сейчас позиционирует себя как мирового лидера в области надёжного и инновационного искусственного интеллекта.

Закон Южной Кореи об искусственном интеллекте сегодня вступил в силу (даже раньше, чем Закона Евросоюза об искусственном интеллекте!). 

Основные положения закона и его схожие черты с Законом Евросоюза об искусственном интеллекте следующие:

  • Он определяет такие понятия, как ИИ, ИИ высокого воздействия, генеративный ИИ, этика ИИ и деловой оператор ИИ.

  • Деловые операторы ИИ, предоставляющие продукты или услуги, в которых используется ИИ высокого воздействия или генеративный ИИ, должны заранее уведомить об этом пользователей.

  • При предоставлении генеративного ИИ или использующих его продуктов или услуг, деловые операторы обязаны указывать, что результаты были получены с помощью генеративного ИИ.

  • Если виртуальные результаты, созданные системой искусственного интеллекта, сложно отличить от реальности, операторы должны четко уведомлять пользователей или указывать им на этот факт.

  • Деловые операторы ИИ должны реализовать такие вещи, как выявление, оценка и смягчение рисков, чтобы обеспечить безопасное использование систем ИИ в случаях, когда совокупные вычислительные ресурсы, используемые для обучения, превышают порог, установленный указом Президента страны.

  • Деловые операторы искусственного интеллекта должны реализовать меры для обеспечения безопасности и надежности при предоставлении ИИ высокого воздействия или продуктов или услуг, использующих такие системы ИИ.

  • Если министр науки и ИКТ обнаружит или заподозрит нарушение закона, он может потребовать от делового оператора ИИ представления соответствующих материалов или возможности государственным должностным лицам провести необходимое расследование.

  • Если нарушение подтвердится, государственные должностные лица могут предписать выполнение соответствующих мер для прекращения или исправления нарушения.

Среди основных схожих черт с Законом Евросоюза об искусственном интеллекте я бы выделила:

  • Риск-ориентированный подход (но с более строгими обязательствами в отношении систем ИИ высокого риска и/или высокого уровня воздействия);

  • Фокусирование внимания на рекомендациях по этике, доверенном ИИ и на защите основных прав граждан;

  • Обязательства в плане обеспечения прозрачности (например, в контексте высокотехнологических фальшивок (дипфейков) и антропоморфизма, аналогично статье 50 Закона Евросоюза об искусственном интеллекте, но не столь подробно, как это сделано в недавно предложенном китайском закон об антропоморфизме искусственного интеллекта);

  • Центральная роль стандартизации;

  • Создание надзорных органов и процедур контроля и надзора.

Луиза Жаровски (Luiza Jarovsky)

Источник: сайт LinkedIn / сайт Управления международной торговли (International Trade Administration, входит в состав Министерства торговли США)
https://www.linkedin.com/posts/luizajarovsky_breaking-south-koreas-ai-law-became-activity-7420067887706628096-89-9 
https://www.trade.gov/market-intelligence/south-korea-artificial-intelligence-ai-basic-act 

ИСО и МЭК: Выходит на завершающий этап работа над техническим отчётом ISO/IEC DTR 5259-6 «ИИ - Качество данных для аналитики и машинного обучения - Часть 6: Концепция использования визуализации в интересах обеспечения качества данных»

В начале января 2026 года сайт Международной организации по стандартизации (ИСО) сообщил о переходе на заключительный этап работы над новым техническим отчётом ISO/IEC DTR 5259-6 «Искусственный интеллект - Качество данных для аналитики и машинного обучения - Часть 6: Концепция использования визуализации в интересах обеспечения качества данных» (Artificial intelligence — Data quality for analytics and machine learning (ML) - Part 6: Visualization framework for data quality) объёмом 29 страниц, см. https://www.iso.org/standard/86532.html .

Над документом работает подкомитет SC42 «Искусственный интеллект» (Artificial intelligence), входящий в состав Объединенного технического комитета JTC1 «Информационные технологии» Международной организации по стандартизации (ИСО) и Международной электротехнической комиссии (МЭК).

Во вводной части документа отмечается:

«Визуализация может использоваться для поддержки управления качеством данных посредством отображения в наглядной и содержательной форме показателей качества данных, генерируемых с помощью измерительной функции, для их оценки заинтересованными сторонами.

Визуализация может использоваться в любом процессе управления качеством данных в рамках жизненного цикла управления качеством данных как часть процесса разработки и создания системы ИИ.

Например, визуализация может быть полезна в качестве компонента подготовки отчётности о качестве данных для целей документирования процесса управления качеством данных. Она также может стимулировать когнитивные реакции заинтересованных сторон в ходе поискового анализа данных, что может привести к получению дополнительных идей и знаний (например, к выявлению пропущенных данных, выбросов, аномалий, отклонений, ошибок, к проведению сопоставлений и установлению потенциальных взаимосвязей между наблюдениями). С другой стороны, визуализация также имеет свои недостатки, связанные с когнитивными предвзятостями, такими как парейдолия (способность видеть узнаваемые образы или осмысленные структуры там, где их нет либо где наличие не предполагалось – Н.Х.) и апофения (ощущение или вера в существование связи между невзаимосвязанными событиями – Н.Х.).

Визуализация также может помочь при объяснении заинтересованным сторонам того, как построенное на основе данных приложение делает свои прогнозы, обеспечивая тем самым определённую прозрачность в выборе входных данных для алгоритмов машинного обучения. Это может способствовать повышению доверия к системе ИИ заинтересованных сторон, использующих эту систему и имеющих различные ожидания.

… В настоящем документе описывается концептуальная структура визуализации качества данных в аналитике и машинном обучении. Его цель заключается в том, чтобы дать возможность использующим методы визуализации заинтересованным сторонам оценивать результаты измерений качества данных. Эта концептуальная структура визуализации поддерживает достижение целей в плане обеспечения качества данных.»

Содержание документа следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обозначения и сокращения
5. Управление качеством данных
6. Концепция использования визуализации для обеспечения качества данных
7. Визуализация данных
Приложение A: Точки зрения заинтересованных в ИИ сторон 
Приложение B: Свойства набора данных
Библиография

Источник: сайт ИСО
https://www.iso.org/standard/86532.html 

пятница, 30 января 2026 г.

Мастер-экземпляры и другие термины

Данная заметка известного румынского архивиста Богдана-Флорина Поповичи (Bogdan-Florin Popovici, на фото) была опубликована 13 декабря 2025 года на его блоге «Bogdan's Archival Blog - Blog de arhivist».

Сегодня мне пришлось провести определённую систематизацию терминов, поскольку мне приходится слышать самые разные слова. Я уже знал о «мастер-файлах», но не был в курсе того, для чего Национальные Архивы Великобритании (TNA) используют термин «экземпляр ответственного хранителя» (custodial copy) или что такое «порождённый мастер-файл» (production master file). Ниже я расскажу о том, что я для себя выяснил.

Примечание автора: Глубоко травмированным их собственной историей бедолагам-американцам больше не разрешается использовать термин «мастер» ввиду его неполиткорректности. Поскольку я не думаю, что у нас в Румынии этот термин несёт какой-либо негативный оттенок (пока что; кто знает, может быть нам его ещё навяжут…), я продолжаю использовать термин «мастер-экземпляр», как в эпоху микроплёнок. Однако ввиду лингвистических соображений мы могли бы также перевести его как «основной экземпляр».

Экземпляр ответственного хранителя (custodial copy)

Национальные Архивы Великобритании под «экземпляром ответственного хранителя» (как вариант, этот термин можно было бы перевести на русский язык как «эталонный экземпляр» или «страховой экземпляр» - Н.Х.) понимается имеющий статус «официального» экземпляр электронного документа, для которой существуют требования в отношении сроков хранения. Если говорить более детально, то понятие «экземпляра ответственного хранителя» охватывает не только файл, в котором сохраняется контент (архивный мастер-экземпляр), но и иную информацию, которая характеризует его и/или описывает соответствующий контекст (метаданные, параданные и т. д.). Таким образом, речь идёт не просто о документе, а об информационном пакете, включающий как документ, так прочую информацию. Как правило, архивный мастер-экземпляр (архивный мастер-файл) входит в состав «экземпляра ответственного хранителя», но бывают ситуации, когда этот файл может быть более высокого качества. «Экземпляр ответственного хранителя» является эквивалентом архивного информационного AIP-пакета в терминологии открытой архивной информационной системы (OAIS); и это скорее юридическое понятие.

Мой комментарий: В российской нормативной базе аналогом понятиям «сдаточный информационный пакет» и «архивный информационный пакет» в терминологии OAIS является понятия «контейнер электронного документа» и «электронный архивный документ».

В стендовом докладе сотрудника Национальных Архивов Великобритании Стива Дейли (Steve Daly) на конференции iPRES 2024 на тему «Отделённый эталонный экземпляр для облачных систем обеспечения долговременной сохранности электронных материалов» (A decoupled Custodial Copy for cloud-based Digital Preservation Systems, см. https://zenodo.org/records/13647420 ), дано следующее объяснение:

«Национальные Архивы Великобритании использует облачный управляемый сервис для хранения активного управляемых экземпляров своих документов, к которым имеется немедленный доступ, а также создали систему «Экземпляр ответственного хранителя» (Custodial Copy system), которая автоматически создаёт копии всех документов в том виде, в котором они поступили в облачную систему немедленно по их поступлении, и отправляет их в отдельное хранилище вне облака. 

Эти электронные документы будут не просто служить резервной копией контента облачной платформы, а будут храниться в стандартизированной форме, не зависящей от конкретного программного продукта, с использованием стандарта «Оксфордская стандартная структура файлов» (Oxford Common File Layout, см. https://ocfl.io/ ), - при этом каждый файл будет сопровождаться актуальной копией всех метаданных, описывающих документ. 

Система «Экземпляр ответственного хранителя» должна стать полностью полным самоописываемым представлением электронного архива, которое может использоваться в качестве источника при будущих миграциях или же для доступа к документам без использования облачной платформы.» 

Далее следует ряд технических терминов.

Архивный мастер-файл = мастер-файл для долговременного хранения 


В контексте американской «Инициативы по разработке руководств по оцифровке для федеральных органов исполнительной власти США» (Federal Agencies Digitization Guidelines Initiative, FADGI) под «архивным мастер-файлом» (archival master file) понимается наилучшая копия, созданная проводящей оцифровку организацией, причём «наилучшей» копией считается та, что соответствует целям конкретного проекта или программы. В некоторых случаях архив может создать несколько архивных мастер-файлов.

Порождённый мастер-файл (production master file) = порождённый основной файл (production primary file) 

В контексте американской «Инициативы по разработке руководств по оцифровке для федеральных органов исполнительной власти США» под этими терминами понимаются файлы, созданные в результате обработки контента одного или нескольких архивных мастер-файлов, в результате чего создаётся новый файл или файлы с уровнями качества, сопоставимым с уровнем качества архивного мастер-файла.

  • Первый тип обработки заключается в сборке единого представления объекта из набора сегментов. (Например, образ большой карты можно получить, объединив набор фрагментарных образов, каждый из которых представляет собой образ части исходного бумажного объекта.)

  • Второй тип обработки, которая может быть применена, заключается во внесении в исходный файл корректировок эстетического или технического характера.

Мастер-файлы любого типа имеют постоянную ценность для проводящей оцифровку организации.

Производный файл (для оказания услуг, доступа, доставки, просмотра или вывода) 

В контексте американской «Инициативы по разработке руководств по оцифровке для федеральных органов исполнительной власти США» производный файл (derivative file) по своей природе - это вторичный элемент, обычно рассматриваемый как временная часть коллекции. При создании производных файлов организации используют архивный мастер-файл или порождённый мастер-файл в качестве источника данных, и создают один или несколько производных файлов, каждый из которых оптимизирован для конкретного варианта использования. В числе типичных вариантов использования (каждый из которых может потребовать различной оптимизации) можно назвать:

  • предоставление доступа конечным пользователям,

  • высококачественная репродукция,

  • создание текстовых представлений с помощью средств распознавания текста или речи.

Во многих случаях производные файлы, предназначенные для доступа конечных пользователей, создаются с применением сжатие с потерями - например, изображения переводятся в формат JPEG, звукозаписи - в формате MP3 или в видеопотоки в формате сжатом формате AVI. Форматы, выбранные для производных файлов, могут устареть за относительно короткий период времени.

Ссылки:

  • Веб-страница руководств, разработанных в рамках американской «Инициативы по разработке руководств по оцифровке для федеральных органов исполнительной власти США», см. https://www.digitizationguidelines.gov/ 

  • Беседа с Джоном Шериданом (John Sheridan, Национальные Архивы Великобритании)

  • Чат с ChatGPT.

Богдан-Флорин Поповичи (Bogdan-Florin Popovici)

Источник: блог Богдана-Флорина Поповичи
https://bogdanpopovici2008.wordpress.com/2025/12/13/mastere-si-copii/