четверг, 19 декабря 2024 г.

ИСО и МЭК: Опубликован стандарт ISO/IEC 5259-2:2024 «ИИ - Качество данных для аналитики и машинного обучения – Часть 2: Показатели качества данных»

В конце ноября 2024 года сайт Международной организации по стандартизации (ИСО) сообщил о публикации нового стандарта ISO/IEC 5259-2:2024 «Искусственный интеллект - Качество данных для аналитики и машинного обучения – Часть 2: Показатели качества данных» (Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 2: Data quality measures) объёмом 46 страниц, см. https://www.iso.org/standard/81860.html и https://www.iso.org/obp/ui/en/#!iso:std:81860:en .

Стандарт подготовлен техническим подкомитетом ISO/IEC JTC1/SC42 «Искусственный интеллект». О работе над ним я уже писала здесь: http://rusrim.blogspot.com/2023/08/isoiec-5259-1.html

Практически одновременно с публикацией ИСО и МЭК данный стандарт адаптирован в России как ГОСТ Р 71484.2-2024 «Искусственный интеллект. Качество данных для аналитики и машинного обучения. Часть 2. Показатели качества данных», см. https://www.gost.ru/...

Во вводной части стандарта отмечается:

«При принятии решений на основе данных возникают новые проблемы в управлении качеством данных в области аналитики данных и искусственного интеллекта (ИИ) на основе машинного обучения (МО).

Такие недостатки качества данных, как наличие неполных, ложных или устаревших данных, могут негативно повлиять на процессы и результаты аналитики и машинного обучения.

Данные из различных источников, включая структурированные данные (например, реляционные базы данных) и неструктурированные данные (например, документы, изображения, аудиозаписи), могут быть напрямую использованы в жизненном цикле данных для аналитики и разработки моделей машинного обучения. На каждой стадии жизненного цикла данных аналитики и машинного обучения данные преобразуются.

Чтобы аналитика данных и модели машинного обучения были безопасными, надёжными и интероперабельными, необходим целостный стандартизированный подход к контролю и управлению, производству и доставке достаточно высококачественных данных. Для разработки заслуживающего доверия управления качеством данных для аналитики и машинного обучения можно быть использованы международные стандарты внутренне присущего качества данных, включающие концепции и варианты использования, характеристики и измерения, требования к управлению и концептуальную структуру процессов.

Настоящий документ является частью серии стандартов ISO/IEC 5259. Он основан на серии стандартов ISO 8000 и на стандартах ISO/IEC 25012 и ISO/IEC 25024. Целью данного документа является описание модели качества данных посредством определения характеристик качества данных и показателей качества данных на основе стандартов ISO/IEC 25012 и ISO/IEC 25024. Модели качества данных могут быть расширены или изменены в соответствии с этим документом.

… В настоящем документе описана модель качества данных и показатели качества данных, а также даны рекомендации по составлению отчётов о качестве данных в контексте аналитики и машинного обучения (МО).

Данный документ применим в организациях любого типа, желающих достичь своих целей в области качества данных.»

Содержание стандарта следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обозначения и сокращения
5. Аспекты качества данных и модели качества данных для аналитики и машинного обучения
6. Характеристики качества данных и показатели качества
7. Реализация модели качества данных и показателей качества данных для аналитики и машинного обучения
7. Отчетность о качестве данных
Приложение А (справочное): Проектирование и документирование функции измерения
Приложение В (справочное): UML-модель системы показателей качества данных
Приложение С (справочное): Обзор характеристик качества данных
Приложение D (справочное): Альтернативные группы характеристик качества данных
Приложение E (справочное): Сравнение характеристик качества данных в стандартах ISO/IEC 25012 и ISO/IEC 5259-2
Библиография

Источник: сайт ИСО
https://www.iso.org/standard/81860.html
https://www.iso.org/obp/ui/en/#!iso:std:81860:en

Комментариев нет:

Отправить комментарий