Стандарт подготовлен техническим подкомитетом ISO/IEC JTC1/SC42 «Искусственный интеллект». О работе над ним я уже писала здесь: http://rusrim.blogspot.com/2023/08/isoiec-5259-1.html
Практически одновременно с публикацией ИСО и МЭК данный стандарт адаптирован в России как ГОСТ Р 71484.2-2024 «Искусственный интеллект. Качество данных для аналитики и машинного обучения. Часть 2. Показатели качества данных», см. https://www.gost.ru/...
Во вводной части стандарта отмечается:
«При принятии решений на основе данных возникают новые проблемы в управлении качеством данных в области аналитики данных и искусственного интеллекта (ИИ) на основе машинного обучения (МО).
Такие недостатки качества данных, как наличие неполных, ложных или устаревших данных, могут негативно повлиять на процессы и результаты аналитики и машинного обучения.
Данные из различных источников, включая структурированные данные (например, реляционные базы данных) и неструктурированные данные (например, документы, изображения, аудиозаписи), могут быть напрямую использованы в жизненном цикле данных для аналитики и разработки моделей машинного обучения. На каждой стадии жизненного цикла данных аналитики и машинного обучения данные преобразуются.
Чтобы аналитика данных и модели машинного обучения были безопасными, надёжными и интероперабельными, необходим целостный стандартизированный подход к контролю и управлению, производству и доставке достаточно высококачественных данных. Для разработки заслуживающего доверия управления качеством данных для аналитики и машинного обучения можно быть использованы международные стандарты внутренне присущего качества данных, включающие концепции и варианты использования, характеристики и измерения, требования к управлению и концептуальную структуру процессов.
Настоящий документ является частью серии стандартов ISO/IEC 5259. Он основан на серии стандартов ISO 8000 и на стандартах ISO/IEC 25012 и ISO/IEC 25024. Целью данного документа является описание модели качества данных посредством определения характеристик качества данных и показателей качества данных на основе стандартов ISO/IEC 25012 и ISO/IEC 25024. Модели качества данных могут быть расширены или изменены в соответствии с этим документом.
… В настоящем документе описана модель качества данных и показатели качества данных, а также даны рекомендации по составлению отчётов о качестве данных в контексте аналитики и машинного обучения (МО).
Данный документ применим в организациях любого типа, желающих достичь своих целей в области качества данных.»
Содержание стандарта следующее:
Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обозначения и сокращения
5. Аспекты качества данных и модели качества данных для аналитики и машинного обучения
6. Характеристики качества данных и показатели качества
7. Реализация модели качества данных и показателей качества данных для аналитики и машинного обучения
7. Отчетность о качестве данных
Приложение А (справочное): Проектирование и документирование функции измерения
Приложение В (справочное): UML-модель системы показателей качества данных
Приложение С (справочное): Обзор характеристик качества данных
Приложение D (справочное): Альтернативные группы характеристик качества данных
Приложение E (справочное): Сравнение характеристик качества данных в стандартах ISO/IEC 25012 и ISO/IEC 5259-2
Библиография
Источник: сайт ИСО
https://www.iso.org/standard/81860.html
https://www.iso.org/obp/ui/en/#!iso:std:81860:en
Комментариев нет:
Отправить комментарий