понедельник, 30 декабря 2024 г.

Росстандарт: Опубликован стандарт ГОСТ Р 71484.2-2024 «Качество данных для аналитики и машинного обучения. Часть 2. Показатели качества данных»

На сайте Федерального агентства по техническому регулированию и метрологии ( http://www.gost.ru/ ) в декабрьском 2024 года разделе ( https://protect.gost.ru/default.aspx?control=6&month=12&year=2024 ) выложен стандарт ГОСТ Р 71484.2-2024 (ИСО/МЭК 5259-2:2024) «Искусственный интеллект. Качество данных для аналитики и машинного обучения. Часть 2. Показатели качества данных» объёмом 40 страниц, вступающий в силу 01.01.2025 года, см. https://protect.gost.ru/document1.aspx?control=31&baseC=6&id=264240 .

Стандарт разработан Научно-образовательным центром компетенций в области цифровой экономики Московского государственного университета имени М.В. Ломоносова» и ООО «Институт развития информационного общества» (ИРИО) на основе собственного перевода на русский язык англоязычной версии международного стандарта ISO/IEC 5259-2:2024 «Искусственный интеллект - Качество данных для аналитики и машинного обучения – Часть 2: Показатели качества данных» (Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 2: Data quality measures, см. https://www.iso.org/standard/81860.html и https://www.iso.org/obp/ui/en/#!iso:std:81860:en ).

Во вводной части стандарта отмечается:

«Ввиду того, что сегодня решения все активнее принимаются на основе данных, встают новые задачи по управлению качеством данных в области аналитики и искусственного интеллекта на основе машинного обучения. Проблемы с качеством данных, такие как неполные, ложные или устаревшие данные, могут отрицательно повлиять на процессы и результаты аналитики и машинного обучения. Данные из различных источников, включая структурированные данные (например, содержащиеся в реляционных базах данных) и неструктурированные данные (например, документы, изображения, аудио), могут быть напрямую использованы в жизненном цикле данных для аналитики и разработки моделей машинного обучения. Данные преобразуются на каждом этапе жизненного цикла данных аналитики и машинного обучения. Чтобы анализ данных и модели машинного обучения были безопасными, надежными и совместимыми, необходим целостный стандартизированный подход к контролю, производству и поставке достаточного количества высококачественных данных. Для разработки надежного управления качеством данных для аналитики и машинного обучения можно рассмотреть внутренние международные стандарты качества данных, включая концепции и варианты использования, характеристики и измерения, требования к управлению и структуру процессов.

Настоящий стандарт является частью серии ИСО/МЭК 5259 и основан на серии стандартов ИСО 8000, ИСО/МЭК 25012 и ИСО/МЭК 25024. Целью настоящего стандарта является описание модели качества данных посредством определения характеристик качества данных и показателей качества данных на основе ИСО/МЭК 25012 и ИСО/МЭК 25024. Модели качества данных могут быть расширены или изменены в соответствии с настоящим стандартом.

... В настоящем стандарте представлена модель качества данных, показатели качества данных и рекомендации по составлению отчетов о качестве данных для аналитики и машинного обучения.

Документ применим для всех типов организаций, которые хотят достичь своих целей в области качества данных.»

Содержание стандарта следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Сокращения
5. Компоненты качества данных и модели качества данных для аналитики и машинного обучения
6. Характеристики качества данных и показатели качества
7. Реализация модели качества данных и показателей качества данных для задач аналитики или машинного обучения
8. Отчетность о качестве данных
Приложение А (справочное): Проектирование и документирование функции измерения
Приложение В (справочное): Модель структуры показателя качества данных (в нотации UML)
Приложение С (справочное): Обзор характеристик качества данных
Приложение D (справочное): Альтернативные группы характеристик качества данных
Приложение Е (справочное): Сравнение характеристик качества данных ИСО/МЭК 25012 с настоящим стандартом
Библиография

Источник: сайт Росстандарта
https://protect.gost.ru/document1.aspx?control=31&baseC=6&id=264240

Комментариев нет:

Отправить комментарий