(Окончание, начало см. http://rusrim.blogspot.com/2023/08/isoiec-5259-1.html )
ISO/IEC DIS 5259-3 «Искусственный интеллект - Качество данных для аналитики и машинного обучения – Часть 3: Требования и рекомендации по управлению качеством данных» (Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 3: Data quality management requirements and guidelines) объёмом 23 страниццы основного текста, см. https://www.iso.org/standard/81092.html и https://www.iso.org/obp/ui/en/#!iso:std:81092:en .
«Настоящий документ содержит требования и рекомендации по определению, внедрению, поддержке и постоянному повышению качества данных, используемых в областях аналитики и машинного обучения.
В документе не даётся детальных описаний самого процесса, методов или показателей. Скорее, он содержит требования и рекомендации в отношении процесса управления качеством, наряду с описанием типового процесса и методов, которые могут быть адаптированы для выполнения данных требований.
Требования и рекомендации, установленные в данном документе, являются типовыми и предназначены для применения в организациях любого типа, размера или характера.»
Содержание документа следующее:
Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обозначения и сокращения
5. Варианты применения стандарта
6. Управление качеством данных в целом
7. Управление качеством данных на различных этапах жизненного цикла данных
8. Горизонтальные процессы
9. Управление качеством данных в цепочках поставок
10. Управление средствами обработки данных
11. Управление факторами и зависимосстями, влияющими на качество данных
12. Управление качеством данных в конкретных проектах
Библиография
Страница публичного обсуждения стандарта ISO/IEC DIS 5259-3
на сайте Британского института стандартов (BSI)
Обсуждение на сайте BSI проводится по адресу: https://standardsdevelopment.bsigroup.com/projects/2020-02055#/section
ISO/IEC DIS 5259-4 «Искусственный интеллект - Качество данных для аналитики и машинного обучения – Часть 4: Рамочная концепция процесса обеспечения качества данных» (Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 4: Data quality process framework) объёмом 25 страниц, см. https://www.iso.org/standard/81093.html и https://www.iso.org/obp/ui/en/#!iso:std:81093:en .
Во вводной части документа, в частности, отмечается:
«В настоящем документе представлены общие типовые организационные подходы, применяемые (вне зависимости от типа, размера или характера организации) для обеспечения качества данных, используемых для обучения и оценки в области аналитики и машинного обучения. Документ включает рекомендации по процессу обеспечения качества данных для:
- машинного обучения с учителем в отношении разметки данных, используемых для обучения систем машинного обучения, включая общие организационные подходы к разметке обучающих данных;
- машинного обучения без учителя;
- машинного обучения с частичным привлечением учителя;
- машинного обучения с подкреплением;
- аналитики.
Настоящий документ применим к поступающим из различных источников обучающим данным и данным для оценки, рассматривая вопросы сбора и объединения данных, подготовки данных, разметки данных, оценку и использование данных. Данный документ не специфицирует конкретные сервисы, платформы или инструменты.»
Содержание документа следующее:
Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обозначения и сокращения
5. Принципы процесса обеспечения качества данных
6. Концептуальная структура процесса качества данных
7. Процесс качества данных для машинного обучения
8. Методы и процесс разметки данных
9. Роли участников
10. Процесс обеспечения качества данных для машинного обучения с частичным привлечением учителя,
11. Процесс обеспечения качества данных для обучения с подкреплением
12. Процесс обеспечения качества данных для аналитики
Библиография
Обсуждение на сайте BSI проводится по адресу: https://standardsdevelopment.bsigroup.com/projects/2020-02056#/section
Тем временем продолжается работа ещё над двумя частями стандарта:
- ISO/IEC CD 5259-5 «Искусственный интеллект - Качество данных для аналитики и машинного обучения - Часть 5: Стратегическое управление качеством данных» (Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 5: Data quality governance), см. https://www.iso.org/standard/84150.html
- ISO/IEC CD TR 5259-6 «Искусственный интеллект - Качество данных для аналитики и машинного обучения - Часть 6: Концепция использования визуализации в интересах обеспечения качества данных» (Artificial intelligence - Data quality for analytics and machine learning (ML) - Part 6: Visualization framework for data quality), см. https://www.iso.org/standard/86532.html
Источник: сайт ИСО / сайт BSI
Комментариев нет:
Отправить комментарий