понедельник, 26 сентября 2022 г.

Росстандарт: Начато публичное обсуждение четырёх частей стандарта ГОСТ Р «Искусственный интеллект. Качество данных для аналитики и машинного обучения»

На сайте NORMACS ( https://www.normacs.info ) с 20 сентября 2022 года открыто публичное обсуждение четырёх частей проекта стандарта ГОСТ Р «Информационные технологии. Искусственный интеллект. Качество данных для аналитики и машинного обучения»:

Обсуждение всех частей продлится до 14 ноября 2022 года; для участия в обсуждении может потребоваться регистрация на сайте.

Стандарт подготовлен Московским государственным университетом имени М.В.Ломоносова» (МГУ имени М.В.Ломоносова) в лице Научно-образовательного центра компетенций в области цифровой экономики МГУ и ООО «Институт развития информационного общества» (ИРИО); внесён Техническим комитетом по стандартизации ТК 164 «Искусственный интеллект».

Стандарт идентичен первым 4 из 6 частей разрабатываемого в настоящее время одноимённого международного стандарта ISO/IEC 5259, Artificial intelligence - Data quality for analytics and machine learning (ML).

Часть 1 «Обзор, терминология и примеры»

Текст проекта документа объёмом 36 страниц можно скачать по адресу https://www.normacs.info/project_files/11659 , а пояснительной записки к нему – по адресу https://www.normacs.info/project_files/11658 .

Во вводной части документа, в частности, отмечается:

«Данный документ предоставляет средства для понимания и сопоставления отдельных документов серии ИСО/МЭК «Искусственный интеллект — качество данных для аналитики и машинного обучения» и является основой для концептуального понимания качества данных для аналитики и машинного обучения. В нем также обсуждаются взаимосвязанные технологии и примеры (например, варианты использования и сценарии использования).»

Содержание документа следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обозначения и сокращения
5. Концепции качества данных для аналитики и машинного обучения

5.1. Рекомендации по качеству данных для аналитики и машинного обучения
5.2. Концептуальная структура качества данных для аналитики и машинного обучения
5.3. Жизненный цикл данных для аналитики и машинного обучения

Приложение А (справочное): Сведения о соответствии ссылочных международных стандартов национальным стандартам
Библиография

Оставить свои замечания на проект стандарта можно здесь:  https://www.normacs.info/discussions/8473#8473

Часть 2  «Показатели качества данных»


Текст проекта документа объёмом 68 страниц можно скачать по адресу https://www.normacs.info/project_files/11661 , а пояснительной записки к нему – по адресу https://www.normacs.info/project_files/11660 .

Во вводной части документа, в частности, отмечается:

«В этом документе представлена модель качества данных, показатели качества данных и рекомендации по составлению отчетов о качестве данных в контексте аналитики и машинного обучения. Этот документ основан на серии стандартов ISO 8000, ISO/IEC 25012 и ISO/IEC 25024.

Цель этого документа — помочь организациям достичь своих целей в области качества данных и применима ко всем типам организаций.»

Содержание документа следующее:

Предисловие
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обозначения и сокращения
5. Модель качества данных для аналитики и машинного обучения

5.1. Измерение качества данных в жизненном цикле данных
5.2. Система измерения качества данных
5.3. Модель качества данных
5.4. Характеристики качества данных и меры качества

5.4.1. Общие положения
5.4.2. Переносимость
5.4.3. Понятность
5.4.4. Возможность аудита
5.4.5. Идентифицируемость
5.4.6. Актуальность
5.4.7. Достоверность
5.4.8. Полнота

5.5. Характеристики качества набора данных и меры качества

5.5.1. Общие положения
5.5.2. Масштабируемость данных
5.5.3. Обобщаемость
5.5.4. Эффективность
5.5.5. Представимость
5.5.6. Точность
5.5.7. Согласованность
5.5.8. Релевантность
5.5.9. Своевременность
5.5.10. Репрезентативность
5.5.11. Сбалансированность
5.5.12. Подобие
5.5.13. Разнообразие

6. Методы улучшения качества данных

6.1. Дополнение данных
6.2. Стандартизация данных
6.3. Нормализация данных
6.4. Вменение данных
6.5. Шифрование данных

7. Отчет о качестве данных
Библиография
Приложение А (справочное): Сведения о соответствии ссылочных международных стандартов национальным стандартам
Разработка и документирование функции измерения
UML-модель системы измерения качества данных
Обзор характеристик качества данных и наборов данных

Оставить свои замечания на проект стандарта можно здесь:  https://www.normacs.info/discussions/8474#8474

Часть 3  «Требования и рекомендации по управлению качеством данных»

Текст проекта документа объёмом 54 страниц можно скачать по адресу https://www.normacs.info/project_files/11663 , а пояснительной записки к нему – по адресу https://www.normacs.info/project_files/11662 .

Во вводной части документа, в частности, отмечается:

«Этот документ определяет требования и рекомендации по созданию, внедрению, поддержке и постоянному повышению качества данных, используемых в областях аналитики и машинного обучения. В документе не определяются детально сам процесс, методы или показатели. Он содержит требования и рекомендации для организации процесса управления качеством, а также эталонный процесс и методы, которые могут быть адаптированы для выполнения данных требований. Требования и рекомендации, изложенные в этом документе, являются общими и предназначены для применения ко всем организациям, независимо от их типа, размера или характера.»

Содержание документа следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обозначения и сокращения
5. Требования к соответствию
6. Общее управление качеством данных
7. Рекомендации и требования, относящиеся к жизненному циклу управления качеством данных
8. Горизонтальные процессы
9. Управление качеством данных в цепочках поставок
10. Управление средствами обработки данных
11. Управление зависимостями качества данных
12. Управление качеством данных по конкретному проекту
Библиография
Приложение А (справочное) Сведения о соответствии ссылочных международных стандартов национальным стандартам

Оставить свои замечания на проект стандарта можно здесь:  https://www.normacs.info/discussions/8475#8475

Часть 4 «Инструментарий для мониторинга качества данных»

Текст проекта документа объёмом 51 страница можно скачать по адресу https://www.normacs.info/project_files/11665 , а пояснительной записки к нему – по адресу https://www.normacs.info/project_files/11664 .

Во вводной части документа, в частности, отмечается:

«В этом документе представлены общие организационные подходы, независимо от типа, размера или характера организации-заявителя, для обеспечения качества данных используемых для обучения и оценки в области аналитики и машинного обучения. Он включает руководство по процессу обеспечения качества данных для: машинного обучения с учителем в отношении маркировки данных, используемых для обучения систем машинного обучения, включая общие организационные подходы к маркировке обучающих данных; машинного обучения без учителя; с привлечение учителя; обучения с подкреплением; аналитики.

Настоящий документ применим к данным обучения и оценки, которые поступают из разных источников, включая сбор и объединение данных, подготовку данных, маркировку данных, оценку и использование данных, но не определяет конкретные услуги, платформы или инструменты.»

Содержание документа следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обозначения и сокращения
5. Принципы процесса обеспечения качества данных
6. Структура процесса качества данных
7. Процесс качества данных для машинного обучения
8. Методы и процесс маркировки данных
9. Роли участников
10. Процесс обеспечения качества данных для машинного обучения с подкреплением
11. Процесс качества данных для обучения с подкреплением
12. Процесс обеспечения качества данных для аналитики
Библиография
Приложение А (справочное) Сведения о соответствии ссылочных международных стандартов национальным стандартам

Оставить свои замечания на проект стандарта можно здесь:  https://www.normacs.info/discussions/8476#8476

Источник: сайт NORMACS
https://www.normacs.info/projects/10618   
https://www.normacs.info/projects/10619   
https://www.normacs.info/projects/10620   
https://www.normacs.info/projects/10621  

Комментариев нет:

Отправить комментарий