Стандарт подготовлен Национальным исследовательским университетом «Высшая школа экономики» (НИУ ВШЭ) на основе собственного перевода на русский язык проекта международных технических спецификаций ISO/IEC DTS 25058 «Системная и программная инженерия - Требования и оценка качества систем и программного обеспечения (SQuaRE) – Руководство по оценке качества систем искусственного интеллекта (ИИ-систем)» (Systems and software engineering - Systems and software Quality Requirements and Evaluation (SQuaRE) - Guidance for quality evaluation of artificial intelligence (AI) systems), см. https://www.iso.org/standard/82570.html . Стандарт внесён Техническим комитетом по стандартизации ТК 164 «Искусственный интеллект».
Во вводной части документа отмечается:
«Оценка системы искусственного интеллекта (ИИ) может представлять собой нетривиальную задачу. Кроме того, негативные эффекты от систем ИИ низкого качества весьма существенны, поскольку такие системы часто разрабатываются для упрощения автоматизации критически важных действий и решений, которые широко используются в промышленности, правительственных учреждениях и научных кругах.
Цель настоящего стандарта дать разработчикам руководство для надлежащей оценки качества систем ИИ. Настоящий стандарт не устанавливает точные величины параметров и пороговые значения, поскольку они варьируются в зависимости от характера конкретной системы. Вместо этого в настоящем стандарте приведены всесторонние указания, охватывающие существенные аспекты качества системы ИИ, для проведения его оценки.
Тестирование является всеобъемлющим с точки зрения верификации каждой характеристики и подхарактеристики (субхарактеристики) тестовыми стратегиями, но подробное описание методов тестирования и измерений представлено в других документах.
... Настоящий стандарт устанавливает руководство по оценке качества систем ИИ на основе использования моделей качества систем ИИ.
Настоящий стандарт применим во всех организациях, разрабатывающих и использующих ИИ.»
Содержание предстандарта следующее:
Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Общие положения
5. Методика оценки качества
6. Функциональная пригодность
7. Уровень производительности
8. Совместимость
9. Удобство использования
10. Надежность
11. Защищенность
12. Сопровождаемость
13. Переносимость
14. Эффективность
15. Производительность
16. Удовлетворенность
17. Свобода от риска
18. Покрытие контекста
Библиография
Источник: сайт Росстандарта
https://protect.gost.ru/v.aspx?control=8&baseC=6&id=245037
Комментариев нет:
Отправить комментарий