Документ подготовлен подкомитетом SC42 «Искусственный интеллект» (Artificial intelligence) Объединенного технического комитета ИСО/МЭК JTC1.
Отмечу, что уже сейчас на сайте NORMACS идёт публичное обсуждение проекта адаптации данного международного стандарта в виде ГОСТ Р «Информационные технологии. Искусственный интеллект. Структура жизненного цикла данных», см. https://www.normacs.info/projects/10622
Во вводной части документа отмечается:
«Настоящий документ предлагает всестороннюю концепцию жизненного цикла данных, которая может быть реализована для любой ИИ-системы, начиная от концептуализации данных и до «вывода данных их эксплуатации» (т.е. до их уничтожения/передачи – Н.Х.).
Настоящий документ применим к обработке данных на протяжении всего жизненного цикла ИИ-системы, включая этапы комплектования, создания, разработки, развертывания, техническое обслуживание и вывода из эксплуатации.
Данный документ не определяет конкретные сервисы, платформы или инструменты.
Данный документ применим в любых организациях, вне зависимости от их типа, размера и характера, которые используют данные при разработке и использовании ИИ-систем.»
Содержание документа следующее:
Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Обозначения и сокращения
5. Обзор жизненного цикла данных
6. Концепция жизненного цикла данных
6.1. Общие положения
6.2. Этап 1. Концептуализация идеи
6.3. Этап 2. Деловые требования
6.4. Этап 3: Планирование работы с данными
6.5. Этап 4: Комплектование данных
6.6. Этап 5: Подготовка данных
6.7. Этап 6: Построение модели
6.8. Этап 7: Развертывание системы
6.9. Этап 8: Эксплуатация системы
6.10. Этап 9: Вывод данных из эксплуатации
6.11. Этап 10: Вывод системы из эксплуатации
7. Этапы и процессы в рамках жизненного цикла данных
Библиография
Мой комментарий: С моей точки зрения (в том числе исходя из моего собственного опыта работы с данными и моделями), я считаю данный документ недостаточно серьёзно проработанным в научно-методическом плане и содержащим серьёзные логические просчёты – вероятно потому, что его основными разработчиками были представители академической среды, имеющие опыт лишь весьма ограниченных по сложности проектов.
Самым печальным является то, что авторы смешали в одну кучу жизненные циклы трёх различных сущностей – данных, моделей и систем, не понимая, что данные, а в последнее время и модели зачастую появляются на свет задолго до создания конкретной ИИ-системы и продолжают существовать и после вывода ИИ-системы из эксплуатации.
Я уже не говорю о том, что модель жизненного цикла в принципе применима лишь тогда, когда в работе с данными на практике действительно чётко выделяются последовательные этапы. Однако в настоящее время достаточно много таких проектов, в которых целый ряд процессов обработки данных и развития моделей выполняется не последовательно, а параллельно, вплоть до того, что поступающие в данный момент данные в реальном или почти реальном масштабе времени могут определять дальнейший ход процесса сбора новых данных. В таких ситуация подход «жизненного цикла» оказывается неработоспособным, и приходится использовать иные подходы …
В рассматриваемом проекте международного стандарта можно найти полезные сведения и формулировки, поэтому им – с осторожностью – можно пользоваться, однако всерьёз воспринимать его как полноценную концепцию жизненного цикла используемых в ИИ-системах данных я бы не рекомендовала.
Источник: сайт ИСО
https://www.iso.org/standard/83002.html
https://www.iso.org/obp/ui/#!iso:std:83002:en
Комментариев нет:
Отправить комментарий