На финальную стадию вышла работа над проектом технического отчёта ISO/IEC DTR 23888-1 «Информационные технологии - Искусственный интеллект для мультимедиа - Часть 1: Видение и сценарии» (Information technology — Artificial intelligence for multimedia - Part 1: Vision and scenarios), объёмом 28 страниц основного текста, см. https://www.iso.org/standard/87589.html (начальные страницы документа доступны по адресу https://public-viewer.snv.ch/product/1310483/en?filePath=939f145c-459e-4c29-8970-3da85785a48f.zip ).
Во вводной части документа отмечается:
… В данном документе представлена роль технологий искусственного интеллекта (ИИ) и нейронных сетей (НС) в кодировании и обработке мультимедийных материалов.
В нём описываются современные перспективы применения ИИ для мультимедиа и выявляются рабочие предположения и технические проблемы, ожидаемые при работе с технологиями на основе ИИ и НС.
В данном документе освещаются различные виды кодирования мультимедиа, ключевые сценарии и существующие пробелы, которые необходимо устранить в ходе дальнейших усилий по стандартизации.»
Содержание документа следующее:
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Видение искусственного интеллекта для мультимедиа
5. Технические рабочие предположения и общие ожидания (проблемы)
6. Технологии и варианты использования
Приложение
Библиография
Высокая степень готовности у ещё двух документов серии. Это:
Проект стандарта ISO/IEC DIS 23888-2 «Информационные технологии - Искусственный интеллект для мультимедиа - Часть 2: Кодирование видео для машин» (Information technology — Artificial intelligence for multimedia - Part 2: Video coding for machines) объёмом 131 страница основного текста, см. https://www.iso.org/standard/88879.html (начальные страницы документа доступны по адресу https://public-viewer.snv.ch/product/1312966/en?filePath=e54bf8c9-ae39-40ee-ab1a-ed966b9e4b4b.zip ).
Во вводной части документа отмечается:
Традиционные технологии кодирования видеоматериалов направлены на получение наилучшего качества видео для восприятия человеком при наличии определенных ограничений по битрейту. Однако с появлением систем искусственного интеллекта (ИИ) наряду с обилием датчиков, было реализовано множество платформ ИИ с огромными требованиями к объему данных, включая такие сценарии, как подключенные транспортные средства, видеонаблюдение и умные города. Огромные объёмы постоянно генерируемых данных делает предыдущие методы с участием человека в конвейерах обработки неэффективными и нереалистичными с точки зрения задержек по времени и масштабируемости. Дополнительные проблемы возникают в системах передачи и архивирования, которые требуют более компактного представления данных и решений с низкой задержкой. Всё то мотивировало разработку описанного в данном документе стандарта кодирования видео для машин (Video Coding for Machines).
В некоторых случаях машины с целью выполнения задач обмениваются информацией между собой без участия человека, в то время как в других ситуациях требуется дополнительный просмотр человеком конкретного декомпрессированного потока. Последний сценарий возможен в системах видеонаблюдения, где человек-«контролёр» время от времени ищет конкретного человека или сцену в видеозаписи. В других случаях соответствующий битовый поток используется для восприятия как человеком, так и машиной.
В настоящем документе описаны синтаксис, семантика и процессы декодирования, необходимые для декодирования битового потока.»
Содержание документа следующее:
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Сокращения
5. Условные обозначения
6. Форматы битового потока и изображений
7. Синтаксис и семантика
8. Процесс декодирования
9. Процесс парсинга
Приложение
Библиография
Проект технического отчёта ISO/IEC DTR 23888-3 «Информационные технологии - Искусственный интеллект для мультимедиа - Часть 3: Оптимизация кодировщиков и принимающих систем для машинного анализа закодированного видеоконтента» (Information technology — Artificial intelligence for multimedia - Part 3: Optimization of encoders and receiving systems for machine analysis of coded video content), см. https://www.iso.org/standard/89045.html (начальные страницы документа доступны по адресу https://public-viewer.snv.ch/product/1290582/en?filePath=46a57572-00e7-4028-a4cb-284d6b0f2fba.zip ).
Во вводной части документа отмечается:
Документ содержит обзор современных практик на концептуальном уровне и даёт комментарии по техническим аспектам, а также предостережения, которые следует учитывать при интерпретации результатов. В документе описаны технологии, которые недавно были изучены и продемонстрировали свою полезность в плане повышения эффективности кодирования для некоторых задач машинного анализа.»
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Сокращения
5. Обзор
6. Методология оценки
7. Технологии предварительной обработки
8. Технологии кодирования
9. Технологии постобработки
10. Метаданные
Приложение
Библиография
Также технический подкомитет начал работу над новыми проектами:
Проект стандарта ISO/IEC AWI 23888-4 «Искусственный интеллект для мультимедиа - Часть 4: Кодирование признаков для машин» (Artificial intelligence for multimedia - Part 4: Feature coding for machines), см. https://www.iso.org/standard/92539.html .
Во вводной части документа отмечается:
Проект стандарта ISO/IEC AWI 23888-5 «Информационные технологии - Искусственный интеллект для мультимедиа - Часть 5: Динамическое сжатие облака точек с использованием ИИ» (Information technology — Artificial intelligence for multimedia - Part 5: AI-based dynamic point cloud compression), см. https://www.iso.org/standard/92524.html .
Во вводной части документа отмечается:
Источник: сайт ИСО
https://www.iso.org/standard/87589.html
https://www.iso.org/standard/88879.html
https://www.iso.org/standard/89045.html
https://www.iso.org/standard/92539.html
https://www.iso.org/standard/92524.html







