На финальную стадию вышла работа над проектом технического отчёта ISO/IEC DTR 23888-1 «Информационные технологии - Искусственный интеллект для мультимедиа - Часть 1: Видение и сценарии» (Information technology — Artificial intelligence for multimedia - Part 1: Vision and scenarios), объёмом 28 страниц основного текста, см. https://www.iso.org/standard/87589.html (начальные страницы документа доступны по адресу https://public-viewer.snv.ch/product/1310483/en?filePath=939f145c-459e-4c29-8970-3da85785a48f.zip ).
Во вводной части документа отмечается:
«Настоящий документ является частью серии ISO/1EC 23888 (также известной как MPEG-AI) по использованию искусственному интеллекту (ИИ) для мультимедиа.
… В данном документе представлена роль технологий искусственного интеллекта (ИИ) и нейронных сетей (НС) в кодировании и обработке мультимедийных материалов.
В нём описываются современные перспективы применения ИИ для мультимедиа и выявляются рабочие предположения и технические проблемы, ожидаемые при работе с технологиями на основе ИИ и НС.
В данном документе освещаются различные виды кодирования мультимедиа, ключевые сценарии и существующие пробелы, которые необходимо устранить в ходе дальнейших усилий по стандартизации.»
… В данном документе представлена роль технологий искусственного интеллекта (ИИ) и нейронных сетей (НС) в кодировании и обработке мультимедийных материалов.
В нём описываются современные перспективы применения ИИ для мультимедиа и выявляются рабочие предположения и технические проблемы, ожидаемые при работе с технологиями на основе ИИ и НС.
В данном документе освещаются различные виды кодирования мультимедиа, ключевые сценарии и существующие пробелы, которые необходимо устранить в ходе дальнейших усилий по стандартизации.»
Содержание документа следующее:
Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Видение искусственного интеллекта для мультимедиа
5. Технические рабочие предположения и общие ожидания (проблемы)
6. Технологии и варианты использования
Приложение
Библиография
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Видение искусственного интеллекта для мультимедиа
5. Технические рабочие предположения и общие ожидания (проблемы)
6. Технологии и варианты использования
Приложение
Библиография
Высокая степень готовности у ещё двух документов серии. Это:
Проект стандарта ISO/IEC DIS 23888-2 «Информационные технологии - Искусственный интеллект для мультимедиа - Часть 2: Кодирование видео для машин» (Information technology — Artificial intelligence for multimedia - Part 2: Video coding for machines) объёмом 131 страница основного текста, см. https://www.iso.org/standard/88879.html (начальные страницы документа доступны по адресу https://public-viewer.snv.ch/product/1312966/en?filePath=e54bf8c9-ae39-40ee-ab1a-ed966b9e4b4b.zip ).
Во вводной части документа отмечается:
«В настоящем документе описываются технологии кодирования видеоматериалов для их потребления машинами.
Традиционные технологии кодирования видеоматериалов направлены на получение наилучшего качества видео для восприятия человеком при наличии определенных ограничений по битрейту. Однако с появлением систем искусственного интеллекта (ИИ) наряду с обилием датчиков, было реализовано множество платформ ИИ с огромными требованиями к объему данных, включая такие сценарии, как подключенные транспортные средства, видеонаблюдение и умные города. Огромные объёмы постоянно генерируемых данных делает предыдущие методы с участием человека в конвейерах обработки неэффективными и нереалистичными с точки зрения задержек по времени и масштабируемости. Дополнительные проблемы возникают в системах передачи и архивирования, которые требуют более компактного представления данных и решений с низкой задержкой. Всё то мотивировало разработку описанного в данном документе стандарта кодирования видео для машин (Video Coding for Machines).
В некоторых случаях машины с целью выполнения задач обмениваются информацией между собой без участия человека, в то время как в других ситуациях требуется дополнительный просмотр человеком конкретного декомпрессированного потока. Последний сценарий возможен в системах видеонаблюдения, где человек-«контролёр» время от времени ищет конкретного человека или сцену в видеозаписи. В других случаях соответствующий битовый поток используется для восприятия как человеком, так и машиной.
В настоящем документе описаны синтаксис, семантика и процессы декодирования, необходимые для декодирования битового потока.»
Традиционные технологии кодирования видеоматериалов направлены на получение наилучшего качества видео для восприятия человеком при наличии определенных ограничений по битрейту. Однако с появлением систем искусственного интеллекта (ИИ) наряду с обилием датчиков, было реализовано множество платформ ИИ с огромными требованиями к объему данных, включая такие сценарии, как подключенные транспортные средства, видеонаблюдение и умные города. Огромные объёмы постоянно генерируемых данных делает предыдущие методы с участием человека в конвейерах обработки неэффективными и нереалистичными с точки зрения задержек по времени и масштабируемости. Дополнительные проблемы возникают в системах передачи и архивирования, которые требуют более компактного представления данных и решений с низкой задержкой. Всё то мотивировало разработку описанного в данном документе стандарта кодирования видео для машин (Video Coding for Machines).
В некоторых случаях машины с целью выполнения задач обмениваются информацией между собой без участия человека, в то время как в других ситуациях требуется дополнительный просмотр человеком конкретного декомпрессированного потока. Последний сценарий возможен в системах видеонаблюдения, где человек-«контролёр» время от времени ищет конкретного человека или сцену в видеозаписи. В других случаях соответствующий битовый поток используется для восприятия как человеком, так и машиной.
В настоящем документе описаны синтаксис, семантика и процессы декодирования, необходимые для декодирования битового потока.»
Содержание документа следующее:
Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Сокращения
5. Условные обозначения
6. Форматы битового потока и изображений
7. Синтаксис и семантика
8. Процесс декодирования
9. Процесс парсинга
Приложение
Библиография
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Сокращения
5. Условные обозначения
6. Форматы битового потока и изображений
7. Синтаксис и семантика
8. Процесс декодирования
9. Процесс парсинга
Приложение
Библиография
Проект технического отчёта ISO/IEC DTR 23888-3 «Информационные технологии - Искусственный интеллект для мультимедиа - Часть 3: Оптимизация кодировщиков и принимающих систем для машинного анализа закодированного видеоконтента» (Information technology — Artificial intelligence for multimedia - Part 3: Optimization of encoders and receiving systems for machine analysis of coded video content), см. https://www.iso.org/standard/89045.html (начальные страницы документа доступны по адресу https://public-viewer.snv.ch/product/1290582/en?filePath=46a57572-00e7-4028-a4cb-284d6b0f2fba.zip ).
Во вводной части документа отмечается:
«В настоящем документе представлен обзор оптимизаций для кодировщиков и принимающих систем, используемых для машинного анализа закодированного видеоконтента.
Документ содержит обзор современных практик на концептуальном уровне и даёт комментарии по техническим аспектам, а также предостережения, которые следует учитывать при интерпретации результатов. В документе описаны технологии, которые недавно были изучены и продемонстрировали свою полезность в плане повышения эффективности кодирования для некоторых задач машинного анализа.»
Документ содержит обзор современных практик на концептуальном уровне и даёт комментарии по техническим аспектам, а также предостережения, которые следует учитывать при интерпретации результатов. В документе описаны технологии, которые недавно были изучены и продемонстрировали свою полезность в плане повышения эффективности кодирования для некоторых задач машинного анализа.»
Содержание документа следующее:
Также технический подкомитет начал работу над новыми проектами:
Проект стандарта ISO/IEC AWI 23888-4 «Искусственный интеллект для мультимедиа - Часть 4: Кодирование признаков для машин» (Artificial intelligence for multimedia - Part 4: Feature coding for machines), см. https://www.iso.org/standard/92539.html .
Во вводной части документа отмечается:
Проект стандарта ISO/IEC AWI 23888-5 «Информационные технологии - Искусственный интеллект для мультимедиа - Часть 5: Динамическое сжатие облака точек с использованием ИИ» (Information technology — Artificial intelligence for multimedia - Part 5: AI-based dynamic point cloud compression), см. https://www.iso.org/standard/92524.html .
Во вводной части документа отмечается:
Источник: сайт ИСО
https://www.iso.org/standard/87589.html
https://www.iso.org/standard/88879.html
https://www.iso.org/standard/89045.html
https://www.iso.org/standard/92539.html
https://www.iso.org/standard/92524.html
Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Сокращения
5. Обзор
6. Методология оценки
7. Технологии предварительной обработки
8. Технологии кодирования
9. Технологии постобработки
10. Метаданные
Приложение
Библиография
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Сокращения
5. Обзор
6. Методология оценки
7. Технологии предварительной обработки
8. Технологии кодирования
9. Технологии постобработки
10. Метаданные
Приложение
Библиография
Также технический подкомитет начал работу над новыми проектами:
Проект стандарта ISO/IEC AWI 23888-4 «Искусственный интеллект для мультимедиа - Часть 4: Кодирование признаков для машин» (Artificial intelligence for multimedia - Part 4: Feature coding for machines), см. https://www.iso.org/standard/92539.html .
Во вводной части документа отмечается:
«В рамках настоящего проекта будет определен формат битового потока и процесс декодирования для сжатия признаков, извлеченных из видеоконтента, который будет эффективен с точки зрения битрейта, производительности при выполнении машинных задач и вычислительной сложности.»
Проект стандарта ISO/IEC AWI 23888-5 «Информационные технологии - Искусственный интеллект для мультимедиа - Часть 5: Динамическое сжатие облака точек с использованием ИИ» (Information technology — Artificial intelligence for multimedia - Part 5: AI-based dynamic point cloud compression), см. https://www.iso.org/standard/92524.html .
Во вводной части документа отмечается:
«В рамках настоящего проекта будут определены синтаксис битового потока и семантика закодированных облаков точек, а также процедура декодирования для реконструкции облаков точек.»
Источник: сайт ИСО
https://www.iso.org/standard/87589.html
https://www.iso.org/standard/88879.html
https://www.iso.org/standard/89045.html
https://www.iso.org/standard/92539.html
https://www.iso.org/standard/92524.html



Комментариев нет:
Отправить комментарий