Данный пост эксперта в области управления электронными документами, эксперта ИСО от США Энди Поттера (Andy Potter - на фото) был опубликован 16 сентября 2025 года в социальной сети Substack.
На прошедшей в Берлине конференции «Дни PDF в Европе» (PDF Days Europe) Леонард Розентоль (Leonard Rosenthol – фото справа на коллаже внизу – Н.Х.) начал свой доклад с весёлой шпильки в собственный адрес. Название для этого доклада он выбрал несколько месяцев тому назад; впоследствии забыл, что именно он имел в виду; и в результате ему пришлось переосмысливать тему доклада, когда пришло время делать слайды. Его выступление вылилось в «заточенные» размышления о том, что на самом деле означает переход к технологиям совместной работы для формата PDF, который изначально был разработан для одного осторожного пользователя, - и что происходит, когда на сцене появляются агенты ИИ.
Совместная работа людей и агентов
Розентоль напомнил нам, что формат PDF всегда отличался надёжностью, перемещаемостью и верностью отображения, но никогда не проявлял себя в условиях активной многопользовательской работы. Розентоль разделил совместную работу на три категории: осознание, комментирование и редактирование. Первый вид работ касается структуры и понимания, в рамках второго люди взаимодействуют больше всего, а в рамках работ третьего вида архитектура PDF действительно демонстрирует свои ограничения.
Он также указал на ещё одно толкование понятия «сотрудничество» (collaboration - в значении «коллаборационизм» - Н.Х.) – «предательское сотрудничество с врагом» – и признал, что иногда именно так мы себя и чувствуем, когда пытаемся сотрудничать.
Осознание: Семантика за пределами структуры
Размеченные тегами PDF-файлы выделяют заголовки, списки, таблицы и альтернативный текст. Существуют даже малоиспользуемые семантики уровня страницы (DParts) для связывания групп страниц. Но Розентоль утверждал, что этого недостаточно - системам ИИ необходимо знать взаимосвязи: что тень не является фигурой, или что выноска относится к рисунку.
Он особо выделил алгоритм вывода, разработанный Ассоциацией PDF (PDF Association), который при необходимости преобразует размеченные тегами PDF-файлы в стандартизированный файлы HTML или Markdown. Первоначально предназначенный для рендеринга, этот алгоритм теперь оказывается ценным инструментом для передачи структурированного контента системам ИИ. Однако Розентоль подчеркнул, что более богатая семантика, «семантика контента» - термин, который он ввёл ещё в 2013 году, - до сих пор отсутствует. Без неё понимание текста людьми или машинами остаётся неполным.
Комментирование: Аннотации с пропусками
Аннотации существуют в формате PDF уже несколько десятилетий. Ссылки, мультимедийные материалы и древовидные комментарии (threaded comments) - все они реализуются с помощью аннотаций. Розентоль отметил, что эта мощная модель на практике используется недостаточно. Большинство систем «выпрямляют» древовидные структуры или игнорируют состояния.
По его словам, недостаёт простых примитивов для поддержки совместной работы: комментарием на уровне документа, таких как «Я одобряю этот документ», реакций на уровне страницы, таких как «Удалить эту страницу», и простых ответов, к которым пользователи привыкли в социальных сетях, таких как «Нравится» или эмодзи. Модель аннотаций пока что всё это не поддерживает.
Формы: Унаследованный инструмент совместной работы
Работа с формами была одним из первых рабочих процессов совместной работы, поддерживаемых форматом PDF: формы заполнялись, маршрутизировались и подписывались. Розентоль напомнил про неактивный сейчас проект forms.next («Формы следующего поколения» - Н.Х.) - грамматику на основе JSON, которая могла бы стандартизировать структурирование форм, извлечение из форм и понимание данных как людьми, так и агентами. Он предложил реанимировать этот проект в качестве шага в будущее.
Редактирование: Инкрементные изменения и их ограничения
Инкрементные изменения (incremental updates), одна из любимых Розентолем функциональных возможностей, поддерживают сохранение историю изменений без её разрушения, а также быстрое сохранение. Они, однако, были разработаны в расчёте на одного пользователя. В мире совместной работы изменение одного символа может привести к значительному объёму «приращения»; правила защиты персональных данных могут потребовать проведение «полного» сохранения после удаления контента, а цепочка обновлений является плоской, в то время, как на деле нужны ветви и слияния.
Розентоль также обратил внимание на то, насколько запутанной становится ситуация, когда слои контента и аннотаций не выровнены. Например, зачёркнутый текст в аннотациях исчезает в режиме редактирования. Если это сбивает с толку даже людей, сказал он, то представьте, как это выглядит для агента ИИ.
Происхождение и подтверждающие реквизиты контента (content credentials)
Отдельный раздел своего доклада Розентоль посвятил атрибуции и происхождению. Он рассказал о сотрудничестве с «Коалицией по вопросам происхождения и аутентичности контента» (Coalition for Content Provenance and Authenticity, C2PA), проект которой сейчас стандартизируется в Международной организации по стандартизации (ИСО). Этот проект предусматривает протоколирование каждого действия с файлом, - будь то человеком или ИИ, - и криптографическое «запечатывание» записей в составе манифеста.
Такой подход, по его словам, соответствует положениям Закона Евросоюза об искусственном интеллекте и аналогичных законов в других странах мира, требующих маркировки использования ИИ. Он также позволяет создателям заявлять о таких правах, как «право запрещать использование для обучения ИИ», и даже кодировать условия лицензирования в PDF-файлы в машиночитаемом виде. Розентоль особо отметил текущую работу над расширениями формата PDF для поддержки подтверждающих реквизитов контента (это проект технических спецификаций ISO/CD TS 32008 «Аутентичность информации – Расширение подтверждающих реквизитов контента в стандарте ISO 32000-2 (PDF 2.0)» (Authenticity of information — Extensions to Content Credentials for ISO 32000-2 (PDF 2.0)), см. https://www.iso.org/standard/45881.html ), а также связанные с этим инициативы JPEG Trust (см. подборку постов на блоге https://rusrim.blogspot.com/search?q=%22JPEG+Trust%22&max-results=20&by-date=true – Н.Х.).
Агенты в рабочих процессах
Розентоль завершил своё выступление словами обвинения. Мир движется к агентской модели, в которой большая часть работы, от осознания и комментирования до редактирования и даже создания, будет выполняться программными агентами. По его словам, компании, занимающиеся разработкой ИИ, не понимают формат PDF. Они используют библиотеки с открытым исходным кодом и считают, что этого достаточно. Задача же сообщества PDF – обеспечить агентам возможность корректной работы с этим форматом.
Его слова прозвучали резко: мы понимаем PDF, а «они» - нет. Чтобы совместная работа в мире агентов была успешной, нам следует заставить формат PDF работать в таких условиях.
Эндрю Поттер (Andrew Potter)
Источник: сайт Substack
https://metaarchivist.substack.com/p/dispatch-from-berlin-637
пятница, 26 сентября 2025 г.
Репортажи из Берлина: Совместная работа на основе формата PDF в эпоху агентов
Labels:
аналитика,
Германия,
искусственный интеллект,
конференции,
США,
управление контентом,
HMT,
PDF
Подписаться на:
Комментарии к сообщению (Atom)
Комментариев нет:
Отправить комментарий