пятница, 26 сентября 2025 г.

Репортажи из Берлина: Совместная работа на основе формата PDF в эпоху агентов

Данный пост эксперта в области управления электронными документами, эксперта ИСО от США Энди Поттера (Andy Potter - на фото) был опубликован 16 сентября 2025 года в социальной сети Substack.

На прошедшей в Берлине конференции «Дни PDF в Европе» (PDF Days Europe) Леонард Розентоль (Leonard Rosenthol – фото справа на коллаже внизу – Н.Х.) начал свой доклад с весёлой шпильки в собственный адрес. Название для этого доклада он выбрал несколько месяцев тому назад; впоследствии забыл, что именно он имел в виду; и в результате ему пришлось переосмысливать тему доклада, когда пришло время делать слайды. Его выступление вылилось в «заточенные» размышления о том, что на самом деле означает переход к технологиям совместной работы для формата PDF, который изначально был разработан для одного осторожного пользователя, - и что происходит, когда на сцене появляются агенты ИИ.

Совместная работа людей и агентов

Розентоль напомнил нам, что формат PDF всегда отличался надёжностью, перемещаемостью и верностью отображения, но никогда не проявлял себя в условиях активной многопользовательской работы. Розентоль разделил совместную работу на три категории: осознание, комментирование и редактирование. Первый вид работ касается структуры и понимания, в рамках второго люди взаимодействуют больше всего, а в рамках работ третьего вида архитектура PDF действительно демонстрирует свои ограничения.


Он также указал на ещё одно толкование понятия «сотрудничество» (collaboration - в значении «коллаборационизм» - Н.Х.) – «предательское сотрудничество с врагом» – и признал, что иногда именно так мы себя и чувствуем, когда пытаемся сотрудничать.

Осознание: Семантика за пределами структуры

Размеченные тегами PDF-файлы выделяют заголовки, списки, таблицы и альтернативный текст. Существуют даже малоиспользуемые семантики уровня страницы (DParts) для связывания групп страниц. Но Розентоль утверждал, что этого недостаточно - системам ИИ необходимо знать взаимосвязи: что тень не является фигурой, или что выноска относится к рисунку.

Он особо выделил алгоритм вывода, разработанный Ассоциацией PDF (PDF Association), который при необходимости преобразует размеченные тегами PDF-файлы в стандартизированный файлы HTML или Markdown. Первоначально предназначенный для рендеринга, этот алгоритм теперь оказывается ценным инструментом для передачи структурированного контента системам ИИ. Однако Розентоль подчеркнул, что более богатая семантика, «семантика контента» - термин, который он ввёл ещё в 2013 году, - до сих пор отсутствует. Без неё понимание текста людьми или машинами остаётся неполным.

Комментирование: Аннотации с пропусками

Аннотации существуют в формате PDF уже несколько десятилетий. Ссылки, мультимедийные материалы и древовидные комментарии (threaded comments) - все они реализуются с помощью аннотаций. Розентоль отметил, что эта мощная модель на практике используется недостаточно. Большинство систем «выпрямляют» древовидные структуры или игнорируют состояния.

По его словам, недостаёт простых примитивов для поддержки совместной работы: комментарием на уровне документа, таких как «Я одобряю этот документ», реакций на уровне страницы, таких как «Удалить эту страницу», и простых ответов, к которым пользователи привыкли в социальных сетях, таких как «Нравится» или эмодзи. Модель аннотаций пока что всё это не поддерживает.

Формы: Унаследованный инструмент совместной работы

Работа с формами была одним из первых рабочих процессов совместной работы, поддерживаемых форматом PDF: формы заполнялись, маршрутизировались и подписывались. Розентоль напомнил про неактивный сейчас проект forms.next («Формы следующего поколения» - Н.Х.) - грамматику на основе JSON, которая могла бы стандартизировать структурирование форм, извлечение из форм и понимание данных как людьми, так и агентами. Он предложил реанимировать этот проект в качестве шага в будущее.

Редактирование: Инкрементные изменения и их ограничения

Инкрементные изменения (incremental updates), одна из любимых Розентолем функциональных возможностей, поддерживают сохранение историю изменений без её разрушения, а также быстрое сохранение. Они, однако, были разработаны в расчёте на одного пользователя. В мире совместной работы изменение одного символа может привести к значительному объёму «приращения»; правила защиты персональных данных могут потребовать проведение «полного» сохранения после удаления контента, а цепочка обновлений является плоской, в то время, как на деле нужны ветви и слияния.

Розентоль также обратил внимание на то, насколько запутанной становится ситуация, когда слои контента и аннотаций не выровнены. Например, зачёркнутый текст в аннотациях исчезает в режиме редактирования. Если это сбивает с толку даже людей, сказал он, то представьте, как это выглядит для агента ИИ.

Происхождение и подтверждающие реквизиты контента (content credentials)

Отдельный раздел своего доклада Розентоль посвятил атрибуции и происхождению. Он рассказал о сотрудничестве с «Коалицией по вопросам происхождения и аутентичности контента» (Coalition for Content Provenance and Authenticity, C2PA), проект которой сейчас стандартизируется в Международной организации по стандартизации (ИСО). Этот проект предусматривает протоколирование каждого действия с файлом, - будь то человеком или ИИ, - и криптографическое «запечатывание» записей в составе манифеста.

Такой подход, по его словам, соответствует положениям Закона Евросоюза об искусственном интеллекте и аналогичных законов в других странах мира, требующих маркировки использования ИИ. Он также позволяет создателям заявлять о таких правах, как «право запрещать использование для обучения ИИ», и даже кодировать условия лицензирования в PDF-файлы в машиночитаемом виде. Розентоль особо отметил текущую работу над расширениями формата PDF для поддержки подтверждающих реквизитов контента (это проект технических спецификаций ISO/CD TS 32008 «Аутентичность информации – Расширение подтверждающих реквизитов контента в стандарте ISO 32000-2 (PDF 2.0)» (Authenticity of information — Extensions to Content Credentials for ISO 32000-2 (PDF 2.0)), см. https://www.iso.org/standard/45881.html ), а также связанные с этим инициативы JPEG Trust (см. подборку постов на блоге https://rusrim.blogspot.com/search?q=%22JPEG+Trust%22&max-results=20&by-date=trueН.Х.).

Агенты в рабочих процессах

Розентоль завершил своё выступление словами обвинения. Мир движется к агентской модели, в которой большая часть работы, от осознания и комментирования до редактирования и даже создания, будет выполняться программными агентами. По его словам, компании, занимающиеся разработкой ИИ, не понимают формат PDF. Они используют библиотеки с открытым исходным кодом и считают, что этого достаточно. Задача же сообщества PDF – обеспечить агентам возможность корректной работы с этим форматом.

Его слова прозвучали резко: мы понимаем PDF, а «они» - нет. Чтобы совместная работа в мире агентов была успешной, нам следует заставить формат PDF работать в таких условиях.

Эндрю Поттер (Andrew Potter)


Источник: сайт Substack
https://metaarchivist.substack.com/p/dispatch-from-berlin-637 

Комментариев нет:

Отправить комментарий