пятница, 5 сентября 2025 г.

Призыв к действию: Онтология - будущее управления документами и информацией

Почему нам необходимо перейти от классификационной схемы (или номенклатуры – Н.Х.) дел к графу знаний

Данная заметка бывшего Главного архивиста Новой Зеландии, ныне консультанта в сфере искусственного интеллекта, машинного обучения и управления информацией и данными Стивена Кларка (Stephen Clarke) была опубликована 4 августа 2025 года на сайте Subctack.

Мой комментарий: Скажу сразу, что я во многом не согласна с автором, но считаю, что нашим специалистам будет полезно познакомиться с его точкой зрения «из первых рук».

Эволюционировать или умереть: Призыв к действию для специалистов по управлению документами

Наша профессия находится на перепутье. В течение многих десятилетий мы были доверенными хранителями доказательств, архитекторами порядка в мире информации -  но мир изменился. Мы больше уже не храним бумажные документы в папках/делах, и даже не храним файлы в директориях. Теперь мы боремся с цунами распределённых данных и решаем проблемы, связанные с распространением искусственного интеллекта и с потребностью мгновенно предоставлять контекстно-обогащенную информацию. Методов прошлого будет недостаточно для решения проблем будущего.

Для нас настала пора эволюционировать. Пришло время для специалистов по управлению документами и информацией использовать мощь и возможности онтологий и графов знаний.

Мой комментарий по поводу терминов:

Онтология – дисциплина, которая пытается описать и систематизировать, что именно «существует» в определенной области реальности или мышления. В философии онтология изучает самые общие категории бытия (вещи, свойства, процессы, пространство, время). В информатике и других науках предмет онтологии - это структурированный словарь или схема понятий и их связей в конкретной предметной области, которые помогают четко определить смысл терминов, их взаимосвязи, и способствуют обмену относящейся к данной предметной области информацией без какой-либо путаницы. Онтология показывает, из каких «кирпичиков» состоит знание о мире или его части, и как они «складываются» вместе.

В стандарте ISO/IEC/IEEE 24765:2017, п. 3.2691, дано следующее определение (также приведенное в ПНСТ 837-2023, п.3.1): «Онтология (ontology): логическая структура терминов, используемых для описания области знаний, включая как определения применяемых терминов, так и отношения между ними.»

В свою очередь граф знаний - это способ хранить информацию в виде сети («графа»), узлы которого - это конкретные сущности (люди, места, события, понятия и т.д.), а связи (соединяющие узлы линии) - это отношения между сущностями. Такая структура позволяет компьютерам и людям легко выявлять сложные взаимосвязи и понимать контекст в виде «паутины» взаимосвязанных фактов. Графы знаний, в частности, являются основой для интеллектуального поиска или для генерирования рекомендаций.

Взгляните на это с такой точки зрения: годами мы создавали подробные инвентари информационных активов наших организаций. Но эти инвентари представляют собой статические, человеко-читаемые списки и схемы. По сравнению с ними, онтология – это проект системы GPS (спутниковой системы позиционирования) для нашей информации: динамической интеллектуальной системы, которая не только знает местонахождение документа, но и понимает его смысл и значение, причины его существования и то, как он взаимосвязан со всем остальным. Граф знаний – это GPS в действии.

Преодоление разрыва между человеком и машиной

В цифровую эпоху каждый документ существует одновременно в двух мирах. Он должен быть человеко-читаемым: это должен быть текстовой документ, электронная таблица, электронное письмо, которые человек может прочитать и понять. Но для управления в больших масштабах документ также должен быть машиночитаемым. Компьютер не может понять нюансы контракта, но он может понять, что контракт – это «документ», что он был создан «юридическим отделом» и что срок его хранения регламентируется правилом FIN-POL-007.

Мой комментарий: Удивительно, но в данном вопросе автор куда менее «революционен», чем уже существующая практика. Огромные массивы создаваемых документов сейчас не является человекочитаемыми (достаточно вспомнить отчетность в формате XML; не говоря уже о НТД – Н.Х.), поскольку не предназначены для обработки человеком; при этом законодательство, положения контрактов и обычаи делового оборота обеспечивают их юридическую силу. Автор также не видит и другой стороны медали – сегодня очень многие традиционные бумажные документы (особенно качественно отпечатанные; но есть и инструменты, позволяющие достаточно неплохо обрабатывать рукописные материалы) вполне уверенно читаются и распознаются машинами!

Онтология является ключевым по важности «слоем-переводчиком» между этими двумя мирами. Она позволяет нам построить богатую по содержанию, учитывающую контекст (условия) модель, на основе которой могут действовать машины, - что является абсолютной необходимой основой для автоматизации.

Переход на использование онтологий - не просто техническое обновление; это фундаментальный сдвиг в нашей практике. Внедряя такие подходы, мы уходит от роли всё более пассивных хранителей контента и становимся активными участниками деловых процессов. Именно мы сможем создать концепции, которые обеспечивают:

  • Автоматизацию с умом: Это ключевой результат; ручная обработка уже нецелесообразна. Автоматизация, движущей силой которой является граф знаний, — единственный способ управления объёмами и сложностью современной информации (Если это «единственный» способ, почему на практике он не используется? – Н.Х.). такая автоматизация позволяет системам автоматически классифицировать документы, устанавливать им сроки хранения и налагать/снимать временные запреты на уничтожение документов, исходя из их обширных контекстуальных взаимосвязей, а не только на основе того, в каком деле они хранятся.

  • Получение беспрецедентных аналитических результатов: Это получение ответов на сложные вопросы, получить которые сегодня невозможно, благодаря установлению связей между документами, людьми, процессами и событиями с целью выявления рисков и возможностей.

  • Создание цифрового доверия: В эпоху дезинформации, обеспечивается предоставление проверяемых, машиночитаемых сведений о всей цепочке происхождения документов и их контекста, которые подтверждают аутентичность и надёжность документа.

Это наш шанс переосмыслить ту потенциальную отдачу от нашей профессиональной деятельности, которую мы предлагаем организациям-работодателям. Но мы не сможем воспользоваться этим шансом, действуя изолированно. Сотня различных онтологий ничем не лучше сотни различных классификационных схем для дел и документов. Не имея общего языка, мы будем создавать цифровые Вавилонские башни, неспособные обмениваться информацией, интегрироваться и развивать результаты работы друг друга.


Пример онтологии

Вот почему международный стандарт для онтологии управления документами - это не просто желаемая цель, а абсолютная необходимость. Стандарт, разработанный под эгидой Международной организации по стандартизации (ИСО), даст нам столь необходимый единый план действий. Он обеспечит:

  • Интероперабельность: Возможность соединять информацию, находящуюся в различных системах, организациях и юрисдикциях.

  • Общий язык: Унифицированный набор понятий и терминов, который позволит специалистам, поставщикам программного обеспечения и разработчикам ИИ работать согласованно.

  • Основу для инноваций: Стабильную, всемирно признанную модель, которая будет стимулировать разработку новых инструментов и технологий, созданных для наших специфических потребностей.

Время дискуссий прошло. Путь вперёд ясен. Как специалисты по управлению документами и информацией, мы должны взяться за развитие заново, в новом контексте, этих существующих навыков, - продвигая это новое видение в наших организациях и внося свой вклад в жизненно важную работу по созданию глобального стандарта. Давайте будем не библиотекарями цифровой эпохи, а архитекторами её знаний. От этого зависит будущее нашей профессии!

Стивен Кларк (Stephen Clarke)

Источник: сайт Substack
https://steffclarke.substack.com/p/a-call-to-action-ontology-the-future 

1 комментарий:

  1. Как это будет технически выглядеть ? Онтология в виде графов в электронных описях ?

    ОтветитьУдалить