воскресенье, 30 ноября 2025 г.

Росстандарт: Опубликован стандарт ГОСТ Р ИСО 28000-2025 «Безопасность и устойчивость. Системы менеджмента безопасности. Требования»

На сайте Федерального агентства по техническому регулированию и метрологии ( http://www.gost.ru/ ) в октябрьском 2025 года разделе ( https://protect.gost.ru/default.aspx?control=6&month=10&year=2025 ) был выложен текст новой редакции стандарта ГОСТ Р ИСО 28000-2025 (ISO 28000:2022) «Безопасность и устойчивость. Системы менеджмента безопасности. Требования» объёмом 24 страницы, вступающего в силу 01.03.2026 года, см. https://protect.gost.ru/document1.aspx?control=31&baseC=6&id=268585 . Документ заменит ныне действующую редакцию ГОСТ Р ИСО 28000-2019.

Стандарт подготовлен Российским институтом стандартизации на основе собственного перевода на русский язык англоязычной версии международного стандарта ISO 28000:2022 «Безопасность и жизнестойкость – Системы менеджмента безопасности – Требования» (Security and resilience - Security management systems – Requirements, см. https://www.iso.org/standard/79612.html и https://www.iso.org/obp/ui/en/#!iso:std:79612:en ) с Поправкой 1:2024 «Поправки, связанные с борьбой с изменением климата» (Amendment 1: Climate action changes, см. https://www.iso.org/standard/88413.html и https://www.iso.org/obp/ui/en/#!iso:std:88413:en ).

Во вводной части стандарта, в частности, отмечается:

«Настоящий стандарт устанавливает требования к системе менеджмента безопасности, включая аспекты, относящиеся к цепи поставок.

Настоящий стандарт применим к организациям всех типов и размеров (например, коммерческие предприятия, государственные или иные общественные учреждения и некоммерческие организации), которые хотят разработать, применять, поддерживать и улучшать систему менеджмента безопасности. Настоящий стандарт обеспечивает единый и комплексный подход и не относится к конкретной отрасли или сектору экономики.

Настоящий стандарт можно использовать на протяжении всего жизненного цикла организации, он может применяться к любому виду деятельности, внутренней или внешней, на всех уровнях.»

С точки зрения терминологии интересна попытка ввести в оборот термин «стейкхолдер» (см. п. 3.2), который, видимо, по мнению переводчиков означает нечто иное, чем термин «заинтересованная сторона» :)

В целом, этот типичный стандарт требований к системе менеджмента – кто видел один такой документ, видел их все :) С моей точки зрения, его основные недостатки – это отсутствие четкого описания области применения и взаимоотношений с другими стандартами систем менеджмента и безопасности; а также отсутствие делового обоснования необходимости подобной системы для организации.

 Кстати говоря, к настоящему времени Международная организация по стандартизации (ИСО) совместно с Международной электротехнической комиссией (МЭК) выпустили стандарты примерно для сотни (!) различных систем менеджмента, подавляющее большинство которых оказались невостребованными.

Содержание стандарта следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Среда организации
5. Лидерство
6. Планирование 
7. Средства обеспечения
8. Деятельность
9. Оценка результатов деятельности
10. Улучшение
Библиография

Источник: сайт Росстандарта
https://protect.gost.ru/document1.aspx?control=31&baseC=6&id=268585 

ИСО: Продолжается работа над проектом стандарта ISO/CD 25244 «Показатели эффективности работы архивов»

Согласно информации на сайтах Международной организации по стандартизации (ИСО) и Британского института стандартов, с декабря 2024 началась работа над проектом нового стандарта ISO/CD 25244 «Показатели эффективности работы архивов» (Archives performance indicators), см. https://www.iso.org/standard/89553.html .

Документ готовит рабочая группа WG12 «Международная архивная статистика» (International archive statistics) подкомитета SC8 «Качество - Статистика и оценка характеристик» (Quality - Statistics and performance evaluation, см. https://www.iso.org/committee/48826.html ) технического комитета ИСО TC46 «Информация и документация». 

В аннотации на проект говорится:

«Международный стандарт «Показатели эффективности работы архивов» планируется разработать в качестве продолжения стандарта ISO 24083:2021 «Информация и документация – Международная архивная статистика» (Information and documentation - International archives statistics, см. https://www.iso.org/standard/77765.html и https://www.iso.org/obp/ui/#!iso:std:77765:en , а также мой пост http://rusrim.blogspot.com/2021/05/iso-240832021.htmlН.Х.).

Задача нового стандарта - определить показатели эффективности, касающиеся качества архивных услуг, и распространить в архивном сообществе знания о методах проведения оценки эффективности.»

Несколько более подробно о проекте сказано на сайте американской Ассоциации информатики и технологий (Association for Information Science and Technology, ASIS&T – основана в 1937 году под названием «Американский институт документации» (American Documentation Institute, ADI). Позднее в 1968 году она была переименована в «Американское общество информатики» (American Society for Information Science, ASIS), а в 2000 году – в «Американское общество информатики и технологий». Современное название ассоциация получила в 2013 году, с целью отразить международный характер её деятельности. О ней см. также https://en.wikipedia.org/wiki/Association_for_Information_Science_and_Technology ):

«Проект стандарта ISO/CD 25244 «Информация и документация - эффективности работы архивов» содержит рекомендации для архивного сообщества по сбору и представлению статистических данных для следующих целей:

  • Стратегическое планирование и внутреннее управление архивами;

  • Агрегирование и сопоставление статистических данных об оперативной работе и эффективности на региональном, национальном и международном уровнях;

  • Представление отчетности заинтересованным сторонам, таким как финансирующие учреждения, политики, исследователи и широкая общественность;

  • Продвижение роли архивов и их ценности для развития обучения и исследований, образования и культуры, а также социальной и экономической жизни;

  • Совершенствование управления процессами, повышение прозрачности и поддержка хорошего стратегического управления.»

Источники: сайт ИСО / сайт BSI / сайт ассоциации ASIS&T
https://www.iso.org/standard/89553.html 
https://standardsdevelopment.bsigroup.com/projects/2024-02324 
https://www.asist.org/2025/08/08/iso-25244-archives-performance-indicators/ 

суббота, 29 ноября 2025 г.

Почему онтология является ключевым инструментом, поддерживающим хорошую практику управления документами и информацией, часть 4

(Окончание, предыдущую часть см. http://rusrim.blogspot.com/2025/11/3.html )

Почему основанный на полностью реляционной онтологии подход необходим для управления информацией и данными

В современном быстро меняющемся цифровом ландшафте используемые организациями способы управления информацией и данными могут определять успешность их деятельности. Хотя традиционные иерархические, таксономические модели долгое время служили основой для управления данными, они всё чаще оказываются недостаточными для того, чтобы справляться со сложностью и динамизмом современных сред данных. Альтернативный подход, основанный на полностью реляционной онтологии (fully relational ontology), обеспечивает гибкость, взаимосвязанность и адаптивность, которые необходимы для более эффективного управления информацией и данными.

Этот переход от жёсткой, нисходящей («сверху вниз») таксономии к динамичной, реляционной онтологии обусловлен несколькими ключевыми факторами. Необходимость в более глубоком контекстном понимании, в более глубоких взаимосвязях между элементами данных и в способности эволюционировать с появлением новых и нарождающихся технологий, такими как искусственный интеллект, делает реляционную онтологию гораздо более ценной.

Ограничения таксономического иерархического подхода

При таксономическом подходе к организации данных, информация упорядочивается по фиксированным, предопределённым категориям в рамках нисходящей иерархической структуры. Такой подход может работать в случае простых систем классификации, - однако в более сложных предметных областях, где взаимосвязи между сущностями многогранны и постоянно меняются, этот подход неэффективен.

В числе основных ограничений данного подхода можно назвать:

  • Негибкость: Таксономии, как правило, статичны. После проведения категоризации данных, таксономии сложно адаптировать к новой информации, взаимосвязям или к изменениям в способах использования или понимания данных.

  • Потеря контекста: Иерархические таксономии часто насильно втискивают данные в узкие категории, что может привести к потере богатых контекстных взаимосвязей, существующих между сущностями.

  • Чрезмерное упрощение: Реальные данные редко бывают такими чистыми и простыми, как предполагает таксономия. Сложные сущности часто относятся одновременно к нескольким категориям или же имеют связи, выходящие за рамки простых структур «родитель-потомок».

Так, например, в рамках таксономии организация может классифицировать всех своих сотрудников по ролям. Подобная простая структура, однако, не сможет отразить другие важные взаимосвязи, такие как взаимодействие между группами, области компетенции разных подразделений или же участие в проектах представителей различных служб и подразделений. Такой недостаток нюансов приводит к не вполне корректному пониманию ландшафта организации.

Сила подхода, основанного на полностью реляционной онтологии

Полностью реляционная онтология, напротив, формирует модель данных таким образом, чтобы отразить реальную сложность и взаимосвязанность сущностей реального мира. Вместо того, чтобы придерживаться жесткой иерархии, такая модель позволяет сформировать гибкую, подобную паутине структуру, в которой элементы данных связаны друг с другом посредством многочисленных, часто динамических ассоциаций.

Ключевые преимущества такого подхода включают:

  • Гибкость и масштабируемость: Реляционная онтология может эволюционировать вместе с организацией. По мере появления новых источников данных или новых взаимосвязей, онтология может легко адаптироваться без необходимости переклассифицировать все данные в рамках жёсткой иерархии.

  • Богатый контекст: Отражая взаимосвязи между сущностями в нескольких «измерениях», реляционная онтология обеспечивает гораздо более богатое представление информации, которое поддерживает более нюансные выявление данных, их анализ и принятие решений.

  • Соответствие реальному миру: В рамках полностью реляционной модели сущности не привязаны к однотипным «на все случаи жизни» категориям. Вместо этого каждая сущность рассматривается в контексте её разнообразных взаимосвязей - временных, географических, функциональных или тематических. Это отражает сложность систем и взаимодействий в реальном мире.

Почему реляционная онтология необходима для современного управления информацией и данными

Для организаций, управляющих большими объемами данных, подход, основанный на полностью реляционной онтологии, не просто предпочтителен - он жизненно необходим, и вот почему:

  • Управление сложностью: Современные предприятия имеют дело со сложно устроенными экосистемами данных, включающими структурированные и неструктурированные данные, мультимедийные ресурсы, взаимодействие с клиентами и информацию, генерируемую Интернетом вещей. Реляционная онтология способна управлять этими сложными взаимосвязями, позволяя отыскивать знания, которые таксономическая модель может упустить.

  • Поддержка семантического поиска и ИИ: Реляционные онтологии лежат в основе семантических поисковых систем и приложений искусственного интеллекта. Ввиду того, что они фиксируют взаимосвязи между элементами данных, они делаю возможными более интеллектуальные запросы, упрощая выявление релевантной информации и генерацию аналитических результатов и знаний. Системы искусственного интеллекта на основе онтологий могут использовать эту реляционную сеть для понимания контекста, рассуждений на основе данных и для выдачи более точных прогнозов и рекомендаций. 

  • Расширенная интероперабельность: Полностью реляционная онтология предоставляет единую концептуальную структуру, позволяющую данным из различных систем беспроблемно взаимодействовать. Это особенно важно в крупных организациях и при многостороннем сотрудничестве, где изолированность данных может снижать эффективность. Реляционная онтология способствует интероперабельности, позволяя данным из различных предметных областей эффективно взаимодействовать.

  • Динамичное стратегическое управление данными: Реляционный подход упрощает решение задач стратегического управления данными в мире, где постоянно меняются законодательство о защите персональных данных, требования безопасности и деловые потребности. Вместо ручного обновления иерархических категорий и политик, организации могут автоматизировать процессы стратегического управления на основе взаимосвязей между элементами данных. Например, если новый нормативный акт затрагивает данные, «привязанные» к определенному процессу, то реляционная онтология может мгновенно обновить протоколы стратегического управления для всех затронутых данных.

Почему не следует использовать таксономию? Аргументы против иерархических моделей в современных системах

Хотя таксономии хорошо зарекомендовали себя в более простых, статичных средах, однако в современных динамичных взаимосвязанных экосистемах данных их уже недостаточно.

  • Плохая адаптация к изменениям: В таксономической структуре добавление новых данных или же понимание новых взаимосвязей часто требуют полной перестройки иерархических структур. Например, при появлении новых технологий или бизнес-процессов, иерархии с трудом приспосабливаются к этим изменениям без проведения существенной реструктуризации.

  • Негибкость с точки зрения ИИ и машинного обучения: Системы ИИ процветают благодаря пониманию закономерностей, взаимосвязей и контекста. Иерархические таксономии ограничивают эти возможности посредством размещения данных по жёстким категориям, что затрудняет для ИИ выявление присущих данным тонких моментов и сложных взаимосвязей.

  • Фрагментация и избыточность: Иерархические системы часто приводят к фрагментации данных, когда близкие данные при классификации относят к разным частям таксономии, без установления между ними чётких связей. Это может привести к избыточности и неэффективности, поскольку информация, которую можно было бы связать между собой, остаётся разрозненной.

Стратегическая ценность реляционных онтологий для организаций, ориентированных на будущее

Внедрение подхода, основанного на полностью реляционных онтологиях, не только усиливает ныне используемые практики управления данными, но и обеспечивает организациям готовность к новым технологиям и вызовам будущего – следующим образом:

  • Адаптация систем ИИ к контексту организации: Реляционные онтологии обеспечивают возможность точно настраивать системы ИИ под уникальные процессы, потоки работ и культуру организации. Реализуя специфические взаимосвязи и структуры знаний, организации могут создавать модели ИИ, учитывающие контекст и обладающие высокой релевантностью.

  • Поддержка генеративного ИИ: Реляционная онтология критически важна для того, чтобы системы генеративного ИИ могли выдавать результаты, соответствующие контексту и культурным особенностям. Встраивая в модель сложные взаимосвязи и культурные нюансы, организации могут обеспечить порождение генеративным ИИ более точного и содержательного контента, соответствующего их специфическим потребностям.

  • Улучшенное принятие решений: При использовании реляционной онтологии принимающие решения лица могут запрашивать данные с разных точек зрения, выявлять скрытые взаимосвязи и делать обоснованный выбор, отражающий всю сложность ситуации.

Аргументы в пользу полностью реляционной онтологии

В современную эпоху управления информацией и данными подход, основанный на полностью реляционной онтологии, предлагает беспрецедентные преимущества по сравнению с традиционными таксономическими моделями. Он обеспечивает гибкость, контекстную глубину и адаптивность, необходимые при работе с современными сложными данными. Отказываясь от иерархических структур, организации могут разблокировать доступ к более ценным знаниям, улучшить интероперабельность, поддерживать инициативы в области ИИ и машинного обучения, а также обеспечить жизнеспособность своих стратегий управления данными в будущем, в условиях постоянно меняющегося ландшафта.

Реляционная онтология - это не просто более совершенный способ организации данных, а стратегическая необходимость для организаций, стремящихся максимизировать полезность своих информационных активов в эпоху ИИ и далее.

Выводы

По сути дела, как этичное стратегическое управление ИИ, так и традиционные практики управления документами и информацией направлены на ответственное и этичное обращение с данными. Они разделяют общие цели: обеспечение качества данных, защита персональных данных, соблюдение законодательно-нормативных требований, а также содействие прозрачности и подотчетности. По мере дальнейшей эволюции ИИ интеграция этих устоявшихся принципов управления документами и информацией в концепции стратегического управления ИИ будет иметь решающее значение для обеспечения этичного и ответственного использования ИИ. 

Требования к этичности и к стратегическому управлению ИИ - это не новые концепции, а, скорее, расширение сферы традиционного управления документами и информацией, этики и стратегического управления. Опираясь на эти устоявшиеся принципы управления информацией, защиты персональных данных и обеспечения подотчётности, организации могут разрабатывать и развёртывать системы ИИ, соответствующие общественным ценностям, исполняющие законодательно-нормативные требования и способствующие достижению справедливых результатов. 

По мере дальнейшей эволюции ИИ важность надёжных этических концепций и механизмов стратегического управления будет только возрастать, обеспечивая разработку и использование технологий ИИ на благо общества. Поэтому пришло время заново инвестировать в практику и возможности Вашей организации в сфере управления документами и информацией!

Стивен Кларк (Stephen Clarke)

Источник: сайт Substack
https://steffclarke.substack.com/p/the-convergence-of-ai-governance 

ИСО: Опубликован технический отчёт ISO/TR 56009:2025 «Менеджмент инноваций – Примеры реализации измерений эффективности инновационной деятельности»

Сайт Международной организации по стандартизации (ИСО) в августе 2025 года сообщил о публикации нового стандарта ISO/TR 56009:2025 «Менеджмент инноваций – Примеры реализации измерений эффективности инновационной деятельности» (Innovation management - Example implementations of innovation operation measurements) объёмом 62 страницы, см. https://www.iso.org/en/contents/data/standard/07/92/79286.html и https://www.iso.org/obp/ui/en/#!iso:std:79286:en .

Документ подготовлен техническим комитетом ИСО TC 279 «Менеджмент инноваций» (Innovation management).

Во вводной части стандарта отмечается:

«В настоящем документе приводятся иллюстративные примеры того, как организации различных типов, размеров и с разными целями инновационной деятельности могут осуществлять измерения эффективности инновационной деятельности с использованием стандарта ISO 56008.

Мой комментарий: Речь идёт о стандарте ISO 56008:2024 «Менеджмент инноваций - Инструменты и методы измерения инновационной деятельности – Руководство» (Innovation management - Tools and methods for innovation operation measurements – Guidance, см. https://www.iso.org/standard/78485.html и https://www.iso.org/obp/ui/en/#!iso:std:78485:en ). О нём также см. мой пост http://rusrim.blogspot.com/2024/06/iso-560082024.html .

Настоящий документ может быть использован:

  • Организациями, стремящимися сформировать и внедрить подход к измерению эффективности инновационной деятельности;

  • Организациями и заинтересованным сторонам, стремящимся улучшить подотчётность, прозрачность и оценку эффективности инновационной деятельности на основе фактических данных;

  • Поставщикам услуг обучения в области инновационной деятельности и измерений, включаящими оценку и консультирование с целью достижения результатов;

  • Экспертами в области оценки эффективности инновационной деятельности и оценки её воздействия, предпочитающими использовать гармонизированный международный стандарт.»

Содержание стандарта следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Компания среднего размера: Пример измерения эффективности инновационной деятельности в сфере услуг
5. Некоммерческая организация: Пример измерения эффективности инновационной деятельности в сфере социальных услуг
6. Государственная организация: Пример измерения эффективности инновационной программы
7. Малые и средние предприятия: Пример измерения эффективности инновационной деятельности, касающейся новой бизнес-модели
8. Отделившаяся компания: Пример измерения эффективности технологических инноваций
9. Крупная компания: Пример измерения эффективности инновационного портфеля
Библиография

Источник: сайт ИСО
https://www.iso.org/en/contents/data/standard/07/92/79286.html 
https://www.iso.org/obp/ui/en/#!iso:std:79286:en 


пятница, 28 ноября 2025 г.

Почему онтология является ключевым инструментом, поддерживающим хорошую практику управления документами и информацией, часть 3

(Продолжение, предыдущую часть см. http://rusrim.blogspot.com/2025/11/2_01430022444.html )

Интеграция эпистемологии, тавтологии и семантики в проектировании онтологий:

  • Эпистемология формирует то, каким образом знания представляются, проверяются и организуются в онтологии, обеспечивая, что онтология отражает способ структурирования знаний в реальном мире.

  • Тавтология обеспечивает логическую согласованность внутри онтологии, позволяя избежать циклических определений и поддерживая надежную рамочную структуру, в рамках которой сущности и взаимосвязи логически обоснованы и не являются избыточными.

  • Семантика придает смысл понятиям и взаимосвязям в онтологии, обеспечивая эффективное информационное взаимодействие между системами и давая машинам возможность интерпретировать данные подобно человеку.

Ценность онтологии для ИИ: Улучшение управления информацией и данными, адаптация ИИ к культурным контекстам

В сфере искусственного интеллекта невозможно переоценить важность структуры и представления данных. Онтологии, предоставляющие структурированную основу для организации информации, могут быть весьма полезны как в управлении данными, так и в приложениях ИИ. 

Онтологии описывают взаимосвязи и понятия в рамках предметной области, обеспечивая машинам возможность понимать информацию, обрабатывать её и рассуждать на её основе. Ценность онтологии в области управлении информацией и данными уже давно признана, а в сфере ИИ её применение особенно актуально для развития генеративного ИИ (GenAI) в различных культурных контекстах и для тонкой настройки больших языковых моделей (LLM). 

Мы наблюдаем эту проблему на примере различных генеративных предобученных преобразователей (трансформеров) (Generative Pre-trained Transformers, GPT) в различных культурах – таких, например, как Mistral из Евросоюза, DeepSeek из Китая или ChatGPT из США. Лежащие в основе культурные, социально-политические и общественные точки зрения всё чаще представляют собой новый «передний край» в понимании контекста информации в областях с различной культурой (см. ниже).

1. Традиционные преимущества: Применение онтологий в управлении данными и информацией

Прежде чем углубляться в роль онтологии в сфере ИИ, необходимо понять основополагающую ценность онтологии в управлении данными и информацией. Онтологии повышают согласованность, качество и отыскиваемость данных посредством создавая общего семантического слоя для всех систем и групп. Результатом этого является:

  • Повышение качества данных: Онтологии устанавливают чёткие и ясные определения понятий, обеспечивая единообразную структуризацию и семантическую согласованность данных в разных системах. Это напрямую способствует повышению качества данных, поскольку исключает неоднозначность и неверную интерпретацию.

  • Повышение интероперабельности: Посредством использования общей понятийной структуры, онтология поддерживает органичную интеграцию данных в различных системах. Это особенно ценно для крупных организаций, где информация часто хранится в разрозненных изолированных хранилищах.

  • Эффективное стратегическое управление данными: Онтологии помогают осуществлять стратегическое управление данными посредством чёткого определения правил, ролей и взаимосвязей между элементами данных, упрощая тем самым управление доступом, исполнение законодательно-нормативных требований и обеспечение безопасности.

  • Более эффективное обнаружение знаний: Благодаря реализации онтологии, организации могут использовать расширенные возможности поиска и рассуждений. Пользователи могут запрашивать данные более сложными способами, выявляя взаимосвязи и получая выводы, которые могут быть не очевидными при традиционном поиске по ключевым словам.

Эти традиционные преимущества обеспечивают прочную основу для управления информацией и данными. Однако ценность онтологии для приложений ИИ выходит за эти рамки, особенно когда речь идет об адаптации моделей ИИ к культурной чувствительности и к контексту организации.

2. Роль онтологии при использовании генеративного ИИ в рамках различных культур

Одной из наиболее существенных проблем для моделей генеративного ИИ (GenAI) является эффективная работа в различных культурных контекстах. Модели генеративного ИИ - например те, что основаны на больших языковых моделях - обычно обучаются на отражающих глобальные тенденции обширных наборах данных, которые часто отличаются предвзятостью в пользу доминирующих языков и культурных норм. Онтологии могут помочь с решением этой проблемы посредством создавая культурно-специфических концептуальных рамок, определяющих ключевые понятия, практики и варианты использование языка. Онтологии могут дать возможность сопоставлять концептуальное понимание с культурно-специфическими понятиями; однако эта возможность пока что лишь нарождается в отрасли ИИ.

Так, например, адаптированная к конкретному культурному контексту онтология может использоваться для обучения системы ИИ нюансам информационного обмена, а также нормам и ценностям, которые являются уникальными для этой культуры. Встраивая онтологии в структуру рассуждений модели ИИ, системы генеративного ИИ могут порождать ответы, контент или знания, которые учитывают культурные особенности и являются уместными в соответствующем контексте. Это особенно ценно в таких приложениях, как поддержка клиентов, создание контента и принятие решений в глобальном масштабе.

Онтологии также помогают избежать недопонимания, возникающего из-за культурных различий. Например, ИИ может сгенерировать текст, который хотя и кажется точным с глобальной точки зрения, способен непреднамеренно оскорбить или оттолкнуть пользователей в конкретной культурной среде из-за различий в социальном или историческом контекстах. Руководствуясь онтологиями, системы ИИ могут более эффективно справляться с подобными сложностями, обеспечивая инклюзивность и уважение многообразия.

3. Адаптация предварительно обученных универсальных моделей 

Большие языковые модели, такие как ChatGPT-4o, обучаются на огромных обобщенных наборах данных, что позволяет им эффективно выполнять широкий спектр задач. Однако для того, чтобы организации могли извлечь максимальную пользу из этих моделей, их необходимо точно настроить на конкретный контекст - как контекст организации, так и культурный контекст.

Именно здесь на помощь приходит онтология. Разрабатывая онтологию организации, отражающую специфическую терминологию, процессы и взаимосвязи внутри деловой деятельности, организации могут адаптировать предварительно обученные универсальные модели для лучшего соответствия своим собственным структурам знаний и потребностям оперативной деятельности.

Рассмотрим научно-исследовательскую организацию с узкоспециализированной областью знаний. Универсальная языковая модель не будет в точности понимать технический язык и взаимозависимости в этой области. Однако, используя онтологию организации, ИИ сможет лучше понимать эти нюансы, что позволит получать более релевантные результаты и лучше оказывать поддержку при принятии решений.

Помимо этого, тонкая настройка на основе онтологии может помочь организациям встроить свои внутренние политики, ценности и критически важные для её миссии цели в модели ИИ. Это позволит обеспечить, что любая автоматизация ил любые процессы принятия решений на основе ИИ будут соответствовать стратегическим приоритетам организации, тем самым минимизируя риски и повышая эффективность.

4. Практические последствия для разработки и использования ИИ

Используя онтологии, организации могут добиться более приспособленного к их нуждам и более интеллектуального использования ИИ. В числе практических последствий применения онтологий можно назвать:

  • Расширенная персонализация: Онтологии дают возможность большим языковым моделям (LLM) генерировать более релевантные, контекстно-ориентированные результаты, - будь то задача взаимодействия с клиентами, внутренний информационный обмен или стратегический анализ.

  • Улучшенное взаимодействие и сотрудничество между командами и группами: Онтология может послужить в качестве общей концептуальной структуры знаний, помогая междисциплинарным группам более эффективно взаимодействовать и совместно работать над инициативами в области ИИ, основываясь на общем понимании.

  • Этичный ИИ: Онтологии помогают организациям разрабатывать системы ИИ, которые являются более культурно-чувствительными, более этичными и лучше соответствующими их ценностям. Это особенно важно для предотвращения предвзятости и обеспечения справедливого и инклюзивного применения ИИ.

  • Более быстрое получение деловой отдачи: Благодаря онтологиям организации могут ускорить адаптацию и тонкую настройку моделей ИИ. Время и усилия, необходимые для адаптации универсальной большой языковой модели (LLM) к потребностям организации, значительно сокращаются, что позволяет коммерческим организациям быстрее получать деловую отдачу от ИИ.

Стратегическая ценность онтологий для ИИ

Ценность онтологий для ИИ выходит за рамки их традиционной полезности для управления данными и информацией. Онтологии позволяют организациям настраивать универсальные модели ИИ, такие как GPT и LLM, делая их более релевантными и эффективными в конкретных культурных и организационных контекстах. Используя онтологии, коммерческие организации могут раскрыть весь потенциал ИИ, обеспечивая не только интеллектуальность этих систем, но и учёт ими культурных особенностей, соответствие контексту и согласованность со стратегическими целями и ценностями. Эта способность будет приобретать всё большее значение по мере того, как ИИ будет всё шире использоваться в глобальной оперативной деятельности, в процессах принятия решений и в инновациях.

(Окончание следует, см. http://rusrim.blogspot.com/2025/11/4.html )

Стивен Кларк (Stephen Clarke)

Источник: сайт Substack
https://steffclarke.substack.com/p/the-convergence-of-ai-governance 

Мой доклад на ежегодной клиентской конференции компании ЭОС «Осенний документооборот 2025»

31 октября 2025 года на ежегодно проводимой компанией «Электронные офисные системы» (ЭОС) клиентской конференции «Осенний документооборот – 2025: Вызовы и возможности управления документами в цифровой среде» я выступила с докладом «Тенденции перемен в положениях законодательства, касающихся управления документами и информацией в 2025 году».

В докладе дана оценка трех ключевых тенденций:

  • Создание отраслевых государственных информационных систем (ГИС),

  • Установление сроков хранения не только для документов, но и для информации,

  • Установление обязанностей для организаций по хранению больших объемов разнообразной информации.

Создание отраслевых государственных информационных систем (ГИС) для организаций означает:

  • Обязанность подключения и передачи данных: Компании и госорганы обязаны подключаться к ГИС и в оперативном режиме передавать в них предусмотренную законом информацию;

  • Сокращение объёмов бумажного документооборота: В идеале это должно привести к «бесшовному» обмену данными между ведомствами и бизнесом, уменьшив необходимость предоставления одних и тех же данных многократно;

  • Риск административного давления: Неподключение или несвоевременная передача данных в ГИС могут повлечь штрафы и санкции, вплоть до приостановлении деятельности.

Установление сроков хранения не только для документов, но и для информации для организаций влечёт за собой:

  • Пересмотр политик хранения: Необходимо будет определить, какие информационные системы содержат данные, имеющие правовую, деловую и информационную ценность и подлежащие хранению в течение установленных сроков;

  • Усложнение ИТ-инфраструктуры: Потребуются решения для архивации и обеспечения долговременной сохранности и доступности больших массивов структурированных и неструктурированных данных, а не только традиционных документов

Установление обязанностей для организаций по хранению больших объемов разнообразной информации для организаций означает:

  • Затраты: Необходимость строить и обслуживать дата-центры, системы резервного копирования и архивирования, соответствующие требованиям регулятора (ФСТЭК, ФСБ); необходимость закупки ПО, обучения персонала и т.д.;

  • Проблема «цифрового мусора»: Возникает сложность в отделении ценной информации от ненужных данных. Требуются системы классификации и управления жизненным циклом информации;

  • Повышенные требования к безопасности: Длительное хранение больших объемов данных увеличивает риски утечки конфиденциальной информации, нарушения законодательства о ПДн - что требует дополнительных инвестиций в кибербезопасность.

Видеозапись моего доклада выложена по адресу https://rutube.ru/video/6962cbcbb72b7f9f9e0491e69e7edf76/ :


Презентация к докладу доступна по ссылке: https://disk.yandex.ru/i/pJnSqiuitRi4YA  

Полную видеозапись конференции можно посмотреть здесь: https://rutube.ru/video/1a4686e4115e872241ce4114b4a23410/ 

Источник: Rutube / Яндекс-Диск
https://rutube.ru/video/6962cbcbb72b7f9f9e0491e69e7edf76/    
https://disk.yandex.ru/i/pJnSqiuitRi4YA 

четверг, 27 ноября 2025 г.

Почему онтология является ключевым инструментом, поддерживающим хорошую практику управления документами и информацией, часть 2

(Продолжение, начало см. http://rusrim.blogspot.com/2025/11/1_02116716694.html )

Стандартизация корпоративной деловой информации

Применяя основанный на онтологиях подход, организации могут заложить стандартизированный фундамент для управления документами, избавляясь от несоответствий и обеспечивая единообразное применение ИИ-процессов во всех деловых подразделениях и в различных регионах. Основанный на онтологиях подход к управлению документами и информацией также обеспечивает основу для интероперабельности между организациями и может обеспечить формирование согласованной схему метаданных и системы классификации данных как для информационных систем, используемых несколькими организациями, так и для «озёр данных».

Данный подход также позволяет использовать централизованный словарь данных, «деловую таксономию» или хранилище терминов. Благодаря этом в случае добавления нового элемента, или же в случае удаления или изменения термина, изменения могут применяться глобально во всей экосистеме данных, а не только локально в рамках конкретного изолированного хранилища, отдельного экземпляра или подмножества корпоративной информации и экосистемы данных.

Роль графов знаний в управлении документами на основе онтологий

Мой комментарий: Граф знаний - это способ хранить информацию в виде сети («графа»), узлы которого - это конкретные сущности (люди, места, события, понятия и т.д.), а связи (соединяющие узлы линии) - это отношения между сущностями. Такая структура позволяет компьютерам и людям легко выявлять сложные взаимосвязи и понимать контекст в виде «паутины» взаимосвязанных фактов. Графы знаний, в частности, являются основой для интеллектуального поиска или для генерирования рекомендаций.

Графы знаний играют очень важную роль в реализации управления документами на основе онтологий для ИИ. Они служат практичным, динамичным представлением онтологии, позволяя системам ИИ взаимодействовать со структурированными отношениями между документами и взаимосвязанными с ними данными, делать на их основе выводы и/или визуализировать их.

Динамическое представление данных

Графы знаний служат гибким и динамичным способом представления определенных в онтологии взаимосвязей и иерархий. Они организуют информацию в виде узлов (сущностей) и ребер (связей), что позволяет ИИ легко просматривать сложные структуры данных и выполнять по ним запросы. Тем самым обеспечивается согласованная основа для внедрения автоматизации управления документами и для повышения уровня зрелости.

Эта динамическая природа делает возможным непрерывное обновление и интеграцию новых данных, поддерживая эволюционирующие потребности организации, а также способствуя повышению зрелости и расширению возможностей управления документами и информацией.

Способствование выполнению сложных запросов и аналитике

Графы знаний позволяют системам ИИ выполнять сложные, контекстно-зависимые запросы, такие как выявление взаимосвязей между документами или выявление тенденций в наборах данных. Это особенно полезно для адекватного применения политик управления документами и информацией и для проведения экспертизы ценности.

Подход к управлению документами на основе онтологий позволяет деловым системам ИИ выдавать результаты, опираясь на четкое, структурированное и семантически насыщенное понимание документов, - что способствует интероперабельности, исполнению законодательно-нормативных требований, контекстной точности и масштабируемости. Такой подход обеспечивает способность систем ИИ эффективно управлять документами, одновременно поддерживая этичные и объяснимые практики при вводе запросов. Эта структурированная методология незаменима для достижения надежных, устойчивых и жизнеспособных реализаций ИИ в сфере управления документами, особенно при использовании подхода на основе запросов при применении политик управления документами, таких как, например, политики в отношении сроков хранения и проведения уничтожения.

Онтология как основополагающий элемент поддержки моделей проектирования ИИ

Онтология для моделей данных и информации использует для улучшения структуры, смысла и взаимосвязей данных такие концепции, как эпистемология, тавтология и семантика. Эти философские и лингвистические концепции играют свою роль следующим образом:

1. Эпистемология (учение о знаниях):

В контексте моделей данных и информации, эпистемология изучает, каким образом знания структурируются, приобретаются и проверяются в рамках системе на семантическом уровне. Онтологии используют эпистемологические принципы для обеспечения того, что данные не просто хранятся, но и имеется понимание их смысла и источников. Сюда входит:

  • Представление знаний: Определение взаимосвязей между сущностями, и концепции представления знаний таким образом, чтобы их могли понимать как люди, так и машины. Это помогает системам различать между тем, «что мы знаем», и тем, «откуда мы это знаем».

  • Утверждения и выводы: Онтологии позволяют проводить логические рассуждения, в рамках которых новые знания могут быть выведены из существующих данных. Эпистемология помогает обеспечивать поддержку структурами данных получения обоснованных выводов и принятия обоснованных решений.

  • Возможность доверять: Эпистемология обеспечивает ясность происхождения данных (откуда они берутся и как они были получены), что позволяет оценить достоверность информации.

2. Тавтология (логическая истинность и неизбыточность):

Мой комментарий: Автор, как мне кажется, использует термин «тавтология» несколько нестандартным образом. Обычно же термин «тавтология» понимается как повторение близких по смыслу или однокоренных слов, а также повторение одной и той же мысли другими словами, что приводит к избыточности в речи или тексте. Тавтологией в логике называется тождественно истинное высказывание

Тавтология в онтологии обеспечивает логическую согласованность и отсутствие избыточности для взаимоотношений и определений. Это важно для:

  • Согласованности определений: Онтологии должны избегать тавтологических определений (где термины определяются через самих себя), обеспечивая ясность и избегая циклических рассуждений во взаимоотношениях данных.

  • Логической целостности: Хотя в естественном языке тавтологии часто считаются избыточностью, в формальной логике она может обеспечить то, что некоторые утверждения всегда будут истинны (например, «собака — это собака»). При проектировании онтологий тавтологические правила помогают поддерживать логическую целостность системы, обеспечивая правильную непротиворечивую классификацию любой сущности.

  • Минимизации избыточности: Хорошо построенная онтология минимизирует тавтологическую (избыточную) информацию во избежание неэффективности и путаницы, обеспечивая уникальность и целесообразность определения каждого понятия.

3. Семантика (смысл понятий и взаимосвязей):

Семантика играет центральную роль в онтологиях, поскольку её основная цель - создание модели смысла данных и информации. Семантика фокусирует внимание на том, как определяются и трактуются понятия, термины и взаимосвязи. Онтологии используют семантические принципы несколькими способами:

  • Определение терминов и понятий: Семантика обеспечивает, что каждый термин и понятие в рамках онтологии имеет чёткое, согласованное значение. Это крайне важно для обеспечения общего понимания, разделяемого различными системами и людьми.

  • Установление связей между сущностями: Семантика в рамках модели онтологии определяет, каким образом сущности связаны друг с другом (примером могут служить связи «часть-целое», «тип-экземпляр», «причина-следствие»). Это позволяет системам интерпретировать смысл данных, а не рассматривать их как изолированные факты.

  • Устранение неоднозначности: Семантика помогает различать омонимы (слова с несколькими значениями) и синонимы (различные слова с одинаковым значением), обеспечивая правильное отражение моделью данных смысла в данном контексте. 

  • Формальная семантика: Онтология использует формальную логику для определения взаимосвязей (отношений) между сущностями, позволяя системам осмысливать данные и выводить новые значения или факты на основе смоделированных взаимосвязей.

(Продолжение следует, см. http://rusrim.blogspot.com/2025/11/3.html )

Стивен Кларк (Stephen Clarke)

Источник: сайт Substack
https://steffclarke.substack.com/p/the-convergence-of-ai-governance 

Читая новый австралийский стандарт AS 5393:2025 «Управление документами и информацией - Миграция авторитетных данных, информации и документов между системами» (4)

(Окончание)


На диаграмме 3.2.2 показано высокоуровневое концептуальное видение процесса миграции

О сфере охвата процесса миграции в п.4.2 говорится:

«Необходимо проводить консультации с соответствующими заинтересованными сторонами, а также оценки в интересах определения набора целей для различных типов документов, в рамках которых могут рассматриваться следующие аспекты:
  • Определение того, какие активные документы необходимо перенести в новую систему, а также того, какая неактивная деловая информация может быть сделана доступной иными способами.

  • Определение того, какие документы должны оставаться доступными после миграции, и в каких системах продолжится хранение этих документов.

  • Определение того, какие документы и почему не требуют миграции, и есть ли возможность сохранения надлежащей доступности не подлежащих миграции документов. Если, например, принято решение не мигрировать неактивные/закрытые дела и документы, - то возможно ли, выведя из эксплуатации программное решение, всё же сохранить доступ к базовым таблицам данных и контенту с использованием программ просмотра или с помощью нового программного решения? Требования к не подлежащим миграции документам включают сохранение целостности этих документов. Также допускается возможность проведения авторизованного уничтожения таких документов (возможно, в другой системе).

  • Определение того, какие документы не будут мигрироваться из-за истечения срока их хранения. Следует рассмотреть вопрос об уничтожении таких документов.

  • Определение того, какие документы необходимо мигрировать и какой процесс будет использоваться для их миграции.
Предположим, например, что необходимо провести оценку как крупномасштабной автоматической миграцию, так и ручной миграции отдельных документов силами отдельных сотрудников. Процесс оценки необходимо документировать с целью обеспечения прозрачности и документирования принятых решений.

Крайне важно поддерживать целостности документов во время миграции. Ключевыми факторами поддержания целостности документов во время миграции являются:
  • Установление требований к документам в процессе миграции, обеспечивающих целостность документов, включая выделение метаданных, неизменность которых следует обеспечить; установление требований к обеспечению целостности и доступности документов в новой системе; а также реализация процесса авторизованного уничтожения документов в новой системе.

  • Проектирование и тестирование процесса миграции с целью обеспечить сохранение целостности документов, включая ключевые метаданные.

  • Проведение уничтожения тех документов в исходной системе, которые были заменены мигрированными (и, следовательно, продублированными) документами в новой системе.
Необходимо разработать документацию по проведению оценки целостности в поддержку связанных с обеспечением целостности решений.»

Наконец, в разделе 5.3 обсуждается один из наиболее часто встречающихся вариантов миграции – миграция документов из одной программной системы в другую:

«Переход из одной программной системы в новую - это относительно прямолинейный процесс миграции, сопряженный с определенными рисками, которые могут быть смягчены посредством отображения метаданных и тестирования.

Процесс миграции включает два элемента:
  • Миграцию базы данных (т.е. метаданных),

  • Миграцию хранилища документов.
После установления соответствия (связей) между исходными и целевыми элементами, база данных извлекается в исходном формате и мигрируется. Даже при наличии точного соответствия метаданных одной системы метаданным другой, возможны некоторые трансформации элементов базы данных. Например, допустимое количество символов в определённом поле в целевой системе может оказаться меньше, и в этом случае потребуется проведение определенной обработки (преобразования) перед загрузкой данных в целевое поле.

Миграция файлов документов включает их извлечение:
  • либо посредством создания копии хранилища файлов документов и восстановления связей на основе базы данных содержащей метаданные); 

  • либо посредством их извлечения из хранилища файлов документов и загрузки во вновь созданное хранилище файлов документов.
Существует некоторый риск того, что новая целевая система может не поддерживать все файловые форматы документов исходной системы. В таких случаях, подобно трансформации на уровне базы данных, перед загрузкой в новую систему может потребоваться изменение файловых форматов документов.

В случае создания копии хранилища документов, исходные документы или исходное хранилище документов обычно удаляются после завершения обновления системы. Уничтожение исходных документов должно производиться после того, как результаты предварительного тестирования и результаты тестирования по завершении миграции докажут успешное проведение миграции аутентичных, полных, доступных и пригодных к использованию документов. Исходные документы обычно хранятся после миграции в течение соответствующего периода времени, позволяющего убедиться в успешности миграции. Сроки хранения исходных документов установлены в перечнях видов документов с указанием сроков их хранения и соответствующих политиках уничтожения документов.»

Если давать оценку австралийскому стандарту в целом, то впечатление о нём двойственное:
  • Это востребованный - и самый современный - документ, один из немногих имеющихся по теме миграции. В нём имеется немало интересных идей, особенно в плане мотивации для проведения миграции, пользы от миграции и связанных с ней рисков. Он будет полезен всем, кто хотел бы глубже разобраться в различных аспектах миграции. Было бы полезно полностью перевести его на русский язык;

  • С одной стороны, в стандарте недостаточно акцентируется внимание на высокоуровневых вопросах, способных привлечь внимание высшего руководства и убедить его поддержать программы миграции посредством выделения финансов, кадров и ресурсов. С другой стороны, он не содержит детальных рекомендаций по проведению миграции. Как следствие, получился интересный документ, который, однако, сложно непосредственно использовать как при взаимодействии с высшим руководством, так и в практической работе.
Источник: сайт «Стандартов Австралии»
https://store.standards.org.au/product/as-5393-2025

среда, 26 ноября 2025 г.

Почему онтология является ключевым инструментом, поддерживающим хорошую практику управления документами и информацией, часть 1

В этом посте я продолжаю выкладывать перевод статьи бывшего Главного архивиста Новой Зеландии, ныне консультанта в сфере искусственного интеллекта, машинного обучения и управления информацией и данными Стивена Кларка (Stephen Clarke), которая была опубликована 18 июля 2025 года на сайте Subctack.

(Продолжение, предыдущую часть см. https://rusrim.blogspot.com/2025/10/3.html )

Мой комментарий по поводу терминов:

Онтология – дисциплина, которая пытается описать и систематизировать, что именно «существует» в определенной области реальности или мышления. В философии онтология изучает самые общие категории бытия (вещи, свойства, процессы, пространство, время). В информатике и других науках предмет онтологии - это структурированный словарь или схема понятий и их связей в конкретной предметной области, которые помогают четко определить смысл терминов, их взаимосвязи, и способствуют обмену относящейся к данной предметной области информацией без какой-либо путаницы. Онтология показывает, из каких «кирпичиков» состоит знание о мире или его части, и как они «складываются» вместе.

В стандарте ISO/IEC/IEEE 24765:2017, п. 3.2691, дано следующее определение (также приведенное в ПНСТ 837-2023, п.3.1): «Онтология (ontology): логическая структура терминов, используемых для описания области знаний, включая как определения применяемых терминов, так и отношения между ними.»

Согласно определению, данному в ГОСТ Р ИСО/МЭК 11179-5-2012, п. 3.14, «Семантика (semantics): Часть лингвистики, имеющая дело со смыслом слов».

В стандарте ГОСТ Р 54136-2010, п. 4.67, дано определение: «Семантика (semantics): Смысл заданного понятия».

При внедрении хороших практик этичного искусственного интеллекта (ИИ) крайне важно использовать основанный на онтологии подход к управлению документами и информацией, поскольку он создает структурированную семантическую основу, обеспечивающую согласованность, полноту и интерпретируемость в сложных системах. 
Основные аргументы в пользу такого подхода следующие:

Семантическая интероперабельность

Системы ИИ часто оперируют с многообразными наборами данных и источниками информации. Онтология предоставляет общий словарь и стандартизированную структуру для представления данных, обеспечивая беспроблемную интеграцию различных систем и доменов. Онтология обеспечивает согласованную и осмысленную интерпретацию искусственным интеллектом документов из разнородных источников, позволяя избежать неверного толкования и изолированности информации/данных.

Улучшенное понимание информации в соответствующем контексте

Онтологии определяют взаимосвязи между сущностями, атрибутами и процессами в документах, предоставляя системам ИИ обширную контекстную информацию, способствующую точному пониманию и анализу информации, а также применению систем классификации, политик и использованию дополнительных контекстных метаданных. Это расширяет возможности ИИ в плане принятия решений, поскольку система ИИ становится способной улавливать нюансы смысла и внутренне присущие документам взаимосвязи, - и может документировать эти контекстные взаимосвязи, а также создавать заслуживающие доверия свидетельства процессов принятия решений.

Улучшенное стратегическое управление данными и исполнение законодательно-нормативных требований

При управлении документами обычно требуется обеспечить соблюдение конкретных законодательно-нормативных требований и политик организации. Онтологии могут использоваться для кодирования правил и систем классификации, соответствующих этим требованиям, что упрощает для ИИ автоматическое выполнение процедур и политик обеспечения соответствия требованиям, таких как правил управления доступом, протоколов защиты персональных данных, а также действий по установлению и отслеживанию сроков хранению, уничтожению/передаче данных и установлению/снятию временных запретов на уничтожение (legal holds). Это особенно ценно в таких отраслях, как здравоохранение, финансы и юриспруденция, где соблюдение законодательно-нормативных требований имеет критически-важное значение.

Эффективные классификация, поиск и извлечение документов

Подходы, основанные на онтологиях, позволяют ИИ более эффективно классифицировать и отыскивать документы, используя как иерархическую, так и реляционную структуру информации, - и обеспечивают основу для автоматизации этих процессов. Тем самым обеспечивается, что релевантные документы будут выявляться на основе их смысла и контекста, а не просто на основе поиска по ключевым словам, - что повышает точность и эффективность поиска для пользователей, а также улучшает управление доступом, контроль версий, а также позволяет избежать дублирования.

Управление жизненным циклом и отслеживание происхождения

Управление жизненным циклом документов (включающим, например, создание, использование, хранение и уничтожение) является краеугольным камнем управления документами. Онтологии могут предоставлять чёткие определения и потоки работ для этих процессов, тем самым давая ИИ возможность автоматизировать и контролировать их. Концептуальные рамки на основе онтологий также облегчают отслеживание происхождения, обеспечивая прозрачность и подотчетность того, как документы используются системами ИИ модифицируются ими. Это крайне важно для внедрения практики управления записями и информацией в деловых системах ИИ. 

По мере того, как мы приближаемся к новой эре «континуального» мышления и выходим за рамки линейной однонаправленной модели жизненного цикла, возможность документирования происхождения в сложных многосущностных отношениях становится все более проблематичной - и ещё более важной для эффективного отслеживания и сбора метаданных о происхождении и их сохранения во времени как части контекста документов.

Содействие развитию объяснимого ИИ 


Объяснимость крайне важна для систем ИИ, особенно в приложениях высокой важности / риска. Основанный на онтологиях подход к управлению документами упрощает отслеживание и объяснение решений ИИ, увязывая их с хорошо структурированными, семантически насыщенными источниками данных. Это повышает доверие к системам ИИ и позволяет заинтересованным сторонам эффективно проводить аудит решений и сохранять заслуживающие доверия, точные, аутентичные и пригодные для использования документы об этих деловых процессах.

По сути дела, мы не можем обеспечить подотчётность, стратегическое управление, аудит или же этичный/объяснимый ИИ без возможности доступа к документированным входным и выходным данным, алгоритмам, обучающим данным, методам обучения, решениям и последующим действиям. Документы, касающиеся процесса обеспечения качества базовых данных, логики и производительности механизма логического вывода имеют решающее значение для понимания конечных результатов, выданных в ответ на запрос к ИИ или в ходе процесса, а также для выявления любых потенциальных предвзятостей и неточностей.

Масштабируемость и адаптивность

Системам ИИ часто приходится адаптироваться к новым областям применения, типам данных и нормативно-правовым средам. Онтологии могут быть расширены или модифицированы для включения новых знаний без нарушения существующих структур. Это делает концептуальную структуру управления документами масштабируемой и жизнеспособной в перспективе, способной адаптироваться к росту возможностей ИИ и сложности данных, - а также обеспечивает возможность расширения в глобальном масштабе, охватывая различные географии, языки и культурные концепции.

Решение этических проблем

Этичное использование ИИ требует прозрачности, подотчетности и минимизации предвзятости. Онтологии могут быть использованы для формулирования этических принципов и ограничений непосредственно в концептуальной структуре управления документами и в информационной архитектуре, предписывая системам ИИ функционировать в этих рамках и сохраняя документы для целей подотчетности и в качестве доказательств.

(Продолжение следует, см. http://rusrim.blogspot.com/2025/11/2_01430022444.html )

Стивен Кларк (Stephen Clarke)

Источник: сайт Substack
https://steffclarke.substack.com/p/the-convergence-of-ai-governance 

Читая новый австралийский стандарт AS 5393:2025 «Управление документами и информацией - Миграция авторитетных данных, информации и документов между системами» (3)

(Продолжение, предыдущую часть см. https://rusrim.blogspot.com/2025/11/as-53932025-2.html )

В п.2.2 описаны типы миграции:

«Типы миграции включают следующие (не ограничиваясь ими):

  • Переход с одной версии программной системы на новую версию той же программной системы;

  • Переход с одной программной системы на новую программную систему;

  • Переход с существующего формата данных на новый формат данных; [Это конверсия – Н.Х.]

  • Вывод системы из эксплуатации и миграция документов в новую систему;

  • Интеграция систем и миграция контента между системами;

  • Переход с сетевых дисков на новую программную систему; 

  • Управление проприетарными форматами. [Это вопрос конверсии – Н.Х.]

  • Миграция на системы поставщиков услуг и обратно.»

О пользе миграции в п.2.3 сказано:

«При миграции документов появляются различные возможности для улучшения посредством совершенствования используемых процессов, внедрения новых технологий с целью повышения производительности, а также посредством уничтожения документов с истекшими сроками хранения. Ниже приведены соответствующие примеры:

  • Новые технологии, такие как машинное обучение и искусственный интеллект (ИИ), позволяют документировать контекст (условия ведения деловой деятельности – Н.Х.) и «родословную» документов, что позволяет установить происхождение и отследить источник и/или историю конкретного документа.

  • Непрерывность деловой деятельности службы управления документами может быть лучше обеспечена посредством успешного внедрения и использования политики управления документами.

  • Модель информационной безопасности может быть согласована с текущими и будущими деловыми требованиями, обеспечивая улучшение и поддержание возможностей доступа и использования.

  • Увеличение выручки за счёт экономии на затратах на хранение, трудозатратах и ресурсах, требуемых для поддержания увеличенной емкости и расширенных зон хранения.

  • Улучшение проектов и бюджетов в плане стоимости, трудозатрат и ресурсов, а также совершенствование систем и технологий с целью обеспечить поддержку и обслуживание новейших технологий.

  • Улучшение способности принимать решения в средах, способных управлять документами; а также исполнение законодательно-нормативных требований.»

В п.4.2.1 рассматриваются риски, с которыми сталкиваются проекты миграции:

«Проекты миграции могут быть связаны с высокими рисками по следующим причинам (список не является исчерпывающим):

  • Недостаточное понимание как прежней системы, так и новой платформы, на которую происходит миграция;

  • Отсутствие планирования, бизнес-анализа и экспертизы ценности мигрируемых документов;

  • Отсутствие соответствующих компетенций и опыта, необходимых для понимания документов и необходимости сохранения их характеристик;

  • Недостаточность финансирования или выделяемых ресурсов;

  • Отсутствие или недостаточность сотрудничества с ключевыми заинтересованными сторонами; и/или

  • Недостаточное понимание документов, охваченных процессом миграции.

Мой комментарий: Я бы отдельно выделила такие риски, как:

  • Отсутствие стабильной поддержки программ миграции на достаточно высоком уровне руководства организации;

  • Отсутствия надлежащей внутренней (локальной) нормативно-методической базы по вопросам проведения миграции; 

  • Отсутствие характерного для систем менеджмента тщательного документирования всех процессов миграции, в том числе возникающих ошибок и сбоев; отсутствие регулярного анализа эффективности процессов миграции, их пересмотра и совершенствования;

  • Отсутствие четкого распределения ответственности и обязанностей за проведение миграции, особенно в таких стрессовых ситуациях, как ликвидация организации, слияние или поглощение организаций.

Анализ сложности рисков и оценка того, как они будут соотноситься с системами, в которые мигрируются документы, позволит определить уровень и характер соответствующих рисков, а также оптимальные стратегии их смягчения

Чем сложнее структура документов, тем сложнее миграция, - что, в свою очередь, потребует привлечения большего числа заинтересованных сторон для обеспечения успеха проекта. Для проектов миграции необходимо выявить соответствующие внутренние заинтересованные стороны, в число которых могут войти сотрудники ключевых деловых подразделений, включая экспертов в предметных областях (МСП), специалистов по стратегическому управлению, ИКТ-специалистов, специалистов по управлению информацией и по управлению рисками. Заинтересованными сторонами могут быть внешние деловые партнеры, другие государственные учреждения и ведомства и контролирующие органы. Для того, чтобы миграция успешно отвечала требованиям всех заинтересованных сторон, эти заинтересованные стороны должны участвовать в проекте миграции начиная от этапа планирования и до завершения проекта.»

(Окончание следует, см. http://rusrim.blogspot.com/2025/11/as-53932025-4.html )

Источник: сайт «Стандартов Австралии»
https://store.standards.org.au/product/as-5393-2025

вторник, 25 ноября 2025 г.

От строк в таблицах баз данных к документам: Эволюция структурированных данных и стратегическое управление ими, часть 2

(Окончание, начало см. http://rusrim.blogspot.com/2025/11/1_0106088173.html )

  • Ключевые проблемы сегодня: Сегодня организации сталкиваются с рядом критически важных проблем при управлении структурированными данными в рамках своих программ стратегического управления документами и информацией:

    • Интеграция с неструктурированными данными: Деловая информация существует не только в структурированных базах данных, но и в неструктурированных формах (в виде документов, электронных писем, мультимедийных материалов). Обеспечить согласованное стратегическое управление как структурированной, так и неструктурированной информацией затруднительно, поскольку для каждого вида информации имеются свои форматы и инструменты управления. Многие компании обрабатывают их изолированно - например, применяя правила по срокам хранения документов отдельно к контенту вне баз данных, и отдельно к базам данных. Этот разрыв приводит к пробелам в контроле и надзоре.

    • Безопасность данных и защита персональных данных: Системы структурированных данных часто содержат высококонфиденциальную «чувствительную» информацию и персональные данные (PII), которые должны защищаться в соответствии с требованиями таких законов, как GDPR (закон Евросоюза о защите персональных данных – Н.Х.), HIPAA (американский Закон о переносимости и подотчётности медицинского страхования 1996 года, содержащий, в том числе, положения о защите медицинских данных и неприкосновенности личной жизни т.е. персональных данных – Н.Х.) и др. 

      Обеспечение безопасности баз данных (управление и контроль над доступом, шифрование) и исполнение требований законодательства о защите персональных данных (например, предусмотренного законом GDPR «права быть забытым») в контексте структурированных наборов данных является сложной задачей. Значительная часть избыточно длительно хранимых документов содержит персональные данные, что при отсутствии надлежащей защиты данных и их своевременного уничтожения подвергает организации риску неисполнения требований законодательства. Выявление всех случаев присутствия персональных данных в многочисленных базах данных и обеспечение надлежащего их уничтожения по запросу остаётся серьёзной проблемой.

    • Хранение в течение установленных сроков и уничтожение/передача по их истечении: Исполнение указаний по срокам хранения и действиям по их истечении, а также проведение юридически защитимого уничтожения структурированных данных - крайне сложная задача (если база данных спроектирована без учёта необходимости уничтожения определённых данных по истечении сроков их хранения, обычно такое уничтожение оказывается технически невозможным без нарушения целостности всей базы данных – Н.Х.). В отличие от файлов в хранилище контента, записи в базах данных взаимосвязаны и постоянно обновляются, что затрудняет определение того, «что представляет собой документ в базе данных» и когда его можно удалить. 

      Многие организации по умолчанию хранят структурированные данные постоянно, что приводит к росту объёмов данных и несоблюдению требований к срокам хранения. Установление сроков хранения для строк или полей базы данных, и выполнение их удаления без нарушения целостности данных требуют тщательного планирования.

    • Целостность данных: Поддержание целостности структурированных данных означает (с точки зрения управления документами – Н.Х.) сохранение их точности, полноты и неизменности с течением времени (существует также структурная целостность базы данных, требующая сохранения взаимосвязей между данными – Н.Х.). Это жизненно важно для документов, являющихся свидетельствами и доказательствами деловых операций. Целостность данных, однако, может быть скомпрометирована вследствие несанкционированных изменений, отсутствия журналов аудита или же из-за плохо проведенных миграций. Важно обеспечить, чтобы системы регистрировали изменения в журналах аудита и предотвращали несанкционированное вмешательство. Целостность также подразумевает сохранение взаимосвязей между данными — например, при архивировании или миграции данных, ссылки должны оставаться работающими, чтобы информация сохраняла свой контекст и смысл.

    • Эволюция законодательно-нормативных требований: Законодательно-нормативные требования к управлению данными имеют тенденцию к ужесточению. В таких отраслях, как финансы и здравоохранение, действуют строгие нормативно-правовые требования к ведению документации и срокам её хранения; а новые законы о защите персональных данных во всем мире предписывают минимизацию объема данных и проведение их своевременного уничтожения. Контролирующие органы начали налагать штрафы за нарушения требований к срокам хранения и защите данных – например, компании штрафовались за несоблюдение требований к сохранению деловых сообщений в базах данных и за необеспечение безопасности персональных данных в процессе их уничтожения. Поддержание соответствия практики работы со структурированными данными требованиям новых законов и нормативных актов (от закона GDPR до отраслевых правил) является постоянной проблемой для специалистов по комплаенсу и по управлению документами.

  • Перспективные передовые практики: Для решения возникающих проблем организации внедряют современные стратегии стратегического управления информацией:

    • Разработка единой концептуальной структуры стратегического управления, охватывающей как структурированные, так и неструктурированные данные, что позволяет устранить изолированность информационных активов в организации. Сюда входит чёткое разделение баз данных и контента; и обеспечение выявления «документов» как в базах данных, так и в хранилищах документов.

      Мой комментарий: Упомянутое «чёткое разделение» на самом деле проблематично, поскольку сплошь и рядом вполне традиционные «бумагоподобные» документы хранятся на само деле в СУБД.

    • Инвестирование в инструменты обнаружения, раскрытия и классификации данных с целью проведения инвентаризации данных, хранящихся в базах данных, выявления конфиденциальной информации и применения правильных политик по срокам хранения и защите данных. Понимание своих данных является необходимым предварительный условием для стратегического управления ими.

    • Автоматизация хранения и уничтожения/передачи структурированных данных везде, где это возможно. Новые и нарождающиеся решения, такие как инструменты архивирования структурированных данных, позволяют организациям перемещать устаревшие данные в архивы и удалять их в соответствии с политикой, сохраняя при этом журналы аудита. Автоматизация этих процессов (при наличии соответствующего контроля и надзора) снижает количество ошибок и обеспечивает согласованность.

    • Интеграция «запроектированной защиты персональных данных» и «запроектированной безопасности» в системы структурированных данных. Это означает принудительное применение доступа на основе ролей, шифрования и маскирования данных в базах данных, содержащих персональные данные. Это также означает создание функциональных возможностей для быстрого выполнения запросов на удаление и проверки того, что такие данные действительно были удалены из всех резервных копий и систем.

    • Использование строгих мер контроля целостности данных, таких как ведение журналов аудита для отслеживания изменений в записях; соблюдение связанных с целостностью ограничений в базах данных (для предотвращения появления «осиротевших» и неверных данных); и проведение регулярных аудитов целостности. Для доверия к записям в базах данных критически важно обеспечить их защиту от несанкционированных изменений.

    • Формирование междисциплинарной группы по стратегическому управлению информацией (включающей, в том числе, специалистов по управлению документами, ИТ-специалистов/архитекторов данных, специалистов по комплаенсу и юристов) для разработки политик в отношении структурированных данных и надзора над их исполнением. Осуществляемое совместными усилиями стратегическое управление помогает сбалансировать потребности деловой деятельности с требованиями законодательства.

    • Упреждающий подход в отношении изменений в законодательстве: следует отслеживать появление новых законов и соответствующим образом обновлять свои политики. Если, например, вводятся ограничения по срокам хранения или новые требования к уничтожению данных, то их следует незамедлительно включить в программу стратегического управления. Регулярно проводимые программы обучения и ознакомления позволят информировать сотрудников о подлежащих исполнению законодательно-нормативных требованиях, связанных с данными.

Заключение: Системы структурированных данных эволюционировали от простых первоначальных разработок до сложных распределённых платформ, ставших неотъемлемой частью деловых процессов. Вместе с этой эволюцией на специалистов по управлению документами и информацией ложится ответственность за решение уникальных проблем стратегического управления, связанных со структурированными данными. 

Понимая историю и контекст таких систем, специалисты по управлению документами и информацией смогут эффективнее решать текущие проблемы, связанные с интеграцией, защитой персональных данных, управлением сроками хранения, обеспечением целостностью и исполнением законодательно-нормативных требований. 

В дальнейшем внедрение всеохватывающих методов и практик стратегического управления информацией и использование современных инструментов будут играть ключевую роль в обеспечении того, чтобы структурированные данные оставались активом, а не становились обузой. Организации, которые успешно осуществляют стратегическое управление своими структурированными данными, смогут не только смягчить риски и исполнить законодательно-нормативные требования, но и получат существенно бóльшую деловую отдачу от своих информационных активов.

Эндрю Поттер (Andrew Potter)


Источник: сайт Substack
https://metaarchivist.substack.com/p/from-rows-to-records 

Читая новый австралийский стандарт AS 5393:2025 «Управление документами и информацией - Миграция авторитетных данных, информации и документов между системами» (2)

(Продолжение, начало см. https://rusrim.blogspot.com/2025/11/as-53932025-1.html )

Побудительные причины для проведения миграции документов описаны в разделе 2.1 следующим образом:

«В числе возможных причин проведения миграции документов можно назвать следующие:

  • Обстоятельства, при которых сроки хранения документов являются более длительными, чем сроки эксплуатации текущей системы, в результате чего требуется миграция документов в новую систему;

  • Необходимость сохранения документов в читаемом и пригодном для использования формате в течение всего срока их хранения, что требует преобразования документов из прежнего формата в новый;

    Мой комментарий:
    Здесь, очевидно, речь идёт уже не о миграции, а о конверсии документов
    :)

  • Перемены административного характера или изменения в механизме государственного аппарата, требующие передачи соответствующих документов вместе с функциями в другую организацию;

  • Развёртывание новых систем и/или технологий для замены устаревших технологий или выводимых из эксплуатации систем (включая миграцию документов в новые системы);

  • Необходимость индивидуальной настройки или интеграции систем в случае, когда документы совместно используются этими системами;

  • Изменения в классификационных схемах, в схемах метаданных, или изменения в местоположении данных;

  • Слияния и поглощения (организаций – Н.Х.);

  • Внутренние изменения в организации;

  • Обеспечение долговременной сохранности свидетельств / доказательств и истории организации;

    Мой комментарий:
    В данном случае речь скорее идёт о конверсии, чем о миграции.

  • Обновление с одной версии на более новую версию того же программного обеспечения;

  • Переход с системы одного типа на систему другого типа, или с одного существующего формата данных на новый формат данных;

    Мой комментарий:
    Переход на новые форматы – бесспорная конверсия, а не миграция.

  • Переход с локальных приложений на платформы, поддерживаемые третьими сторонами;

    Мой комментарий:
    Данный пункт охватывает переход на облачные вычисление и использование иных видов аутсорсинга.

  • Возврат (репатриация) документов после прекращения действия аутсорсинговых соглашений; и

  • Экспоненциальный рост объёмов документов.»

Мой комментарий: Думаю, можно предложить ещё ряд причин, побуждающих проводить миграцию (понимаемую в более широком смысле):

  • Оптимизация расходов и производительности посредством перемещения документов и информации в более дешёвые или более медленные системы хранения (в том числе миграция в рамках иерархических систем хранения) – либо перемещение с целью разгрузить «боевые» системы и повысить их производительность;

  • Резервное копирование (включая создание и хранение локальных резервных копий, хранение резервных копий в удаленных местах, хранение резервный копий у третьих сторон);

  • Дублирование документов в иерархических системах хранения, в которых документы нижележащего уровня «поднимаются» и агрегируются на следующем уровне – в своё время по такой схеме у нас хранились документы налоговых органов;

  • Передача документов на ведомственное архивное хранение и на постоянное архивное хранение;

  • Выемка электронных документов для представления их в контролирующие органы, судам и следствию;

  • Выполнение контрактных обязательств, связанных с передачей документов от одной стороны другой.

Далее в п.2.1 говорится:

«Последствиями ненадлежащего планирования и выполнения миграции могут быть:

  • Снижение выручки;

  • Перерасход ресурсов проекта и/или перерасход бюджета;

  • Неработоспособность решений из-за неполноты информации;

  • Утрата или порча информации;

  • Ошибки при принятии решений;

  • Нарушение законодательно-нормативных требований; и

  • Проблемам с брендом.

Мой комментарий: Чтобы легче было убеждать высшее руководство, я бы дополнительно упомянула следующие высокоуровневые аспекты:

  • Снижение либо полная утрата документами юридической и доказательной силы после миграции;

  • Утечка конфиденциальной информации и/или персональных данных в процессе миграции,

  • Штрафы и санкции, вызванные неисполнением законодательно-нормативных требований, контрактных обязательств и т.п.;

  • Потери (собственности, прав интеллектуальной собственности и т.п.; потери ввиду перебоев в деловой деятельности) ввиду утраты или компрометации документов и информации в ходе миграции) самой организации;

  • Негативные последствия для внешних заинтересованных сторон и вызванный этим репутационный ущерб;

  • Нечитаемость информации и её непригодность для использования в деловой деятельности после технически корректно выполненной миграции.

Аспекты поддержания ключевых по важности характеристик авторитетной (говоря по-русски, заслуживающей доверия – Н.Х.) информации включают в себя:

  • Архивирование документов (с учётом происхождения, изменений контекста, обеспечения долговременной сохранности электронных материалов);

  • Уничтожение не имеющих ценности документов;

  • Вопрос метаданных и принятие во внимание требований аудита;

  • Модели безопасности; и

  • Эволюция архитектур и платформ (см. ISO TR 21965).»

    Мой комментарий:
    Здесь упомянут технический отчёт ISO/TR 21965:2019 «Информация и документация - Управление документами в рамках корпоративной архитектуры» (Information and documentation - Records management in enterprise architecture), см.
    https://www.iso.org/standard/72312.html и https://www.iso.org/obp/ui/#!iso:std:72312:en , а также мой пост http://rusrim.blogspot.com/2019/03/isotr-219652019.html  .

(Продолжение следует, см. http://rusrim.blogspot.com/2025/11/as-53932025-3.html )

Источник: сайт «Стандартов Австралии»
https://store.standards.org.au/product/as-5393-2025

понедельник, 24 ноября 2025 г.

От строк в таблицах баз данных к документам: Эволюция структурированных данных и стратегическое управление ими, часть 1

Данный пост эксперта в области управления электронными документами, эксперта ИСО от США Энди Поттера (Andy Potter - на фото) был опубликован 28 июля 2025 года в социальной сети Substack.

Это перевод бесплатно доступного резюме более обширного поста, доступного платным подписчикам.


Резюме для руководства

Понимая историю и контекст систем структурированных данных, специалисты могут эффективнее решать проблемы, связанные с интеграцией, защитой персональных данных, хранением в течение установленных сроков, обеспечением целостности и исполнения законодательно-нормативных требований.


  • Эволюция систем структурированных данных: Управление структурированными данными берет свое начало в ранних этапах управления документами и компьютерных вычислений. Появление и распространение в 1970-х годах реляционных баз данных произвело революцию используемых организациями методах хранения, поиска и извлечения данных, предложив схему на основе таблиц, позволяющую разделить логические модели данных и их физическое хранение. 

    Мой комментарий:
    Структурированные данные и структурированные документы уже существовали в различных формах, как минимум, в средние века – и даже в нашу компьютерную эпоху реляционные базы данных стали довольно поздним изобретением, которому предшествовали десятилетия использования иерархических, сетевых и иных баз данных. У реляционных баз данных инновационным было не то, что они «базы данных», а наличие универсальных гибких методов манипулирования данными и появление готового мощного универсального программного обеспечения. Успех к реляционным базам данных пришёл по мере компьютеризации коммерческой деятельности (и смягчению ограничений на компьютерные ресурсы), где они оказались очень удобными – а до этого, пока компьютерные вычисления обслуживали, главным образом, государственные и научные учреждения, реляционные базы данных довольно долго оставались в тени своих конкурентов.

    Реляционные системы управления базами данных (реляционные СУБД - Relational Database Management Systems, RDBMS) стали доминирующими в 1980-х и 1990-х годах, в значительной степени вытеснив более ранние иерархические и сетевые базы данных (так они всё-таки были? :) – Н.Х.). Эта предыстория заложила основу для современных ориентированных на данные организаций и предприятий.
  • Влияние реляционных баз данных: Реляционная модель (предложенная Коддом (E. F. Codd) в 1970 году) обеспечила беспрецедентную гибкость и эффективность хранения данных. 

    Мой комментарий: Сказанное не вполне точно :) Реляционные базы данных долгое время были непопулярны именно из-за того, что во многих приложениях переход на реляционную модель требовал существенно бóльших объёмов компьютерной оперативной и постоянной памяти, которая тогда была дефицитной. На само деле мощь реляционной модели – в её универсальности (любую базу данных можно преобразовать в реляционную форму) и в замечательных стандартных инструментах манипулирования данными в составе готового ПО. Благодаря этому создание эффективных баз данных стало доступно всем организациям.

    Сохраняя каждый факт лишь один раз и используя язык структурированных запросов (Structured Query Language, SQL) для извлечения и объединения данных, организации могли обеспечить согласованность и эффективно отвечать на сложные запросы. Коммерческие реляционные базы данных (такие как Oracle, DB2, SQL Server) получили широкое распространение с конца 1970-х годов (более точно, с конца 1980-х годов, когда компьютеры стали доступны крупным коммерческим организациям; однако настоящая революция началась позднее, с широким распространением персональных компьютеров в 1990-е годы – Н.Х.), трансформировав деловые процессы, на протяжении десятилетий обеспечивая обработку транзакций и став фундаментом корпоративных информационных систем. Технология реляционных СУБД стала основой для стратегического управления документами и информацией по мере того, как коммерческие организации стали полагаться на эти системы для управления структурированными документами (например, финансовыми данными, информацией о клиентах).

  • Появление новых парадигм данных: К 2000-м годам взрывной рост объёма веб-данных и данных от датчиков («больших данных») привёл к появлению новых проблем. Традиционные базы данных SQL, разработанные для односерверных сред, с трудом масштабировались до объёмов, характерных для эпохи интернета. Это привело в конце 2000-х годов к появлению баз данных NoSQL, разработчики которых пожертвовали некоторыми реляционными функциями ради распределённой масштабируемости (например, Google BigTable, Hadoop/HDFS, Cassandra). Позднее распределённые базы данных SQL, сочетающие масштабируемость NoSQL с преимуществами реляционных систем. Эти разработки диверсифицируют ландшафт структурированных данных, создавая более сложную среду для стратегического управления информацией.

(Окончание следует)

Эндрю Поттер (Andrew Potter)

Источник: сайт Substack
https://metaarchivist.substack.com/p/from-rows-to-records