суббота, 4 апреля 2026 г.

ИСО и МЭК: Продолжается работа над техническим отчётом ISO/IEC CD TR 42103 «Обзор синтетических данных в контексте систем ИИ»

В середине февраля 2026 года сайт Международной организации по стандартизации (ИСО) сообщил о начале голосования по проекту технического отчёта ISO/IEC CD TR 42103 «Информационные технологии – Искусственный интеллект – Обзор синтетических данных в контексте систем ИИ» (Information technology — Artificial intelligence - Overview of synthetic data in the context of AI systems) объёмом 13 страницы, см. https://www.iso.org/standard/86899.html . Голосование завершится в середине апреля 2026 года, и, в случае успешного исхода, документ может быть быстро доработан и направлен на публикацию.

Над документом работает подкомитет SC42 «Искусственный интеллект» (Artificial intelligence), входящий в состав Объединенного технического комитета JTC1 «Информационные технологии» Международной организации по стандартизации (ИСО) и Международной электротехнической комиссии (МЭК).

С моей точки зрения, данный проект вызывает дополнительный интерес ещё и потому, что сейчас в России некоммерческая организация «Ассоциация больших данных» (АБД) готовит отечественный предстандарт ПНСТ «Синтез данных» на ту же тему, который состоит из трёх частей:

Ключевой (и, как показывают ответственные и международные дискуссии, достаточно спорный) термин определён следующим образом:

3.9. Синтетические данные (synthetic data) - данные, созданные искусственным путем, а не собранные на основе наблюдений в реальном мире.

Примечание: Синтетические данные используются в качестве замены данных реального мира (реальных данных) в ситуациях, когда имеется дефицит данных реального мира; когда использование реальных данных может привести к раскрытию чувствительной информации, такой как персональные данные; или же когда имеющиеся данные реального мира не в состоянии адекватно отразить все крайние случаи. 

Цель синтетических данных - воспроизвести математические, статистические и/или семантические характеристики реальных данных, обеспечивая тем самым их полезность для различных приложений, включая обучение моделей машинного обучения. Их использование может смягчить риски для безопасности и персональных данных, связанные с использованием данных реального мира.

Для сравнения, в проекте российского ПНСТ тот же термин определён следующим образом (в части 1):

3.1.3. Синтетические данные (synthetic data): Данные, искусственно созданные для имитации формата и свойств реальных данных, но которые не соответствуют напрямую каким-либо реальным объектам и не являются модификацией исходных данных.

Примечание: Синтетические данные могут быть использованы для различных целей, включая обучение моделей машинного обучения, тестирование систем, а также обеспечение повышенной конфиденциальности данных.

Во вводной части документа отмечается:

«Синтетические данные - это данные, сгенерированные искусственным образом, а не собранные на основе наблюдений в реальном мире, которые используются вместо реальных данных в тех случаях, когда 

  • реальных наблюдений немного; 

  • при использовании данных, полученных от реальных людей, могут быть раскрыты персональные данные; 

  • существующие данные недостаточно разнообразны; или

  • существующие данные не могут быть использованы ввиду ограничений, установленных законодательно-нормативными и иными обязательными требованиями. 

Хотя синтетические данные стали популярным инструментом для решения этих распространенных проблемных вопросов, их использование создаёт свои собственные проблемы.

Синтетические данные широко используются в различных секторах, включая сектора беспилотных автомобилей, телекоммуникаций, промышленного производство, здравоохранения, финансовых услуг, а также технологий. Ими пользуются как устоявшиеся предприятия и организации, так и развивающиеся стартапы.

Степень использования синтетических данных зависит от конкретных вариантов использования. Можно, например, сгенерировать целые наборы данных «с нуля2, используя ограниченное количество начальных данных (seed data); также есть возможность просто заменить конфиденциальные значения в существующем наборе данных правдоподобными альтернативами. Существуют различные методы генерации синтетических данных, и их применение зависит от конечной цели.

Хотя использование синтетических данных может быть направлено на снижение рисков в ходе проекта, некоторые риски всё же остаются, и даже могут появиться новые. К таким рискам относятся: утечка данных реального мира, таких как персональные данные или данные, являющиеся интеллектуальной собственностью; усиление предвзятости; галлюцинации; а также повторная идентификация физических лиц.

… Настоящий документ содержит обзор понятий, методов, способов использования синтетических данных и касающихся их соображений в контексте систем искусственного интеллекта. В нём описываются варианты использования синтетических данных и связанные с их использованием уникальные проблемы. Рассматривается использование синтетических данных в рамках жизненного цикла данных, включая связанные с синтетическими данными риски и показатели качества данных; использование синтетических данных в различных отраслях и вопросы экологической рациональности, возникающие в процессе работы с синтетическими данными.»

Содержание документа следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Сокращения и аббревиатуры
5. Типы синтетических данных
6. Синтетические данные в жизненном цикле данных
7. Соображения о качестве данных для синтетических данных
8. Риски, связанные с синтетическими данными
9. Использование синтетических данных
Приложение A: Пример процесса синтеза данных
Библиография

Источник: сайт ИСО
https://www.iso.org/standard/86899.html 


ИСО и МЭК: Опубликованы технические спецификации ISO/IEC TS 27103:2026 «Рекомендации по использованию стандартов ИСО и МЭК в концепциях кибербезопасности»

В феврале 2026 года сайт Международной организации по стандартизации (ИСО) сообщил о публикации технических спецификаций ISO/IEC TS 27103:2026 «Кибербезопасность – Рекомендации по использованию стандартов ИСО и МЭК в концепциях кибербезопасности» (Cybersecurity - Guidance on using ISO and IEC standards in a cybersecurity framework) объёмом 26 страниц, см. https://www.iso.org/standard/27103 и https://www.iso.org/obp/ui/en/#!iso:std:85057:en .

Документ подготовлен техническим подкомитетом ИСО/МЭК JTC1/SC27 «Информационная безопасность, кибербезопасность и защита неприкосновенности частной жизни» (Information security, cybersecurity and privacy protection) взамен
 ранее действовавшего технического отчёта ISO/IEC TR 27103-2018.

Во вводной части документа отмечается: «В настоящем документе представлены рекомендации по использованию существующих стандартов ИСО и МЭК в рамках концепций кибербезопасности».

В основной части документа выделены 6 функций – «Выявление» (Identify), «Защита» (Protect), «Детектирование» (Detect), «Реагирование» (Respond) и «Восстановление» (Recover). Для каждой функции выделен ряд аспектов, для каждого из которых даны ссылки на соответствующие разделы в стандартах ИСО/МЭК.  

Содержание документа следующее:

Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Структура документа
5. Предыстория
6. Концепции
Приложение А: Подкатегории
Приложение Б: Три принципа кибербезопасности для высшего руководства
Библиография

Источник: сайт ИСО
https://www.iso.org/standard/27103 
https://www.iso.org/obp/ui/en/#!iso:std:85057:en 

пятница, 3 апреля 2026 г.

В центре внимания ОЭСР (OECD): Стратегическое управление данными в интересах обеспечения надежности ИИ в государственном секторе и доверия к нему

Данная заметка работающей во Франции британской журналистки Эми Кейс (Amy Cases – на фото) была опубликована 19 февраля 2026 года в социальной сети LinkedIn.

Организация экономического сотрудничества и развития (ОЭСР - Organization for Economic Co-operation and Development, OECD) только что привлекла внимание к теме, которая была ключевой для инноваций в государственном секторе в 2025 году: расширение доступа к данным и обмен ими с целью обеспечения надежного и заслуживающего доверие искусственного интеллекта (ИИ).

В новом аналитическом обзоре (policy brief) ОЭСР подчеркивается, что, хотя ИИ открывает огромные возможности для государственных служб, его воздействие будет ограниченным в отсутствие эффективной политики доступа к данным, обмена и управления ими. Такие концептуальные рамки крайне важны для нахождения баланса между инновациями с одной стороны и защитой персональных данных, безопасностью и правовыми гарантиями с другой - особенно в государственном секторе, где обеспечение доверия и подотчетности являются обязательными.


На рис.: Концепция ОЭСР надёжного и заслуживающего доверия ИИ в государственных органах

Ключевые выводы, предлагаемые в отчёте для лидеров в области стратегического управления и цифровой политики, следующие:

  • Доступность качественных данных способствует получению отдачи от ИИ в государственном секторе;

  • Сбалансированные принципы стратегического управления помогают согласовать права, инновации и прозрачность;

  • Государственным органам рекомендуется принимать правовые, технические и организационные защитные меры, которые делают данные одновременно полезными и заслуживающими доверия.

Поскольку государственные органы все чаще внедряют ИИ в своей деятельности, данные рекомендации ОЭСР (OECD) могут послужить стратегической основой для построения открытых, безопасных и справедливых экосистем данных.

Эми Кейсес (Amy Cases)

Мой комментарий: Речь идёт об опубликованном в июне 2025 года 306-страничном отчёте ОЭСР «Государственное управление с использованием искусственного интеллекта: Текущее положение дел и дальнейшие шаги в контексте ключевых функций государственного управления» (Governing with Artificial Intelligence - The State of Play and Way Forward in Core Government Functions), который доступен по адресу: https://www.oecd.org/content/dam/oecd/en/publications/reports/2025/06/governing-with-artificial-intelligence_398fa287/795de142-en.pdf 

Источник: сайт LinkedIn
https://www.linkedin.com/posts/amy-cases-653287272_datagovernance-ai-publicsector-activity-7430012420791623681-xKTI 

Архивисты германоязычных стран обсудили на встрече в Праге вопросы управления электронными документами и их архивирования

Данный пост работающего в Швейцарии польского специалиста в области управления документами и электронных архивов Анны Собчак (Anna Sobczak – на фото) был опубликован 25 марта 2026 года в социальной сети LinkedIn.

Мой комментарий: В данном посте речь идёт о 29-м заседании рабочей группы «Архивирование документов из цифровых систем» (Archivierung von Unterlagen aus digitalen Systemen), которое прошло 18-19 марта 2026 года в Праге.


Знаете, что произошло во второй декаде марта? Позвольте напомнить!

В 29-й раз архивисты и специалисты по управлению документами германоязычных стран собрались в Праге на конференции «Архивирование документов из цифровых систем» (Archivierung von Unterlagen aus digitalen Systemen), организованной Национальным архивом Чешской Республики, с тем, чтобы обсудить вопросы управления электронными документами и их архивирования.

Полная программа встречи доступна по адресу https://www.nacr.cz/wp-content/uploads/2026/03/Programm_AUDS_2026_DE_13-3-2026_fin-1.pdf ; тезисы докладов доступны по адресу https://www.nacr.cz/wp-content/uploads/2026/03/Abstract_Buch_AUDS_2026_DE_17-3-2026_fin-1.pdf .

Вот мои основные выводы по итогам этой встречи:

  • В странах с централизованным государственным управлением часто имеются централизованные решения для обеспечения долговременной сохранности электронных материалов – например, Чешский национальный архивный портал.

  • В странах с децентрализованным государственным управлением соответствующие усилия координируются на нескольких уровнях. Хорошим примером здесь может служить немецкое решение DIMAG для электронных архивов.

    Мой комментарий: Согласно Википедии (см. https://de.wikipedia.org/wiki/DIMAG ), DIMAG (сокращение от Digitales Magazin) — это набор программных решений для обеспечения долговременной сохранности преимущественно государственных электронных документов. Данное решение было первоначально разработано Архивом земли Баден-Вюртемберг в 2006 году. Со временем сложился консорциум разработчиков, охватывающий ряд земель и кантонов. Решение DIMAG, которое может быть адаптировано под стандарт OAIS, используется в государственных, муниципальных и церковных архивах.

  • Концепция «запроектированного архивирования» становится всё более распространенной! Речь идет не только о системах – но также о сотрудничестве с поставщиками услуг в интересах согласования их инструментов со стандартами архивного дела.

  • Решения, работающие в одной стране, не всегда подходят для другой – Государственный архив кантона Цюрих исследовал «обходные пути» для эффективного использования решения DIMAG.

  • Грядет новое поколение архивных научно-информационных систем – созданных с расчетом на использование ИИ, связанных данных, онтологий и графов знаний, - всё в соответствии с принципами FAIR (буквально «справедливый» - в данном случае является сокращением от слов Findability, Accessibility, Interoperability, Reusability – отыскиваемость, доступность, интероперабельность и повторное использование – Н.Х.)

Анна Собчак (Anna Sobczak)

Источник: сайт LinkedIn
https://www.linkedin.com/posts/drannasobczak_auds2026-digitalpreservation-archives-share-7442131845791633408-5aEB