вторник, 20 января 2026 г.

Переосмысление различия «структурированная – неструктурированная информация»: Почему нам, специалистам по управлению документами, следует прекратить считать данные «не нашей проблемой» (2)

(Продолжение, начало см. http://rusrim.blogspot.com/2026/01/1_02087587809.html )

Ясное видение непрерывного пространства: Не две крайности, а плавный переход

Стоит перестать мыслить крайними категориями «структурированный» и «неструктурированный», как ландшафт оживает:

  • Документы содержат встроенные метаданные, историю версий, структуру визуального представления, и часто - скрытые XML-слои.

  • В базах данных имеются поля для комментариев, вложения, аннотации и ненормализованный текст.

Практически ничто не существует в чистом виде, везде присутствуют смешанные и переходные состояния. Завораживает даже то, как информация перемещается в рамках этого непрерывного пространства.

Запутанный документ в формате Word становится более структурированным, когда:

  • Из него извлекаются сущности,

  • Он размечается посредством добавления метаданных,

  • К нему применяется workflow-процесс,

  • Он связывается со взаимосвязанным контентом.

Структурированная таблица становится более описательной, когда:

  • На её основе генерируется отчёт,

  • Создается контрольная панель (dashboard) для мониторинга,

  • Объясняются относящиеся к ней бизнес-правила,

  • Проводится миграция таблицы её в информационный пакет для обеспечения её долговременной сохранности.

Непрерывное пространство / континуум является «живым». Документы перемещаются в его рамках, и вместе с этим меняются интерпретация и технологии. И нам [специалистам по управлению документами – Н.Х.] тоже следует меняться.

Как мы унаследовали выдуманные границы и почему они сейчас рушатся

Разрыв [между структурированным и неструктурированным – Н.Х.] возник не из теории. Он является следствием предыстории.

Десятилетиями дисциплина управления документами развивалась «под сенью» бумаг, шкафов для документов, классификационных схем и архивов. Мы знали, как работать с документами. У нас были накоплены десятилетия институциональной памяти в этой области, и был для этого выработан свой язык.

Управление данными возникло из вычислений, из структурированных систем, из реляционных моделей, языка SQL, схем и архитектур хранения данных. Здесь иная терминология, иная система ценностей, другая профессиональная среда.

И эти два мира эволюционировали по отдельности.

Долгие годы такое разделение сохранялось. В течение первых десятилетий цифровой эпохи оно даже имело смысл, - когда количество деловых информационных систем было ограничено, и доминировали специализированные систем для хранения документов.

Но к настоящему времени этот мир ушёл в историю. Сегодня основные свидетельства / доказательства практически любой деловой операции хранятся не в файле документа, а в системе. Примеры:

  • Возврат средств одобряется в POS-приложении в точке продажи,

  • Разрешение выдаётся в рамках инструмента рабочего процесса,

  • Инцидент, относящийся к соблюдению законодательно-нормативных требований, протоколируется на платформе управления заявками на обслуживание (case-management platform),

  • Контракт формируется, поддерживается, корректируется и закрывается в системе управления закупками, а не в аккуратной структуре папок с документами.

Если ограничиться одной только документарной частью непрерывной области, то мы будем видеть лишь «тени», отбрасываемые деловой деятельностью, а не саму эту деятельность. Это будет не управление документами, а делопроизводственный «туризм».

Вход в непрерывное пространство: Как это выглядит на практике


Принятие нами представления о непрерывном пространстве [соединяющем структурированное и неструктурированное – Н.Х.]  означает изменение нашего поведения.

Во-первых, мы начинаем рассматривать [деловые – Н.Х.] системы как среды управления документами

CRM-система управления взаимоотношениями с клиентами — это не просто база данных клиентов. Это среда управления документами для жалоб, согласований, эскалаций и решений.

HR-система управления кадрами - это не просто платформа для сведений о персонале. Она содержит свидетельства кадровых решений, которые могут повлиять на карьеру, судебные разбирательства и права сотрудников.

ERP-система планирования корпоративных ресурсов - это не просто поддерживающая финансовая система. В ней хранится цепочка обязательств, платежей и ответственности, с возможностью проведения её аудита.

Если в какой-то системе присутствуют свидетельства / доказательства, значит, в ней есть документы. При видении на основе идеи «непрерывного пространства», это является исходным предположением, а не исключением.

Во-вторых, мы устанавливаем для структурированных данных сроки хранения и действия по уничтожению/передаче по истечении этих сроков

Это один из самых трудных изменений. Установление сроков хранения для баз данных требует:

  • Выявления относящихся к деловой деятельности сущностей и полей,

  • Сопоставления сущностей и полей с категориями документов,

  • Проектирования функциональных возможностей для удаления и/или архивации данных,

  • Документирования изменений в схеме базы данных,

  • Экспорта документов вместе с метаданными, а не только экспорта данных.

В техническом отчёте ISO/TR 8344 совершенно чётко говорится о том, что эти задачи относятся к экосистеме стратегического управления (governance ecosystem).

В-третьих, мы проектируем системы с учётом потребностей управления документами

Это означает:

  • Учёт требований к управлению документами в ходе проведения закупок,

  • Сотрудничество с архитекторами и инженерами, начиная с ранних этапов создания систем,

  • Требования о ведении журналов аудита, выполнении проверок целостности и наличии метаданных о происхождении,

  • Обеспечение интерпретируемости структур данных во времени.

Всё это – практическая реализация принципа «запроектированного управления документами».

В-четвёртых, мы используем наличие непрерывного пространства, а не боремся с ним

Документы становятся более управляемыми при добавлении структуры. Данные становятся более осмысленными при добавлении описаний / повествования (narrative). Стратегическое управление улучшается при движении в обоих направлениях.

«Момент подотчётности»: Почему всё это важно сейчас

В конце своего поста Карл Мелроуз делает кое-что важное - он переосмысливает вопрос о подотчётности.

Нам часто говорят, что основная задача управления документами заключается в обеспечении подотчётности. Карл высказывает мысль о том, что та [весьма неблагоприятная – Н.Х.] ситуация, в которой мы [специалисты по управлению документами – Н.Х.] оказались сейчас, может рассматриваться как своего рода привлечение нас к ответственности нашими организациями за то, что мы выполняем свои обязанности не во всём информационном ландшафте. Это неприятная идея, но она звучит правдоподобно …

Если мы отказываемся работать со структурированными средами, то мы частично ответственны за:

  • неисполнение законодательно-нормативных требований,

  • утечки персональных данных,  

  • ненадлежащее обеспечение долговременной сохранности электронных материалов,

  • неполноту журналов аудита,

  • неэффективные решения в ходе экспертизы ценности,

  • неуправляемые унаследованные системы,

  • данные, которые не уничтоженные по истечении законных оснований для их обработки,

  • документы, которые утрачивают смысл вследствие исчезновения их контекста.

Доверие сначала постепенно деградирует, а затем внезапно теряется.

Хорошая новость заключается в том, что доверие можно восстановить, если представители нашей профессии в полной мере и уверенно начнут выполнять свои обязанности на протяжении всего информационного ландшафта.

(Окончание следует)

Эндрю Поттер (Andrew Potter)

Источник: сайт Substack
https://metaarchivist.substack.com/p/rethinking-the-structuredunstructured 

Комментариев нет:

Отправить комментарий