пятница, 24 мая 2024 г.

Первые впечатления от технического отчёта ISO/TR 8344:2024 «Вопросы и соображения относительно управления документами в средах структурированных данных»

Данный пост австралийского специалиста в области управления документами и информацией Карла Мелроуза (Karl Melrose – на фото) был опубликован 4 мая 2024 года на его блоге Meta-IRM (Мета-управление информацией и документами).

Мой комментарий: Мой пост о новом техническом отчёте ISO/TR 8344:2024 «Информация и документация – Вопросы и соображения относительно управления документами в средах структурированных данных» (Information and documentation - Issues and considerations for managing records in structured data environments) см. здесь: http://rusrim.blogspot.com/2024/04/isotr-8344.html

Обычно я очень рад видеть продвижение Международной организации по стандартизации (ИСО) в вопросах, с которыми все мы боремся, однако моей первой реакцией на технический отчёт ISO/TR 8344 было замешательство.

Я наткнулся на проблемный момент, ещё даже не закончив смотреть содержание. В связи с этим передо мной встаёт серьёзная проблема относительно того, в какой степени мне следует доверять остальной части документа.

Раздел 5.9 озаглавлен «Уничтожение/передача отдельных документов невозможны» - данное утверждение, по моему мнению, совершенно неверно (пожалуйста, поправьте меня, если Вы со мной не согласны).

Мой комментарий: Вот что значит читать документ «по диагонали» … Вне контекста данное утверждение, действительно, было бы в общем случае неверным; однако подраздел 5.9 входит в состав раздела 5 «Проблемы управления документами в средах структурированных данных», в котором перечислены возможные проблемы (это становится ясно, если читать раздел последовательно). Хотя авторов текста можно упрекнуть за то, что они не сформулировали положения более чётко и однозначно, - однако документ говорит о проблеме, с которой можно столкнуться, и не утверждает, что такая проблема имеет место везде и всегда :) Интересно, что если документ будет переводиться на русский язык, то этой проблемы легко будет избежать, если продуманно подбирать слова.

Хотя в самом подразделе описывается ряд реально существующих проблем, характерных для структурированных данных, я не могу уйти от того факта, что в заголовке содержится явно ошибочное утверждение.

Если бы в заголовке было написано «трудно», «сложно», «концептуально иначе» - или что-то ещё, вместо слова «невозможно», - я бы на 100% согласился с ним. Однако утверждение со словом «невозможно» является неверным, и у нас есть достаточно тому доказательств.

Начнём с того, что электронные системы управления контентом и документами (EDRMS) - это системы структурированных данных. И они были спроектированы таким образом, чтобы можно было уничтожать документы.

Мой комментарий: С данным утверждением Карла я готова поспорить (ну хотя бы потому, что из общения с авторами текста знаю, что под средами структурированных данных они имеют в виду базы данных, в первую очередь реляционные, а не хранение – пусть даже в базах данных – неструктурированных документов). С другой стороны, авторы документа несомненно виноваты в том, что так и не смогли предложить осмысленное определение понятий «структурированный», «неструктурированный», «полуструктурированный», вследствие чего появился простор для интерпретаций.

Вся соль нового технического отчёта в том, что он рассматривает структурированные документы, образующиеся набором полей данных (записями данных) в обычных базах данных, используемых в деловых информационных системах, которые ориентированы на работу с данными, а не документами, и часто никак не поддерживают уничтожение образовавшихся в этих системах документов.


У EDRMS-систем имеются точно такие же концептуальные проблемы с определением того, что представляет собой документ, как и у любой другой системы структурированных данных – коллективно используемые объекты, значения ключей, ссылочная целостность, данные, взаимосвязанные с данными в других таблицах и местах (включая объекты – также представляющие собой данные).

Мой комментарий: Данное утверждение не вполне корректное, поскольку многие EDRMS-системы (в отличие от прочих информационных систем) проектируются с расчётом на то, что они будут поддерживать надлежащее управление «документами», и. соответственно, они «знают», что такое «документ» в их контексте.

И в EDRMS-системах уничтожение возможно, - потому что приложение спроектировано таким образом, чтобы это поддерживать. И EDRMS - не единственный пример.

По моему опыту, почти каждое приложение имеет процедуру уничтожения, которая спроектирована так, чтобы защищать целостность базы данных (ссылочная целостность и т.д.), и при этом дать Вам возможность уничтожать определенные данные. Хотя мы часто мешаем этому, используя репликация, плохая архитектура не делает что-либо принципиально невыполнимым - она усложняет задачу; но если бы это была простая проблема, то люди не стали бы платить нам за её решение.

Ниже приведено видео (см. https://www.youtube.com/watch?v=V2xUAp5lcPI ), показывающее процедуру уничтожения в системе Hubspot. Оно доказывает, что уничтожение (как одна из форм решения окончательной судьбы документов и данных) не только осуществимо, но и тривиально просто, поскольку оно заложено в приложении.


Поэтому я должен спросить, неужели я трагически плохо информирован и ошибаюсь в этом вопросе? Я упустил какой-то нюанс?

Мой комментарий: Карл прав – увлёкшись критикой, он действительно упустил важный «нюанс». Он не понял, что технический отчёт не считает уничтожение документов в средах структурированных данных принципиально невозможным – и как раз говорит о том, что для того, чтобы уничтожение было возможным, в системе должна быть предусмотрена соответствующая функциональная возможность. Одного этого, однако, может быть мало – например, в случае реляционных баз данных сама архитектура базы данных должна быть продумана таким образом, чтобы допускать удаление информации, относящейся к определенным сущностям. Это не какая-то теория, а выводы, сделанные на основе многолетнего практического опыта специалистами, работавшими именно с базами данных, а не с документными (EDRMS) системами …

Или же всё-таки требуется срочно изменить название данного подраздела, прежде чем коллеги из профессионального сообщества прочитают его и начнут действовать так, как будто содержащееся в нём утверждение верно?

Карл Мелроуз (Karl Melrose)

Источник: блог Meta-IRM
https://metairm.substack.com/p/first-thought-on-isotr-83442024-issues

Комментариев нет:

Отправить комментарий