понедельник, 8 апреля 2024 г.

Концепция «документа, опирающегося на данные»

Данный пост австралийского специалиста в области управления документами и информацией Карла Мелроуза (Karl Melrose – на фото) был опубликован 23 февраля 2024 года на его блоге Meta-IRM (Мета-управление информацией и документами).

Одной из тем, о которых я довольно много говорил в течение последних нескольких лет, являются мои наблюдения того, как занимающимся управлением документами и управлением данными службам и специалистам организации приходится сотрудничать друг с другом в рамках каждой достаточно продвинутой программы.

Недостающим элементом большинства из этих программ является единая концепция, рассматривающая документы как данные и данные как документы.

Люди ошибаются, причём довольно-таки последовательным образом.

Многие специалисты по данным ошибаются, считая, что «документ» - это понятие, не относящееся к сфере их деятельности.

Полагаю, они так думают из-за того, что не были в достаточной степени ознакомлены с идеями и представлениями о том, что такое документы и насколько важно эта понятие, чтобы оценить их. Думаю, что существует также определенная слепота в отношении проблем, которые запись / документирование данных решает для тех, кто это делает – это определенная тенденция относиться к данным как к «вещи», а не как к отражению деловой деятельности и связанных с этой деятельностью вещей, которые были достаточно важны для того, чтобы их стоило записать / задокументировать, поскольку впоследствии необходимо будет знать о них с высокой точностью.

В то же время у специалистов по управлению документами наблюдается определенное нежелание тратить своё время на то, чтобы разобраться с тем, откуда берутся данные – чтобы в итоге понять концепцию документа применительно к данным.

Отчасти, я думаю, это связано с тем, что в сфере управления документами также существует тенденция дистанцироваться от того, что отражают наши документы – это когда мы смотрим документ как на вещь, и хотим лишь управлять ею, вместо того, чтобы видеть в документе отражение чего-то, что произошло в реальном мире – событий и фактов, которые были достаточно важны для того, чтобы их стоило записать / задокументировать, поскольку впоследствии необходимо будет знать о них с высокой точностью (я умышленно продублировал эти слова, ведь это то, что объединяет нас, если только мы сможем заставить себя это увидеть).

Мы [специалисты по управлению документами – Н.Х.] также (в целом, как группа) крайне слабо разбираемся в том, как данные попадают в базы данных, и в их структуре после попадания в базы данных. Хотя иногда мы можем посмеиваться над тем, что в английском языке записи в базе данных называются так же, как и документы (records), - однако если бы мы меньше смеялись и больше ходили, смотрели и разбирались, то нам было бы куда легче понять, что всё это ничуть не более смешно, чем наше представление о том, как набор элементов контента / файлов (documents) образует документ (record) - в базах данных информация просто агрегируется иначе.

Похоже, что все совершают одну и ту же ошибку, полагая, что могут понимать данные как документ, не разобравшись с тем, как информация записывается / документируется в виде данных.

Ответ (по крайней мере, лично для меня) относительно прост, он заключается в интерфейсе - обычно интерфейсе делового приложения, которое сотрудники используют для записи данных (отмечу, что стоит говорить об интерфейсе, поскольку затем мы можем перейти к полезной концепции «документа», когда компьютер осуществляет запись через API-интерфейс).

Изучение того, что сотрудники видят в интерфейсе и что они там записывают / документируют, даёт нам наилучшие шансы на то, чтобы понять выполняемую деловую деятельность; а как только мы понимаем деловую активность, мы понимаем, что именно отражает документ, благодаря знанию его контекста.

Концепция документа, опирающегося на данные (data fit concept of record) должна признавать, что документ - это то, что создается с использованием соответствующего интерфейса (обычно делового приложения), где данные, скорее всего, вводятся человеком.

Попытка решить проблему видения «данных как документов» любым иным способом оставляет нас без контекста, позволяющего нам связать их с объектами и событиями реального мира.

Пока что клиентов не волнуют вещи, не связанные с реальным миром, ведь на них нельзя строить деловую деятельность, они не годятся для аналитики, не интересны регуляторам -  они по большому счёту бесполезны, и сложно понять, зачем кому-либо – что специалистам по управлению документами, что специалистам по управлению данными - тратить на них своё время.

А что думаете Вы?

Карл Мелроуз (Karl Melrose)

Мой комментарий: С моей точки зрения, чтобы считаться документом, соответствующая информация должна быть фиксированной и стабильной (включая элементы контента, структуру, метаданные и взаимосвязи между ними, а там, где это уместно – также включая стабильность представления информации и поведения динамических документов вроде электронных таблиц). Информация также должна быть защищена от внесения неавторизованных изменений и способна рассказать законченную «историю», отвечающую на вопросы «кто?», «что?», «когда?», «где?», «как?» и «почему?» и т.п. Эта «история» может быть рассказана:

  • традиционным образом, в виде т.н. «неструктурированного» текстового документа, содержащего всю «историю» целиком в человеко-читаемом виде; или же

  • в виде структурированных или частично структурированных данных, с которыми неразрывно ассоциированы необходимые сведения и ресурсы (обычно хранящиеся отдельно, в т.ч. во внешних системах), позволяющие эти данные правильно отобразить и интерпретировать. «История» в этом случае синтезируется на основе всех этих данных, сведений и ресурсов».

    Примером могут служить записи в базе данных или файлы отчётности в формате XML, а в более древние времена – бумажные табуляграммы (перфорированные карты), использовавшиеся для учёта отработанного времени и зарплаты, для юридически значимой интерпретации которых требовалось (и до сих пор требуется) утверждённое руководство по их расшифровке.

Стоит отметить, что если раньше структурированные документы были больше характерны для бухгалтерского и налогового учёта, научно-технической и проектно-конструкторской деятельности и т.п., то теперь даже составители привычных управленческих документов всё реже пишут их целиком, вводя вместо этого через интерфейс лишь необходимые уникальные данные. Как следствие, обрабатывающие документы специалисты-люди всё чаще воспринимают их как структурированные данные, а не как готовые «истории», что облегчает восприятие ими записей в базе данных как полноценных документов, а документов – как представлений, синтезируемых на основе данных.

Источник: блог Meta-IRM
https://metairm.substack.com/p/data-fit-concepts-of-record-information

Комментариев нет:

Отправить комментарий