четверг, 12 августа 2021 г.

Происхождение данных: Понимание данных, используемых для анализа и принятия решений

Данная заметка Дика Вейсингера (Dick Weisinger – на фото) была опубликована 23 июля 2021 года на блоге компании Formtek.

Поскольку данные все чаще используются в аналитике, машинном обучении и бизнес-аналитике, важно иметь представление об истории используемых данных. Откуда они были получены или выведены? Каков возраст данных? Каково их качество? У кого есть к ним доступ? Где и кто их использовал? В какой степени они заслуживает доверия? В таких отраслях, как финансы и фармацевтика, существует обширная нормативная база, требующая аудита использования данных.

Решения, позволяющие проследить происхождение данных, спроектированы таким образом, чтобы давать ответы на подобные вопросы об истории, качестве, надежности, состоянии и использовании данных.

Автор публикаций по вопросам технологий Иэн Роулендс (Ian Rowlands, https://www.linkedin.com/in/ianrowlands/ ) полагает, что «генеральный директор организации действительно должен иметь возможность задать вопрос, ответ на который требует соединения имеющихся в организации данных; должен уметь эффективно руководить компанией; и в особенности - должен уметь реагировать на неожиданные события. У большинства организаций отсутствует подобная возможность связывать данные воедино. Раньше было действительно сложно заставить первых лиц обращать внимание на данные. Тенденция, которую мы всё чаще наблюдаем в течение последних нескольких лет, заключается в том, что руководителей всё больше и больше раздражает неспособность получить отдачу от имеющихся в их распоряжении данных».

Ниже приведен ряд примеров того, как используются сведения о происхождении данных ( https://www.infoworld.com/article/3613592/data-lineage-what-it-is-and-why-its-important.html ):

  • Банк внедрил решения, контролирующие происхождение данных, и обнаружил, что его деятельность стала на 80 процентов эффективнее в вопросах исполнения законодательно-нормативных требований и проведения судебно-криминалистической экспертизы данных;

  • Происхождение данных используется в управлении цепочкой поставок для предоставления потребителям информации о происхождении и истории пищевых продуктов, продаваемых в продуктовом магазине;

  • Некоммерческие организации отслеживают полученные ими пожертвования, а также их распределение и расходование.

Старший руководитель проектов в компании McKinsey Викрам Беллаправалу (Vikram Bellapravalu, https://www.linkedin.com/in/vikram-bellapravalu-1b25335/ ) говорит, что «существует ряд больших преимуществ знания происхождения данных, включая полную прозрачность для заинтересованных сторон, всесторонний подход к стратегическому  управлению данными и возможность избавиться от избыточных источников информации. Коммерческая организация также может увидеть, где могут возникнуть проблемы с правами доступа, что помогает избежать утечек данных, например, при взломе. Даже с точки зрения ИТ отслеживание происхождения данных поддерживает анализ первопричин - позволяя увидеть, что произойдет, если определенный элемент будет добавлен в ИТ-архитектуру или удалён из нее» (  https://www.bloomberg.com/professional/blog/data-lineage-efforts-stymie-banks-and-insurers/ ).

Дик Вейсингер (Dick Weisinger)

Мой комментарий: Видеть, как ИТ-специалисты вынуждены заново «изобретать колесо», открывая для себя под барабанный бой истины, известные юристам и архивистам уже в течение ряда веков, и забавно, и печально…

Те, у кого кругозор пошире, понимают, что деловая деятельность и государственное управление осуществляются на основе не просто абы каких информации и данных, а на основе документированной информации, которой можно доверять и за которую кто-то несёт персональную ответственность. Такая информация ещё известна как «документы» :)

Одно из важнейших качеств документа – наличие сведений о его происхождении и последующей истории использования в деловых процессах и хранения (а отнюдь не наличие комплекта реквизитов, УКЭП или соблюдение установленной формы, которые по сути являются возможными, но не единственными способами подтверждения происхождения). Архивисты для обозначения этого качества обычно используют термин «происхождение» (provenance), а специалисты некоторых других информационных профессий – понятие «аутентичность».

Как только данные начинают использоваться для принятия ответственных решений, они де-факто становятся документами – и даже ИТ-специалисты, избегающие порой слова «документ» как чумы, понимают, что их необходимыми качествами являются целостность, аутентичность, надёжность, пригодность к использованию и конфиденциальность т.е. весь букет качеств заслуживающих доверия документов.

Источник: блог компании Formtek
https://formtek.com/blog/data-lineage-gaining-insight-into-the-data-used-for-analysis-and-decisions/ 

Комментариев нет:

Отправить комментарий