пятница, 14 июля 2023 г.

Качество данных: Цена плохих данных

Данная заметка Дика Вейсингера (Dick Weisinger – на фото) была опубликована 9 июня 2023 года на блоге компании Formtek.

Важность данных слишком легко недооценить. Плохие данные - дорогостоящая проблема. Низкое качество данных может привести к плохим конечным результатам и к тяжелым последствиям для коммерческих организаций.

Аналитики согласны с тем, что плохие данные очень дорого обходятся компаниям. Проведенное фирмой IBM исследование ( https://hbr.org/2016/09/bad-data-costs-the-u-s-3-trillion-per-year ) показало, что американские коммерческие организации ежегодно теряют 3.1 триллиона долларов из-за плохого качества данных. По оценкам консультационной фирмы Gartner ( https://www.gartner.com/smarterwithgartner/how-to-improve-your-data-quality ), средние ежегодные потери компаний вследствие низкого качества данных составляют 12,9 млн долларов. По оценкам Ovum ( https://www.itbusinessedge.com/database/what-does-bad-data-cost/ ), такие потери для коммерческой организации могут достигать 30% от сборов.

Почему же ошибки в данных обходятся так дорого?

Старший директор-аналитик фирмы Gartner Мелоди Чьень (Melody Chien ( https://www.gartner.com/analyst/62722 ) считает, что «качество данных напрямую связано с качеством принимаемых решений. Данные хорошего качества позволяют получить более качественные идеи, лучшее понимание клиентов и взаимоотношения с ними. Качество данных - это конкурентное преимущество, которое руководители служб данных и аналитики (data and analytics, D&A) должны постоянно усиливать» ( https://www.gartner.com/smarterwithgartner/how-to-improve-your-data-quality ).


Томас Редман (Thomas Redman), рис. из статьи «Плохие данные обходятся США в 3 триллиона долларов в год»,
https://hbr.org/2016/09/bad-data-costs-the-u-s-3-trillion-per-year

Исправление ошибок в данных обходится дорого. Томас Редман (Thomas Redman) в статье, опубликованной в «Гарвардском деловом обозрении» (Harvard Business Review, HBR), называет процесс исправления «скрытой фабрикой данных» ( https://hbr.org/2016/09/bad-data-costs-the-u-s-3-trillion-per-year ). Например, в исследовании, проведенном компанией Melissa  ( https://www.melissa.com/resources/whitepapers/pdf/1-10-100-rule-whitepaper.pdf ), дана оценка, согласно которой 20% собранной компаниями контактной информации является неверной. По словам компании, раннее исправление контактной информации следует правилу 1-10-100. Данные можно проверить на первом проходе, сравнив их с базой данных - это стоит около доллара за запись. Дополнительные 10 долларов нужно потратить для исправления тех записей, которые не были выявлены на первом проходе, а 100 долларов – это затраты, связанные с поставками по неверному адресу, возвращенной почтой и упущенными из-за неверных данных возможностями.


Слайд фирмы Gartner: «12 действий по улучшению качества данных», https://www.gartner.com/smarterwithgartner/how-to-improve-your-data-quality

Дик Вейсингер (Dick Weisinger)

Источник: блог компании Formtek
https://formtek.com/blog/data-quality-the-cost-of-bad-data/

Комментариев нет:

Отправить комментарий