суббота, 30 сентября 2023 г.

Большие данные: Мощь и подводные камни управляемого данными мира

Данная заметка Дика Вейсингера (Dick Weisinger – на фото) была опубликована 16 августа 2023 года на блоге компании Formtek.

Всего за два года было сгенерирован умопомрачительный объём данных, составляющий 90% все имеющихся в мире данных ( https://www.sciencedaily.com/releases/2013/05/130522085217.htm ), утопив интернет-компании в океане информации. Этот потоп данных, известный как «большие данные», одновременно открывает захватывающие возможности и порождает сложные проблемы.

Мой комментарий: С моей точки зрения, отождествлять «большие данные» с большими объёмами данных – грубая ошибка. Суть больших данных не в объёмах как таковых (к тому же восприятие масштаба со временем меняется – я помню времена, когда мегабайт воспринимался как сумасшедший объём данных), а в возможности извлечения их них скрытых закономерностей, для чего данные должны быть достаточно содержательными, достаточно качественными и с известным происхождением.

Большие данные изменили правила игры в исследованиях, предоставив для анализа огромные объёмы информации. Технологические гиганты, такие как Facebook и Google, используют эту золотую жилу данных, обеспечивая исследователям беспрецедентные возможности по извлечению знаний и представлений. Даже за пределами этих компаний доступ к большим данным позволяет проводить новаторские исследования.

Изучение контента больших данных раскрывает интригующие сдвиги в человеческом поведении. Сообщения становятся короче по мере роста популярности социальных платформ, таких как Twitter, а молодое поколение предпочитает визуальное повествование тексту. Эти трансформации отражают эволюцию коммуникационных моделей в цифровую эпоху.

Однако обилие больших данных вызывает опасения. Объединение разрозненных данных для коммерческого использования (например, для целей адресной рекламы) выдвигает на первый план вопросы обеспечения неприкосновенности частной жизни и защиты персональных данных. Защита персональных данных становится первостепенной задачей при связывании местоположения и предпочтений.

Доверенность, надёжность и точность имеют ключевое значение в море данных. Исследователи изучают комбинации источников данных с целью оценить достоверность контента социальных сетей. Поскольку информация фрагментируется по многим каналам, становится жизненно важным отличать надёжные источники от дезинформации.

Влияние больших данных во время значительных событий неоспоримо. Платформы социальных сетей стали незаменимыми инструментами для распространения информации в режиме реального времени. Однако они одновременно демонстрируют и свои слабые места, способствуя путанице и распространяя дезинформацию.

Мой комментарий: Хотя контент социальных сетей можно собирать и использовать как большие данные, вряд ли уместно прямо приравнивать социальные сети (да и любой иной источник данных, если на то пошло) к большим данным.

В эту эпоху экспоненциального роста объёмов данных мы стоим на пороге появления трансформационных идей и представлений. Ответственно используя большие данные и решая связанные с ними проблемы, мы можем раскрыть их огромный потенциал. Давайте осторожно прокладывать путь в этом управляемом данными мире, обеспечивая этичное использование данных и раскрывая неисчислимые возможности, скрытые в цифровом ландшафте.

Мой комментарий: Тем временем как передовые идеологи, так и практики начинают всё чаще говорить о том, что большие данные – это всё-таки вариант «последней надежды», который имеет смысл применять тогда, когда нет возможности получить целенаправленно собранные, высококачественные и надёжные «малые данные».

Дик Вейсингер (Dick Weisinger)

Источник: блог компании Formtek
https://formtek.com/blog/big-data-the-power-and-pitfalls-of-a-data-driven-world/

Комментариев нет:

Отправить комментарий