понедельник, 13 июля 2020 г.

Четыре тенденции в науке о данных в 2020 году


Данная заметка Дика Вейсингера (Dick Weisinger – на фото) была опубликована 5 июня 2020 года на блоге компании Formtek.

Наука о данных (Data Science – говоря скромнее, теория и методы обработки и анализа данных – Н.Х.) - это сочетание способов, методов и алгоритмов для сбора, обработки, анализа данных и прогнозирования на основе данных. Данная дисциплина напрямую связана с искусственным интеллектом, интеллектуальной обработкой данных (data mining) и «большими данными».

Четыре тенденции, которые мы наблюдаем в этом году в науке о данных, включают:
  • Объяснимость (explainability, см. https://medium.com/@ODSC/7-top-data-science-trends-in-2020-to-be-excited-about-cde84c9d0710 ). - Основная претензия к алгоритмам машинного обучения заключается в том, что полученные результаты часто невозможно логично объяснить, и другим исследователям часто трудно в точности воспроизвести логику, на основе которой были получены конкретные выводы. Компания Accenture предсказывает, что объяснимый искусственный интеллект находится уже на ближайшем горизонте. Accenture считает, что объяснимость станет обязательным требованием, прежде чем алгоритмам искусственного интеллекта можно будет полностью доверять.

  • Обработка естественного языка (Natural Language Processing, NLP, https://medium.com/@ODSC/7-top-data-science-trends-in-2020-to-be-excited-about-cde84c9d0710 ). - Прилагаются усилия к тому, чтобы инструменты было проще использовать. В частности, стоит ожидать, что аналитика разговорной речи и интерфейсы на естественном языке станут гораздо более распространенным явлением, и они сильно ускорят внедрение инструментов аналитики и бизнес-аналитики.

  • Обработка и анализ больших данных в облаке (Cloud-based Big Data Science, см.  https://medium.com/@ODSC/7-top-data-science-trends-in-2020-to-be-excited-about-cde84c9d0710 ). - Обработка больших наборов данных требует огромных вычислительных мощностей, часто не на постоянной основе, а всплесками. Вычисления могут быть очень интенсивными в течение коротких интервалов времени, за которыми могут следовать периоды низкой активности. Облачные вычисления хорошо соответствуют такому сценарию. Используя облачные вычисления, можно быстро выделить большие вычислительные мощности и пространства хранения, которые затем возвращаются системе, когда потребность в них заканчивается.

  • Обеспечение неприкосновенности частной жизни (защиты персональных данных) и безопасности (Privacy and Security, https://www.expresscomputer.in/big-data-analytics/4-exciting-trends-in-data-science-to-watch-out-for-in-2020/51997/ ). - В последние несколько лет в результате утечек данных были скомпрометированы огромные объемы персональных и финансовых данных. Как следствие, прилагаются значительные усилия для разработки инструментов и алгоритмов, которые лучше способны обеспечить безопасность данных и защиту персональных данных.
Дик Вейсингер (Dick Weisinger)

Источник: блог компании Formtek
http://formtek.com/blog/data-science-four-trends-in-2020/

Комментариев нет:

Отправить комментарий