Что такое Data Science

Data Science — это анализ данных для решения бизнес-задач на основе цифр. Эта дисциплина дополняет математическую статистику, которую использовали ранее. Фактически, без статистики никуда, просто к ней добавилась информатика. 

Поэтому чтобы начать карьеру в Data Science, нужно быть и программистом, и математиком одновременно. Помимо этого, нужно понимать область, в которой специалист работает с данными. Например, если работает в банке, хорошо бы отличать дебет от кредита.

Зачем нужен Data Science

С помощью анализа массивов данных можно эффективнее принимать решения, причем не только в бизнесе. Например, во время избирательных кампаний в США политические консультанты помогают продвинуть ту или иную кандидатуру, просматривая и анализируя реакцию сотен тысяч людей на слоганы, баннеры, призывы. Так они оценивают эффективность и знают, на что давить, а о чем молчать.

Data Science нужен в любых областях, где есть данные. В медицине алгоритмы помогают ставить более точные диагнозы и подбирать лекарства. В кадровой службе искусственный интеллект предупреждает, если в коллективе меняется настроение.

Но стоит помнить, что сам по себе Data Science — это просто инструмент для принятия решений. 

Какие специалисты заняты в Data Science

  • Аналитик данных (Data Analyst) — получает данные из внутренних систем аналитики и анализирует их в структурированном виде, чтобы составить для руководителя понятную картину бизнеса, основанную на точной информации. Инструменты аналитика — Excel или его аналоги, SQL и один из языков программирования. Обычно это Python.
  • Разработчик BI (Business Intelligence Developer) — проектирует внутренние хранилища данных, формирует аналитические отчеты и представляет информацию в наглядном виде. Его инструменты — BI-системы (Oracle, IBM), SQL, ETL и языки программирования.
  • Инженер по данным (Data Engineer) — специалист очень высокого уровня. Он создает и развивает инфраструктуру Big Data. Собирает, хранит и управляет потоками данных в режиме онлайн. Инструменты — Linux, облачные системы, и системы обработки больших данных: Hadoop, Spark.
  • Специалист по данным (Data Scientist) — анализирует данные. Для этого владеет статистикой, разбирается в машинном обучении и знает продвинутые методы предиктивной аналитики. Необязательное, но очень желательное условие — разбираться в отрасли бизнеса.

С чего начать изучение Data Science

Об этом мы написали подробную статью