Решён
С чего начать изучать Data Science новичку?

ДНК_Динозавра Data Science и AI
10.5k
9

Работаю аналитиком в Excel, хочу перейти в data science. Слышал что там нужен Python и математика.

У меня: высшая математика была в универе 8 лет назад (все забыл), английский на уровне чтения документации, программировал только на VBA макросы для автоматизации отчетов.

Реально ли за полгода год въехать в тему настолько чтобы устроиться джуном? С чего конкретно начать - какие курсы, книги, проекты делать?

Решение
94
Участник • 3 ответа

За полгода - нереально. За год - если пахать по 3-4 часа каждый день.

Путь такой:

  1. Python основы (2 месяца)

    • Курс на Stepik "Программирование на Python"
    • Automate the Boring Stuff (книга)
  2. Numpy, Pandas (1 месяц)

    • Kaggle Learn: Pandas
    • Решай задачки на Pandas на том же Kaggle
  3. Математика (2-3 месяца параллельно)

    • Линейная алгебра: 3Blue1Brown на YouTube (Essence of Linear Algebra)
    • Статистика: "Голая статистика" Уилан
    • Теорвер: Khan Academy
  4. Machine Learning (3-4 месяца)

    • Курс Andrew Ng на Coursera (старый, но золото)
    • Sklearn документация + туториалы
    • Соревнования на Kaggle для практики
  5. Портфолио

    • 3-5 pet-проектов на GitHub
    • Kaggle competitions (хотя бы Bronze медаль)

Реально, но сложно. Большинство выгорают на этапе математики.

Аватар ДНК_Динозавра

Спасибо за четкий план! А какой проект лучше сделать первым для портфолио?

Аватар Елена Волкова

Начни с предсказания цен на жилье (Boston Housing Dataset) или классификации ирисов. Банально, но покажет что умеешь работать с данными, делать EDA, строить модели.

0
Участник • 1 ответ

Матан не нужен вообще. Все уже написано в либах.

Учи Pandas, Sklearn, делай пару проектов с Kaggle и иди на собесы. На джуна математику особо не спрашивают, главное чтоб код работал.

Аватар Дед ЦентОС

Это опасный совет. Без понимания математики ты не сможешь выбрать правильный алгоритм, настроить гиперпараметры или объяснить результаты модели. На собесах как раз спрашивают почему выбрал именно этот метод.

53
Участник • 2 ответа

Я перешел в DS из аналитики 2 года назад. Потратил год на обучение, еще полгода на поиск работы.

Что реально помогло:

  • Прошел курс на Яндекс Практикуме (платный, но структурированный)
  • Каждую неделю решал по 5-10 задач на LeetCode (алгоритмы нужны для собесов)
  • Сделал проект по анализу данных с работы (анонимизировал и выложил на GitHub)
  • Участвовал в 3 соревнованиях Kaggle, занял место в топ 20% в одном

На собесах больше всего вопросов было по SQL (напиши запрос с JOIN и GROUP BY) и по статистике (что такое p-value, когда использовать t-test vs chi-square).

Математику учил по ходу - когда не понимал как работает алгоритм, гуглил статьи и смотрел видео. Специально зубрить формулы не нужно, главное понимать логику.

38
Участник • 2 ответа

TL;DR: Python + Pandas + Sklearn + портфолио. Математику учи по требованию.


Развернуто:

Ты уже аналитик, значит понимаешь бизнес-задачи. Это огромный плюс. Многие программисты приходят в DS и не понимают зачем вообще нужна модель.

Шаг 1: Python синтаксис (1 месяц)

  • Codecademy Python course или Stepik

Шаг 2: Библиотеки для работы с данными (2 месяца)

  • Pandas: manipulating data
  • Matplotlib/Seaborn: визуализация
  • Numpy: массивы и операции

Шаг 3: SQL (если еще не знаешь)

  • Нужен для вытаскивания данных из БД
  • SQLBolt или Mode Analytics tutorial

Шаг 4: Machine Learning (3 месяца)

  • Coursera: Andrew Ng ML course
  • Sklearn documentation
  • Практика на Kaggle datasets

Шаг 5: Математика (параллельно шагу 4)

  • Линал: Gilbert Strang MIT lectures
  • Статистика: StatQuest на YouTube
  • Не нужно проходить полный курс высшей математики, только то что используется в ML

Шаг 6: Deep Learning (опционально, если время есть)

  • Fast.ai course
  • PyTorch/TensorFlow basics

Итого: 6-8 месяцев до первых откликов на вакансии. Реально, проверено.

0
Участник • 3 ответа

Ты не станешь DS за год. Это иллюзия.

Настоящий Data Science - это PhD уровень математики: байесовская статистика, стохастические процессы, оптимизация, теория информации. Плюс понимание железа для распределенных вычислений (Spark, Hadoop).

Все эти курсы на Coursera делают из тебя не DS, а "кнопкодава" который запускает готовые скрипты из туториалов. На собесе в нормальную компанию тебя развернут после первого же вопроса про bias-variance tradeoff или регуляризацию.

Если хочешь реально въехать в тему - поступай на магистратуру по Data Science или Computer Science. Иначе это потеря времени.

Аватар Егор Юрист

Типичный гейткипинг. Половина DS в компаниях даже не знают что такое стохастические процессы и прекрасно работают. Главное решать бизнес задачи.

3
Участник • 1 ответ

начни с курса на stepik по питону потом пройди курс по пандас на кагле дальше делай проекты и ищи работу, математика не так важна как говорят главное практика

2
Эксперт • 1 ответ

Забудь про DS. Рынок перенасыщен джунами которые прошли курсы и не могут найти работу.

Лучше прокачай свои навыки аналитика: Power BI, Tableau, продвинутый SQL. Это реально востребовано и платят нормально. А DS - это хайп который уже прошел.

47
Эксперт • 2 ответа

Работаю DS 5 лет. Вот что реально нужно джуну:

  1. Python (Pandas, Numpy, Sklearn) - это база
  2. SQL - обязательно, данные всегда в БД
  3. Статистика - понимать распределения, гипотезы, корреляции
  4. Git - версионирование кода
  5. Jupyter Notebook - для экспериментов

Математику типа линейной алгебры учи когда упрешься в непонимание как работает алгоритм. Сразу грузить себя теорией - выгоришь.

Главное - делай проекты. Возьми данные с Kaggle, поставь задачу (предсказать цену, классифицировать), реши ее, оформи в виде ноутбука с выводами. 3-4 таких проекта + активность на GitHub = можно идти на собесы.

8
Эксперт • 7 ответов

Курс Андрея Нга устарел, там еще Octave используется вместо Python. Лучше смотри курсы на Fast.ai или DeepLearning.AI specialization (обновленная версия).

Написать ответ

Премодерация гостей

Вы отвечаете как гость. Ваш ответ будет скрыт до проверки модератором. Чтобы ответ появился сразу и вы получали репутацию — войдите в аккаунт.

Будьте вежливы и соблюдайте правила платформы.