Решён
Что надо учить для ML? Четкий роудмеп

Хочу войти в машинное обучение. Бэкграунд - фронтенд на React, 2 года опыта. Математику в универе прогуливал, сейчас жалею.

Видел кучу роудмепов в интернете, но они все какие то размытые. "Изучите линейную алгебру" - окей, а что конкретно? Какие темы? В каком порядке?

Нужен четкий план что учить для ML. С конкретными темами, курсами, книгами. Чтобы через год можно было джуном устроиться.

Решение
228
Эксперт • 5 ответов

Окей, даю роудмеп который реально работает. Сам прошел этот путь, сейчас мидл в ML.

Этап 1: Математика (2-3 месяца)

Линейная алгебра - без нее никуда:

  • Векторы и матрицы (операции, умножение)
  • Собственные значения и собственные векторы
  • SVD разложение
  • Курс: 3Blue1Brown "Essence of Linear Algebra" на ютубе (бесплатно, визуально)

Матан (базовый):

  • Производные (частные производные!)
  • Градиент, якобиан
  • Цепное правило (chain rule) - это основа backpropagation
  • Курс: Khan Academy, раздел Calculus

Теорвер и статистика:

  • Распределения (нормальное, биномиальное)
  • Байесовский вывод
  • Гипотезы, p-value
  • Книга: "Голая статистика" Уилан - для старта норм

Этап 2: Python для DS (1-2 месяца)

Ты уже знаешь JS, питон выучишь быстро. Фокус на библиотеки:

  • NumPy - основа всего
  • Pandas - работа с данными
  • Matplotlib/Seaborn - визуализация
  • Курс: Kaggle Learn (бесплатные мини-курсы)

Этап 3: Классический ML (2-3 месяца)

  • Линейная регрессия
  • Логистическая регрессия
  • Деревья решений, Random Forest
  • Градиентный бустинг (XGBoost, LightGBM)
  • SVM
  • Кластеризация (K-means, DBSCAN)
  • Курс: Andrew Ng на Coursera - классика жанра
  • Практика: Kaggle соревнования для начинающих

Этап 4: Deep Learning (2-3 месяца)

  • Нейросети, backpropagation
  • CNN для картинок
  • RNN/LSTM для последовательностей
  • Трансформеры (attention mechanism)
  • Фреймворк: PyTorch (не TensorFlow, он умирает)
  • Курс: fast.ai - практический подход сверху вниз

Этап 5: Портфолио (1-2 месяца)

3-5 проектов на GitHub:

  • Классификация (датасет с Kaggle)
  • NLP задача (сентимент анализ)
  • Что то с картинками (детекция или сегментация)

Итого: 8-13 месяцев при 2-3 часах в день.

Главное - не застревай в теории. После каждой темы делай мини-проект. Kaggle - твой лучший друг.

Аватар Кирилл Орлов

Почему PyTorch а не TensorFlow? На хх полно вакансий с TF

Аватар Почти Начальник

TF вакансии - это легаси. Все новые проекты и ресерч на PyTorch. Если выучишь один - второй освоишь за неделю, они похожи

Аватар Алексей Кузнецов

Огонь, спасибо! Сохранил себе. Начну с 3Blue1Brown, давно хотел посмотреть

86
Эксперт • 4 ответа

Год на джуна ML - оптимистично. Не хочу расстраивать, но конкуренция сейчас дикая. На одну позицию 200-300 откликов.

Если цель именно работа а не знания - смотри в сторону MLOps. Там твой фронтенд бэкграунд пригодится (деплой моделей, API, дашборды). Порог входа ниже, вакансий больше, платят не хуже.

Чистый ML research без PhD практически нереален

45
Эксперт • 4 ответа

Математику можно учить параллельно с практикой. Я начинал вообще без матана - просто брал готовые модели из sklearn и обучал на датасетах. Понимание пришло потом, когда понадобилось тюнить гиперпараметры и разбираться почему модель не сходится.

Не трать 3 месяца на чистую математику, выгоришь. Лучше чередуй: неделя теории - неделя практики.

58
Эксперт • 1 ответ
# Вот тебе минимальный пример чтобы понять что такое ML
# Установи: pip install scikit-learn

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# Загружаем данные
data = load_iris()
X_train, X_test, y_train, y_test = train_test_split(
    data.data, data.target, test_size=0.2
)

# Обучаем модель
model = RandomForestClassifier()
model.fit(X_train, y_train)

# Проверяем
predictions = model.predict(X_test)
print(f"Accuracy: {accuracy_score(y_test, predictions)}")

10 строк кода и у тебя работающая ML модель. Начни с этого, потом разбирайся что внутри.

108
Участник • 1 ответ

Работаю в ML 6 лет, найму джунов.

Что реально смотрю на собесе:

  1. Понимание bias-variance tradeoff
  2. Как бороться с переобучением
  3. Метрики (precision, recall, F1, ROC-AUC) - когда какую использовать
  4. Умение объяснить как работает градиентный спуск
  5. Опыт с реальными грязными данными (пропуски, выбросы)

Код можно загуглить, а вот понимание либо есть либо нет. Kaggle соревнования - хорошая практика, но там данные уже почищены. В реальности 80% времени тратишь на препроцессинг.

Написать ответ

Премодерация гостей

Вы отвечаете как гость. Ваш ответ будет скрыт до проверки модератором. Чтобы ответ появился сразу и вы получали репутацию — войдите в аккаунт.

Будьте вежливы и соблюдайте правила платформы.