Решён
Что надо учить для ML? Четкий роудмеп

Question

Решён
Что надо учить для ML? Четкий роудмеп

4 месяца назад

18.7k

6

Хочу войти в машинное обучение. Бэкграунд - фронтенд на React, 2 года опыта. Математику в универе прогуливал, сейчас жалею.

Видел кучу роудмепов в интернете, но они все какие то размытые. "Изучите линейную алгебру" - окей, а что конкретно? Какие темы? В каком порядке?

Нужен четкий план что учить для ML. С конкретными темами, курсами, книгами. Чтобы через год можно было джуном устроиться.

Data Science Machine Learning Python Математика Обучение Роудмеп

Владислав Козлов · Answer 1 · 2026-03-24T14:01:33+03:00

Окей, даю роудмеп который реально работает. Сам прошел этот путь, сейчас мидл в ML.

Этап 1: Математика (2-3 месяца)

Линейная алгебра - без нее никуда:

Векторы и матрицы (операции, умножение)
Собственные значения и собственные векторы
SVD разложение
Курс: 3Blue1Brown "Essence of Linear Algebra" на ютубе (бесплатно, визуально)

Матан (базовый):

Производные (частные производные!)
Градиент, якобиан
Цепное правило (chain rule) - это основа backpropagation
Курс: Khan Academy, раздел Calculus

Теорвер и статистика:

Распределения (нормальное, биномиальное)
Байесовский вывод
Гипотезы, p-value
Книга: "Голая статистика" Уилан - для старта норм

Этап 2: Python для DS (1-2 месяца)

Ты уже знаешь JS, питон выучишь быстро. Фокус на библиотеки:

NumPy - основа всего
Pandas - работа с данными
Matplotlib/Seaborn - визуализация
Курс: Kaggle Learn (бесплатные мини-курсы)

Этап 3: Классический ML (2-3 месяца)

Линейная регрессия
Логистическая регрессия
Деревья решений, Random Forest
Градиентный бустинг (XGBoost, LightGBM)
SVM
Кластеризация (K-means, DBSCAN)
Курс: Andrew Ng на Coursera - классика жанра
Практика: Kaggle соревнования для начинающих

Этап 4: Deep Learning (2-3 месяца)

Нейросети, backpropagation
CNN для картинок
RNN/LSTM для последовательностей
Трансформеры (attention mechanism)
Фреймворк: PyTorch (не TensorFlow, он умирает)
Курс: fast.ai - практический подход сверху вниз

Этап 5: Портфолио (1-2 месяца)

3-5 проектов на GitHub:

Классификация (датасет с Kaggle)
NLP задача (сентимент анализ)
Что то с картинками (детекция или сегментация)

Итого: 8-13 месяцев при 2-3 часах в день.

Главное - не застревай в теории. После каждой темы делай мини-проект. Kaggle - твой лучший друг.

Алексей Бирюков · Answer 2 · 2026-03-24T22:14:19+03:00

Год на джуна ML - оптимистично. Не хочу расстраивать, но конкуренция сейчас дикая. На одну позицию 200-300 откликов.

Если цель именно работа а не знания - смотри в сторону MLOps. Там твой фронтенд бэкграунд пригодится (деплой моделей, API, дашборды). Порог входа ниже, вакансий больше, платят не хуже.

Чистый ML research без PhD практически нереален

Григорий Носов · Answer 3 · 2026-03-25T05:48:23+03:00

Математику можно учить параллельно с практикой. Я начинал вообще без матана - просто брал готовые модели из sklearn и обучал на датасетах. Понимание пришло потом, когда понадобилось тюнить гиперпараметры и разбираться почему модель не сходится.

Не трать 3 месяца на чистую математику, выгоришь. Лучше чередуй: неделя теории - неделя практики.

Иван Черкасов · Answer 4 · 2026-03-25T14:36:32+03:00

# Вот тебе минимальный пример чтобы понять что такое ML
# Установи: pip install scikit-learn

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# Загружаем данные
data = load_iris()
X_train, X_test, y_train, y_test = train_test_split(
    data.data, data.target, test_size=0.2
)

# Обучаем модель
model = RandomForestClassifier()
model.fit(X_train, y_train)

# Проверяем
predictions = model.predict(X_test)
print(f"Accuracy: {accuracy_score(y_test, predictions)}")

10 строк кода и у тебя работающая ML модель. Начни с этого, потом разбирайся что внутри.

Артём Игнатьев · Answer 5 · 2026-03-26T14:32:30+03:00

Работаю в ML 6 лет, найму джунов.

Что реально смотрю на собесе:

Понимание bias-variance tradeoff
Как бороться с переобучением
Метрики (precision, recall, F1, ROC-AUC) - когда какую использовать
Умение объяснить как работает градиентный спуск
Опыт с реальными грязными данными (пропуски, выбросы)

Код можно загуглить, а вот понимание либо есть либо нет. Kaggle соревнования - хорошая практика, но там данные уже почищены. В реальности 80% времени тратишь на препроцессинг.

Михаил Лисицын · Answer 6 · 2026-03-28T10:38:24+03:00

23

Михаил Лисицын Эксперт • 5 ответов

4 месяца назад

Держи ссылки:

https://www.coursera.org/learn/machine-learning - курс Эндрю Ына
https://www.fast.ai/ - практичный курс по DL
https://www.kaggle.com/learn - бесплатные мини-курсы

Помогли .ру

Решён
Что надо учить для ML? Четкий роудмеп

6 ответов

Написать ответ