Решён
Почему язык R настолько популярен среди статистиков?

Занимаюсь data science, Python знаю прилично. Постоянно вижу что в академической среде и среди биостатистиков все сидят на R. При этом Python кажется куда более универсальным, библиотеки богаче, деплоить проще.

Чем обоснована такая популярность R именно в этих кругах? Это исторически сложилось или R реально лучше для каких то задач?

Решение
85
Участник • 2 ответа

Коротко: R придумали статистики для статистиков, Python придумали программисты для программистов.

R с самого начала строился вокруг векторизованных операций над данными и статистических тестов. В базовом R есть вещи, которые в Python до сих пор требуют отдельных пакетов и обходных решений. Смешанные модели, GAM, survival analysis - в R это делается в три строки, в Python надо либо в statsmodels ковыряться, либо R звать через rpy2.

Плюс экосистема публикаций. Rmarkdown и Quarto позволяют генерировать воспроизводимые отчеты прямо из кода, что в академии критично. Журналы и конференции привыкли именно к такому формату.

Аватар Охранные Системы

Добавлю про Rmarkdown: это реально киллер-фича для академии. Пишешь статью, вставляешь код, компилируешь - и сразу PDF с таблицами и графиками. Воспроизводимость исследования из коробки.

43
Участник • 2 ответа

ggplot2.

Это 90% ответа на твой вопрос. Нет нигде больше такой библиотеки для визуализации данных. Grammar of Graphics, слои, темы, фасетирование - все это в Python через matplotlib/seaborn делается раза в три многословнее и все равно выглядит хуже.

23
Участник • 1 ответ

Чисто историческое наследие. Профессора учились на R, учат на R. Студенты приходят в индустрию с R. Рецензенты в журналах хотят видеть R-код. Это самовоспроизводящийся цикл.

При этом по объективным метрикам Python давно обогнал R в реальных задачах ML. Но академия живет по своим часам.

55
Эксперт • 2 ответа

Работаю в клинических исследованиях. R тут стандарт де-факто по одной конкретной причине: пакеты для анализа клинических данных (survival, coxph, mixed effects, multiple imputation) в R зрелее, лучше задокументированы и прошли валидацию под FDA и EMA требования. CRAN вообще серьезнее относится к качеству пакетов чем PyPI.

Когда твои результаты идут в регуляторный орган - ты не можешь рисковать инструментом. R в этой нише доверяют.

12
Участник • 3 ответа

Тем не менее я бы не переоценивал R для настоящего ML. Сделать нормальный нейросетевой пайплайн на R - боль. Torch и Keras под R есть, но поддержка на голову слабее чем в Python. Для классической статистики R хорош, дальше Python.

16
Эксперт • 1 ответ

Обоими пользуюсь уже лет 8. Холивар Python vs R напоминает холивар vim vs emacs - бесконечный и бессмысленный. В академии R, в продакшене Python, точка. Учи оба на базовом уровне и не заморачивайся.

Написать ответ

Премодерация гостей

Вы отвечаете как гость. Ваш ответ будет скрыт до проверки модератором. Чтобы ответ появился сразу и вы получали репутацию — войдите в аккаунт.

Будьте вежливы и соблюдайте правила платформы.