Есть ответы
С какими данными вы работаете? Вам это нравится?

Максим Орлов Анализ данных
6k
8

Всем привет. Работаю третий год дата-аналитиком в ретейле. Ковыряюсь в транзакциях, чеках, остатках на складах. Pandas, SQL, немного Airflow.

Вроде все норм, зп хорошая, но данные настолько скучные что хочется выть. Каждый день одно и то же: почему упали продажи йогуртов в Саратове, сколько памперсов завезти на склад в Краснодаре.

Хочу понять, а где интереснее? Кто с какими данными работает и кайфует ли от этого? Может стоит сменить домен?

78
Участник • 1 ответ

Медицинские данные. Работаю в стартапе, который делает ML-модели для ранней диагностики рака по КТ-снимкам.

Кайфую ли? Когда модель ловит опухоль на ранней стадии, которую радиолог пропустил - да, кайфую. Когда сижу неделю и дебажу пайплайн аугментации, потому что одна больница присылает DICOM в одном формате, а другая в другом - нет, не кайфую.

Но смысл есть. И это важнее чем "интересность" данных. Йогурты vs раковые клетки, сам понимаешь.

Минус: данные чувствительные, деперсонализация занимает кучу времени, этические комитеты тормозят каждый проект на месяцы.

Аватар Максим Орлов

Звучит как мечта если честно. А как вы туда попали? Нужно ли медицинское образование или хватает технического бэкграунда?

Аватар Макс

Техническое. Но за первый год пришлось выучить базовую анатомию и радиологическую терминологию, иначе с врачами невозможно общаться. Они говорят на своем языке

45
Участник • 3 ответа

Геоданные. Спутниковые снимки, GPS-треки, данные с IoT-датчиков на сельхозтехнике.

Мы делаем precision farming: карты урожайности, прогнозы заболеваний растений по мультиспектральным снимкам, оптимизация маршрутов комбайнов. PostGIS, QGIS, Python с rasterio и geopandas.

Скучно бывает когда целый спринт уходит на парсинг кривых шейпфайлов от Росреестра. Но когда видишь как фермер экономит 30% удобрений потому что твоя модель правильно сегментировала поле - прям чувствуешь пользу.

62
Участник • 3 ответа

Финтех, антифрод. Анализирую транзакции на предмет мошенничества.

Звучит круто, на деле 90% работы - это борьба с дисбалансом классов (фрод = 0.01% от всех транзакций) и объяснение бизнесу почему нельзя блокировать всех подозрительных, потому что false positive = злой клиент = потеря денег.

Нравится ли? Когда ловишь схему на миллионы - адреналин. Когда тюнишь пороги алерта четвертый месяц подряд - хочется в лес уехать.

Но вот что скажу: скука в данных - это не про данные. Это про задачу. Я знаю ребят, которые кайфуют от ретейл-аналитики потому что им дали свободу экспериментировать. Может тебе не домен менять, а команду?

38
Участник • 1 ответ

NLP в юриспруденции. Обучаю модели классифицировать судебные решения, извлекать из них нормы и прецеденты.

Самый треш - это качество исходных данных. Судебные акты в России - это PDF-помойка. OCR-распознавание путает букву "о" с нулем, абзацы слипаются, нумерация статей сбоит. 60% времени трачу на чистку.

Зато когда работает, юристы смотрят как на волшебника. Они привыкли руками искать прецеденты по базам и тратить на это дни. А тут бац, 15 секунд и выборка готова.

31
Участник • 1 ответ

Логистика. Оптимизация маршрутов доставки для крупного маркетплейса.

Ненавижу каждую минуту)) Данные грязные, API курьерских служб врут, GPS-координаты прыгают, заказчик хочет "чтобы всё было доставлено за час в радиусе 50 км от МКАДа".

Но платят хорошо, поэтому терплю. А кайф от данных - это мне кажется вообще миф. Кайф от результата бывает, от данных - нет. Данные по определению грязные, кривые и неполные. Везде.

22
Участник • 1 ответ

Брат, три года в ретейле это нормально. Не гони. У меня знакомый 8 лет в телекоме аналитиком, считает отток абонентов. Доволен. Потому что нашел себе сайд-проект: по вечерам анализирует данные Strava и делает тепловые карты беговых маршрутов для своего города. Выложил на гитхаб, набрал 2к звезд.

Смысл в том что скучная работа может финансировать интересные хобби. Не обязательно искать идеальную работу где и данные крутые, и зп хорошая, и коллектив. Такого не бывает.

49
Участник • 4 ответа

а я работаю с данными гос закупок, парсю zakupki.gov и строю дашборды по тендерам, чтобы находить аффилированных поставщиков

нравится? ну как сказать, каждый день чувствую себя детективом, но иногда находишь такое что лучше бы не находил))

56
Участник • 2 ответа

Биоинформатика. Геномные данные.

Обрабатываю результаты секвенирования, ищу мутации, ассоциированные с наследственными заболеваниями. BAM/FASTQ файлы по 200-500 Гб на один образец. Кластер на 128 ядер задыхается.

Нравится - не то слово. Чувствую что делаю что то настоящее. Когда находишь патогенную мутацию и пациент впервые в жизни получает диагноз после 10 лет хождения по врачам - это несравнимо ни с какими йогуртами. Извини.

Плачу? Да. Зп на 30-40% ниже чем в коммерции.

Написать ответ

Премодерация гостей

Вы отвечаете как гость. Ваш ответ будет скрыт до проверки модератором. Чтобы ответ появился сразу и вы получали репутацию — войдите в аккаунт.

Будьте вежливы и соблюдайте правила платформы.