Junior Data Analyst
Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет строить MVP-алгоритмы расчета различных метрик автономных машин.
Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Spark и polars/pandas где объемы данных позволяют.
Примеры задач:
- Выстраивать коммуникацию смежными отделами;
- Разработать с SQL/pyspark, алгоритмами расчета, метриками;
- Документирование разработанных алгоритмов;
- Проверять качество расчета метрики после установки на регламентный расчет Data инженерами;
- Создавать или дорабатывать новые математические модели под изменяющиеся условия среды и потребности бизнеса;
Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, S3, Clickhouse, Metabase, Superset
Что мы ждем от кандидата:
- Навыки программирования для решения задач математического моделирования
- Хорошее знание SQL (на уровне джойнов и оконных функций)
- Был опыт анализа данных с использованием Python (Pandas/Polars)
- Опыт работы хотя бы с одной из BI систем (Metabase/Superset/Tableau/DataLens)
- Знание классических алгоритмов машинного обучения
Будет плюсом:
- Опыт работы со Spark
- Опыт работы с catboost/xgboost/scikit-learn
- Опыт работы с Clickhouse
- Опыт работы с Airflow/Luidgi/Dagster
Оформление на срочный трудовой договор (декретная ставка), с возможностью пролонгации.