Награды компании 0 наград из 3

Data Scientist (Middle)

От 3 до 6 лет
Полная занятость
Полный день
Описание вакансии

МАТRИ – это очень амбициозный проект, который на техническом уровне создает открытый стек технологий для децентрализованного AI. Когда это будет сделано, модели, аналогичные GPT от OpenAI будут доступны всем желающим на равноправных и недискриминационных условиях.

Однако, любая децентрализованная платформа по умолчанию является платформой с нулевым доверием. Это ставит перед нами важную технологическую задачу - обеспечение конфиденциальности данных. Нужно дать возможность пользователю хранить и давать доступ к своим данным, но при этом исключить несанкционированный доступ к ним.

ДАМАСК – это первый из системообразующих продуктов MATRИ-стека, который отвечает на этот вызов

ДАМАСК обеспечивает конфиденциальность данных и делает утечки данных бесполезными

В команде 5 человек, сейчас активно ищем опытного и уверенного Middle Data Scientist.


Технические навыки:

  • Глубокое знание Python и/или R, опыт использования библиотек для анализа данных (Pandas, NumPy, Scikit-learn, TensorFlow, PyTorch).
  • Умение разрабатывать и тестировать модели машинного обучения (регрессия, классификация, кластеризация).
  • Понимание архитектур глубокого обучения (нейронные сети, RNN, CNN, LSTM, Transformer).
  • Опыт использования фреймворков для глубокого обучения (TensorFlow, Keras, PyTorch).
  • Понимание работы трансформеров и GPT-моделей, опыт их использования или интеграции в проекты.
  • Опыт работы с языковыми моделями, включая fine-tuning, обучение с нуля, работа с предобученными моделями (например, GPT, BERT).

Знание архитектуры и принципов работы трансформеров и GPT-моделей:

  • Понимание механизма self-attention, многоголовых механизмов внимания, positional encoding, работы слоев трансформеров.
  • Опыт работы с генеративными языковыми моделями (GPT-3, GPT-4 и др.).
  • Умение применять GPT для генерации текста, решения задач обработки естественного языка (NLP) — классификация текста, извлечение сущностей, машинный перевод.

Технический стек:

  • Опыт работы с SQL для извлечения данных.
  • Знание основ статистики, A/B тестирования и интерпретации результатов.
  • Опыт работы с большими данными (Big Data), в том числе работа с распределёнными системами (Hadoop, Spark).
  • Опыт работы с облачными платформами для машинного обучения (AWS, Google Cloud, Azure).

Опыт работы:

  • 2-4 года опыта работы в области Data Science.
  • Опыт работы с крупными наборами данных, их очисткой, трансформацией и анализом.
  • Реализованные проекты, включающие внедрение машинного обучения или глубокого обучения для решения бизнес-задач.

Условия:

  • Гибкое начало рабочего дня, мы вам доверяем;
  • Разумный гибрид - 1-2 дня нужно бывать в офисе для встреч с командой (Сколково, БЦ Амальтея);
  • ДМС со стоматологией оформляем с после испытательного срока;
  • Обучение и помощь в развитии - мы вкладываемся в ваше профессиональное развитие;
  • У нас работают адекватные и приятные люди, не душные и не снобы.

Как мы нанимаем:

  • Короткое интервью с HR по телефону;
  • Техническое собеседование с тимлидом команды максимум на 1,5 часа;
  • Оффер или обратная связь по встрече.
Ключевые навыки
Python
Нейронные сети
TensorFlow
Keras
PyTorch
self-attention
positional encoding
gpt-3
gpt-4
SQL
Big Data
Hadoop
Spark
Azure
Вакансия опубликована: вчера, Москва
Похожие вакансии
ML разработчик/middle/senior
Виасат Тех
Новая
От 3 до 6 лет
Можно удаленно
Middle Data Scientist MLE
200 000 - 350 000
Автомакон
Новая
От 1 года до 3 лет
Можно удаленно
МАТРИ
нет отзывов
0%
Рекомендуют
Похожие вакансии
Senior Data Scientist (NLP)
От 3 до 6 лет
Senior Data Scientist
От 3 до 6 лет
Можно удаленно
Middle Data scientist (ASR, NLP, LLM)
От 1 года до 3 лет
Data Scientist
От 1 года до 3 лет
Опыт в разделе вакансии на Dream Job