Middle+ Data Scientist в команду Разработка AI-решений БСР
Мы разрабатываем AI-сервисы для всех продуктовых команд Блока "Стратегия и развитие", совмещая Classic NLP и LLM-based подходы для достижения максимального качества наших комплексных решений:
· Мэтчим разные сущности банка (продукты, поручения, цели, встречи, инициативы, комментарии и др.) для создания полной информационной картины, позволяющей руководителям принимать AI-driven решения
· Формируем рекомендации по тайм-менеджменту и планированию задач в рамках стратегических направлений на основе разнообразных внутренних источников информации (встречи в календаре, поручения, внешние мероприятия)
· Классифицируем как короткие тексты (Jira-задачи, комментарии), так и длинные (внутренние документы Сбера) для оптимизации внутренних процессов банка
· Развиваем направление доменной адаптации для прокачивания стримов семантического поиска, ранжирования и прочих NLP downstream-задач
· Участвуем в развитии глобального направления ИИ-агентов и регулярно используем в работе современные подходы на основе LLM (External Tools, Reasoning, Reflection)
· Проверяем гипотезы любой сложности для получения Data-driven инсайтов, которые становятся предметом обсуждения на стратегических сессиях руководства банка
В наши глобальные планы входит:
· Шэринг наших решений для переиспользования другими командами банка
· Работа над маркетплейсом ключевых AI-решений для быстрой проверки гипотез бизнес-заказчиками блока
Обязанности
· Разработка и внедрение ML-моделей от этапа MVP до ПРОМ-решения (CRISP-DM)
· Решение задач NLP: Preprocessing, Classification, Summarization (Ext/Abst), Sentence Compression, Simplification, NER, Semantic Search, Clustering
· Разработка прототипов на основе LLM с использованием фреймворков для работы с LLM, таких как LangChain/GigaChain
· Адаптация и обучение языковых моделей (LLM) Сбера на основе внутренних и внешних данных, Prompt Tuning, RAG
· Индексация и ранжирование текстовых документов разной длины
· Взаимодействие с бизнес-заказчиком для выявления требований и самостоятельная постановка задач
· Определение ML SysDes решения с учетом разрешенного технологического стека
· Участие в валидации и автомониторинге моделей, проведение A/B тестирования
Требования
· образование в техническом ВУЗе в сфере компьютерных наук, прикладной математики или статистики. Наиболее приоритетны: ВШЭ, МФТИ, МГУ, МИФИ
· опыт в разработке NLP моделей и рекомендательных систем (желательно)
· понимание жизненного цикла моделей (CRISP-DM)
· умение переводить бизнес-постановку задачи в ML-постановку, грамотная интерпретация полученных результатов
· высокий уровень владения ядром Python и SQL
· свободное владение базовыми библиотеками на Python, в том числе: pandas, numpy, matplotlib, seaborn
· знание фреймворков, библиотек, алгоритмов машинного обучения: Scikit-learn, Pytorch, XGBoost, CatBoost, TensorFlow, transformers
· опыт работы с NLP библиотеками: pymorphy2, NLTK, Gensim, spaCy, regexp
· WEB-фреймворки: FastAPI (async methods), Flask и др.
· знание архитектур нейронных сетей: RNN, LSTM, трансформеры (BERT, BART, T5)
· знание фреймворков для работы с LLM (LangChain/GigaChain, LangServe/GigaServe, LlamaIndex и др.)
· контейнеризация: Docker, OpenShift
· Linux
· инструменты DevOps (MLOps): Git, Jira, Bitbucket, Nexus, Jenkins
· индустриальный опыт разработки, обучения, тестирования, выведения моделей в эксплуатацию и мониторинга качества (не менее 3-х лет)
· технический английский (статьи, документация)
· преимущество: pet-projects на Github, владение Confluence, Jira, медали на Kaggle, готовность брать на себя коммуникацию с бизнес-заказчиком, опыт DS-менторинга
Условия
· Удаленка или гибкий гибрид (обсуждаем индивидуально)
· Современный IT-офис вблизи Москва-Сити с фитнес залом;
· Высокий уровень дохода (обсуждаем индивидуально), готовые премии
· Ипотека выгоднее на 4% для каждого сотрудника и льготные условия кредитования
· Бесплатная подписка СберПрайм+
· Скидки на продукты компаний-партнеров
· ДМС с первого дня и льготное страхование для близких
· Корпоративная пенсионная программа
· Обучение за счет Компании: онлайн курсы в Виртуальной школе Сбера и неограниченный доступ к библиотеке, обучение в Корпоративном университете, тренинги, митапы и возможность получить новую квалификацию
Крупнейшее DS&AI community – более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты