Награды компании 0 наград из 3
Забота о сотрудниках Получена: 20.11.2024
89% выполнено
Есть у 1.2% компаний на Dream Job

Работодатель поддерживает достойные условия труда и отдыха для сотрудников

Карьерный рост Получена: 20.11.2024
87% выполнено
Есть у 2.3% компаний на Dream Job

В компании есть возможности для карьерного и профессионального роста сотрудников

Корпоративная культура Получена: 20.11.2024
97% выполнено
Есть у 3.7% компаний на Dream Job

Сотрудники отмечают профессионализм руководства и хорошую атмосферу в коллективе

Trainee CV Engineer (Intelligent document processing)

Нет опыта
Стажировка
Полный день
Описание вакансии

Наша команда занимается задачами, связанными с интеллектуальной обработкой документов, созданием систем OCR/HCR, парсингом таблиц, работой со структурированными документами (ID, формы и т.д.), извлечением сущностей и фактов из текстовой информации.

Сейчас в пайпланах используется более десятка различных DL моделей, выстроен процесс сбора и разметки данных, собственная команда разметчиков, инфраструктура трекинга экспериментов и управления датасетам, кластер из нескольких DGX для проведения экспериментов)

Нашими решениями (SberOCR, DocID) пользуется уже несколько десятков команд банка и мы продолжаем активно вкладываться в ресерч с целью улучшение существующих продуктов и развития новых инициатив.

Мы расширяем команду и ищем коллег для работы над сложными задачами, связанными с анализом структуры документов, восстановлением порядка чтения с учетом семантики и улучшения существующих решений.

Предстоящие задачи:

  • развитие собственного движка обработки документов OCR
  • развитие transformer-based и graph-based подходов к анализу структуры документов (layout analysis) и восстановлению порядка чтения (reading order)
  • развитие text spotting методов
  • участие в создание универсальных foundation models для обработки документов
  • разработка методов исправления опечаток на основе LLM
  • улучшение генераторов синтетических данных.

Обязанности:

  • имплементация и обучение моделей OCR, детекции текста, детекции объектов, сегментации и классификации
  • чтение статей и перекладывание SOTA на пром рельсы, в том числе GCN, LayoutLM V3, UDOP, Donut, UNIfied scene Text Spotter (UNITS)
  • запуск распределенного обучения на GPU кластере MLSpace (Кристофари)
  • организация циклов дообучения на новых данных (постановка задач разметчикам, запуск crowdsource майнинга данных и т.д).
  • оптимизация моделей для исполнения: квантизация и дистилляция моделей
  • портирование на OpenVINO, TensorRT
  • релизы новых моделей в среды исполнения.

Требования:

  • отличное знание одного из pytorch, tf + numpy, sklearn, pandas
  • опыт разработки/обучения/внедрения одной или нескольких типов моделей: object detection , semantic segmentation, instance segmentation, OCR, text detection, text spotting, transformers, multimodal transformers и т.д.
  • хорошее знание классического CV и OpenCV
  • хорошее знание алгоритмов, python3, ООП, SOLID, git, docker
  • желание изучать новые подходы, модели и технологии.

Плюсом будет:

  • хороший профиль на github
  • медальки на Kaggle
  • опыт в обучение мультимодальных моделей
  • опыт работы с ClearML/MLflow, Kubeflow, DVC/LakeFS, S3/Minio, Airflow, Jenkins, Grafana.

Мы предлагаем:

  • официальное оформление (срочный трудовой договор на 3 месяца с возможностью продления ещё на 3 месяца)
  • возможность проходить обучения для развития hard/soft skills на нашей корпоративной digital-платформе
  • рабочее место в одном из лучших IT-офисов Москвы на Кутузовском проспекте (Гран-при Best Office Awards 2020) с собственным фитнес-залом, массажными креслами, снэк-поинтами
  • скидки от компаний-партнёров экосистемы Сбера.
Вакансия опубликована: 1 октября 2024, Москва
Похожие вакансии
Стажер инженер-программист Python
От 1 года до 3 лет

Обслуживать клиентов: работать со счетами, пластиковыми картами и денежными переводами. Продавать банковские и страховые продукты (кредитные продукты, карты, вклады).

ГК «ХайТэк»
3,4 13 отзывов
Москва,
5 ноября 2024
DevOps/SRE инженер (стажер)
Нет опыта

Обслуживать клиентов: работать со счетами, пластиковыми картами и денежными переводами. Продавать банковские и страховые продукты (кредитные продукты, карты, вклады).

Яндекс
3,8 1 850 отзывов
Москва,
25 октября 2024

Junior java разработчик

Москва,
ноябрь 2024
Работаю в компании
5,0
Что нравится
Гибкость в условиях работы


Корпоративная техника на уровне


Большая программа для самостоятельного развития
Что можно улучшить
Много переработок
Излишняя бюрократия

Ведущий инженер-программист

Санкт-Петербург,
ноябрь 2024
Работаю меньше года
4,8
Что нравится
На самом деле не могу найти в работе в it секторе Сбера какие-то минусы. Сбер дает возможность полной смены функциональности (раньше я работал юристом), хороший уровень дохода и развитие.
Что можно улучшить
Слишком много бюрократии, но я бы не сказал, что это минус т.к. разработку она не затрагивает.

Главный инженер по разработке

Москва,
ноябрь 2024
Работаю 1-2 года
4,0
Что нравится
Стек технологий, уверенность в работодателе, очень дружелюбный коллектив, помогает освоится
Что можно улучшить
Возможно, социальный пакет и приложение бронирования парковки для сотрудников
СБЕР
4,0
Очень хорошо
77%
Рекомендуют
Оценки по категориям
4,3
Условия труда
4,4
Коллектив
3,8
Руководство
4,0
Уровень дохода
3,9
Условия для отдыха
3,8
Возможности роста
Преимущества и льготы компании
Сотрудники чаще всего указывали следующие льготы и преимущества на основании 20 532 отзывов
91% Своевременная оплата труда
79% Оплата больничного
76% Медицинское страхование
75% Наличие кухни, места для обеда
58% Профессиональное обучение
57% Удобное расположение работы
44% Корпоративные мероприятия
42% Система наставничества
23% Гибкий рабочий график
19% Место для парковки
17% Удаленная работа
11% Оплата транспортных расходов
10% Корпоративный транспорт
10% Оплата мобильной связи
1% Компенсация питания
Поиск Вакансии Ваш отзыв Зарплаты Сравнить