Награды компании 0 наград из 3

ML Ops Engineer

3 200 - 4 500 $
От 3 до 6 лет
Полная занятость
Полный день
Описание вакансии

Key Responsibilities:

Model Deployment

Dockerize and deploy multi-agent LLM instances, ensuring compatibility with LangGraph pipelines.

Optimize model serving for low-latency, high-throughput applications, leveraging GPU/TPU resources efficiently.

Implement scalable model deployment strategies for concurrent multi-agent tasks.

Monitoring and Logging

Establish end-to-end monitoring for the AI platform, tracking system health, latency, and failure rates

Monitor LLM-specific metrics such as token latency, memory consumption, and prompt-response accuracy.

Develop drift detection mechanisms for model inputs and outputs to ensure sustained performance.

Pipeline Automation

Automate training, evaluation, and deployment workflows for LangGraph-enabled pipelines.

Build and maintain CI/CD pipelines for integrating multi-agent frameworks with backend services.

Automate versioning and rollback mechanisms for LLMs, ensuring seamless updates.

Infrastructure Management

Collaborate with DevOps teams to scale Kubernetes clusters for LangGraph chains and WebSocket-heavy APIs.

Optimize resource allocation for shared GPU/TPU inference loads across agents.

Implement caching strategies for high-reuse LLM queries and shared agent tools.

Collaboration and Documentation

Document multi-agent system workflows, LangChain integration, and API usage for internal and external stakeholders.

Collaborate with backend engineers to align model endpoints with application requirements and QA teams to resolve deployment issues.

Provide guidelines for extending LangGraph tools and chains with custom agent implementations.

Qualifications:

Experience deploying (Ray Serve/vllm/...) and optimizing (quantization/ONNX/...) LLMs in production (e.g., OpenAI, HuggingFace models).

Proficiency with containerization (Docker) and orchestration (Kubernetes, Helm).

Familiarity with LangChain, Web3 tools, or multi-agent systems is a strong plus.

Strong understanding of CI/CD tools (e.g., GitHub Actions, Jenkins).

Excellent communication skills and ability to document complex systems clearly.

What we offer:

- Hybrid with an office in Kazan/Innopolis

- Exciting growing international start-up with ambitious goals of making headways in a revolutionary, multi-billion dollar industry

- Pay in USDT

- Scrum/agile environment

- Highly skilled engineering team

- Attractive compensation plus token allocations

- Paid vacation and public holidays.

Ключевые навыки
mlops
CI/CD
ai
Docker
Kubernetes
langchain
DevOps
Jenkins
Вакансия опубликована: 13 января 2025, Казань
Похожие вакансии
ML/Data Ops инженер Middle
Новая
От 3 до 6 лет
Можно удаленно

Обслуживать клиентов: работать со счетами, пластиковыми картами и денежными переводами. Продавать банковские и страховые продукты (кредитные продукты, карты, вклады).

СимбирСофт
4,2 172 отзыва
Казань,
вчера
DevOps-инженер
Новая
Более 6 лет

Обслуживать клиентов: работать со счетами, пластиковыми картами и денежными переводами. Продавать банковские и страховые продукты (кредитные продукты, карты, вклады).

НПК Финист-софт
3,9 32 отзыва
Казань,
сегодня
EmFi Technologies Limited
Похожие вакансии
DevOps Engineer (EdTech)
Новая
От 3 до 6 лет
Откликнуться Доступен быстрый отклик с автоматическим добавлением резюме с hh.ru
DevOps-инженер
От 3 до 6 лет
Откликнуться Доступен быстрый отклик с автоматическим добавлением резюме с hh.ru
Data Engineer (middle)
Новая
От 1 года до 3 лет
Можно удаленно
Откликнуться Доступен быстрый отклик с автоматическим добавлением резюме с hh.ru
DevOps engineer (Брокерское обслуживание)
Новая
От 3 до 6 лет
Можно удаленно
Откликнуться Доступен быстрый отклик с автоматическим добавлением резюме с hh.ru
Инженер DLP
От 1 года до 3 лет
Откликнуться Доступен быстрый отклик с автоматическим добавлением резюме с hh.ru
Поиск Вакансии Ваш отзыв Зарплаты Сравнить