← В ленту
Senior
Регистрация: 14.01.2026

Екатерина Ефимова

Специализация: AI Tech Lead
— AI Tech Lead / Архитектор с 11+ годами инженерного опыта и 5+ лет в управлении командами. — Разрабатываю и внедряю масштабируемые AI-решения: от NLP-агентов и RAG-систем до визуальных моделей и ML-инфраструктуры. — Проектирую end-to-end пайплайны, оптимизирую inference, руковожу командами 5–30 человек, участвую в R&D и внедрении моделей в продакшн.
— AI Tech Lead / Архитектор с 11+ годами инженерного опыта и 5+ лет в управлении командами. — Разрабатываю и внедряю масштабируемые AI-решения: от NLP-агентов и RAG-систем до визуальных моделей и ML-инфраструктуры. — Проектирую end-to-end пайплайны, оптимизирую inference, руковожу командами 5–30 человек, участвую в R&D и внедрении моделей в продакшн.

Скиллы

AI
RAG
DevOps
LangChain
HuggingFace
Transformers
Cursor
Copilot
Claude
Gemini
Python
Kubernetes
Prometheus
Grafana
vLLM
Stable Diffusion
Video Diffusion

Опыт работы

AI Lead / Архитектор AI-решений
с 02.2024 - По настоящий момент |Raft DS
LLM, LangChain, RAG, GPT
Избранные AI-проекты: 2025 - GPT-ассистент для контакт-центра (Архитектор). ● Спроектировала архитектуру генеративного ассистента на базе LangChain + RAG + GPT‑4. ● Результаты: снижение нагрузки на операторов на 30%, SLA по ответам — 99,9%. 2024 - AI-платформа для оценки медицинских карт (LLM-инженер). ● Внедрила NLP-модель (BERT), настроила пайплайн предобработки, интеграции и инференса. ● Результаты: точность анализа 92%, ускорение проверки врачами на 40%. 2024 - Голосовая платформа на базе GPT (Tech Lead). ● Архитектура и реализация пайплайна на базе LangChain + Audio-to-Text + RAG + GPT. ● Результаты: оптимизация latency на 25%, снижение расходов на GPU на 40%. 2023 - Автоматизация клиентских запросов (AI Lead). ● Внедрение платформы на GPT и BERT для автоматической классификации запросов. ● Результаты: сокращение времени обработки на 60%, повышение точности маршрутизации. Проекты в медицине: ● AI-система оценки медкарт (с BERT): точность 92%, скорость +40%. ● AI в онкологии (CV + NLP модели): автоматизация диагностики, гибридные пайплайны.
AI архитектор
с 01.2022 - По настоящий момент |Норникель
LLM, LangGraph, CrewAI, Autogen, AgentOps, LangChain, LlamaIndex, ChromaDB, Elasticsearch, feedback-loop, HuggingFace Transformers, OpenAI API, Ollama, PydanticAI, Docker, Kubernetes, vLLM, Prometheus, Grafana, GitLab CI/CD, Python, Go, PostgreSQL, Redis, Bot API, WebApp, CI/CD, React.js
● Проектирование архитектуры AI-приложений (LLM-ядра, RAG, агентные системы). ● Внедрение пайплайнов с LangChain, FastAPI, PostgreSQL, Redis, Docker, Prometheus. ● Настройка inference: quantization (LoRA), vLLM, mixed-precision, GPU-бюджет. ● Руководство командой из 8 инженеров (backend, ML, DevOps). ● Взаимодействие с заказчиками: от пресейлов до сопровождения delivery. Ключевые достижения: ● Внедрила GPT-ассистента в контакт-центр: снижение нагрузки на 30%. ● Разработала RAG-платформу с обратной связью и BLEU-оценкой. ● Ускорила релизы AI-продуктов на 30% за счёт CI/CD и orchestration. ● Снизила расходы на GPU-инфраструктуру через quantization и batching. ● Провела воркшопы по AI для S7 и Сбербанка (2024–2025). ● LLM: GPT, Claude, Gemini, BERT, LLaMA, Mixtral, SD, VideoDiffusion. ● Orchestration: LangGraph, CrewAI, Autogen, AgentOps. ● RAG: LangChain, LlamaIndex, ChromaDB, Elasticsearch, feedback-loop. ● Модели: HuggingFace Transformers, OpenAI API, Ollama, PydanticAI. ● Инфраструктура: Docker, Kubernetes, vLLM, Prometheus, Grafana, GitLab CI/CD. ● Backend: Python, FastAPI, Django, Go, PostgreSQL, Redis, Bot API, WebApp. ● DevOps: CI/CD, GPU-инфраструктура, observability, оптимизация latency. ● Front: React.js.
AI Lead (CV-направление)
02.2023 - 02.2024 |Trassir
AI, CV
● Усовершенствование CV-моделей и пайплайнов трекинга объектов (точность +30%). ● Внедрение обратной связи от пользователей и автодообучение моделей. ● Метрики: IoU, latency, precision, recall; A/B тестирование.
AI Lead / Руководитель разработки
02.2022 - 02.2023 |Рукс Солюшенс
AI, Grafana, Prometheus
● Запуск AI-платформы обработки клиентских обращений (GPT, BERT, классификация). ● Внедрение CI/CD, мониторинга (Grafana, Prometheus), orchestration пайплайнов. ● Управление командой 30+ человек.
Руководитель отдела разработки
05.2019 - 02.2022 |Финансовая корпорация Открытие
Docker, K8s, Spring, PostgreSQL, GPT
● Разработка платформ с микросервисной архитектурой (Docker, K8s, Spring, PostgreSQL). ● Внедрение GPT-моделей в клиентскую поддержку и внутренние системы. ● Снижение затрат и времени на процессы открытия счетов и анализа рисков.
Team Lead разработки
01.2014 - 12.2019 |Почта Банк
Docker, Kubernetes
● Руководство созданием платформы дистанционного обслуживания. ● Переход на микросервисную архитектуру (Docker, Kubernetes). ● Увеличение продуктивности команды на 30% за счёт оптимизации процессов. ● Внедрение системы анализа транзакций с точностью 85%.

Образование

Программное обеспечение вычислительной техники и автоматизированных систем
По 2014
Национальный исследовательский ядерный университет «МИФИ»

Языки

АнглийскийСредний