Актуальные заказы по Data Science

Data Scientist / ML Engineer (Risk Modelling, Financial)

Удаленно

В поиске Data Science специалиста с опытом работы в банковских проектах для построения рисковых моделей (скоринг для кредитования).


Основные направления работы

Risk Modeling:

  • Полный цикл разработки ансамблевых моделей: подготовка и предобработка данных, разметка и разделение на обучающие и тестовые выборки.
  • Отбор и настройка базовых моделей с акцентом на их разнообразие для повышения качества прогнозов.
  • Разработка моделей машинного обучения для прогнозирования ежедневных остатков на расчетных счетах корпоративных клиентов, учитывая анализ временных рядов (неделя, месяц, квартал) и дополнительные факторы (дни недели, праздники, налоговые периоды, бизнес-циклы).
  • Обучение персонализированных моделей.
  • Применение методов объединения моделей (bagging, boosting, stacking) с оптимизацией весов в ансамбле.
  • Оценка производительности моделей с использованием метрик точности, полноты и F1-score для улучшения качества прогнозов.
  • Внедрение моделей в промышленную среду, мониторинг и регулярная оптимизация параметров.

Computer Vision:

  • Разработка и внедрение системы биометрической верификации личности, включая модули распознавания документов и сопоставления фотографий.
  • Анализ требований и проектирование архитектуры системы с учетом высоких стандартов безопасности и точности.
  • Реализация алгоритмов обработки изображений для извлечения данных из паспортов и сравнения с селфи-фотографиями.

Acquisition Analytics:

  • Анализ данных эквайрингового и РКО-портфеля: сбор и предобработка исторической информации о поведении клиентов.
  • Разработка признаков, отражающих транзакционную активность, финансовые показатели и паттерны использования услуг для выявления факторов оттока.
  • Построение и обучение ансамблевой модели прогнозирования с учетом специфики продуктов.
  • Внедрение системы скоринга клиентов по вероятности оттока на основе финансового поведения и длительности сотрудничества.


Требуемые технологии и инструменты: Python, SQL, Scikit-learn, XGBoost, LightGBM, CatBoost, TensorFlow/Keras, PyTorch, Random Forest, Gradient Boosting, Stacking, Pandas, NumPy, Matplotlib, Seaborn.

Data Science Middle+

Удаленно
Full-time

Описание задачи:

В рамках проекта планируется разработка трёх моделей машинного обучения для телеком-оператора:

  • Модель оттока (churn prediction) — по трём временным горизонта
  • Модель Next Best Offer (NBO) — персонализированные рекомендации тарифов и услуг
  • Модель чувствительности к изменению тарифа — прогноз реакции абонента на изменение условий, по двум горизонтам

Тип моделей: классический ML, табличные данные, задача бинарной классификации.


Особенности проекта:

  • Расчет фичей для моделей настроен непрерывным пайплайном с ежедневной актуализацией
  • Объём данных — ~5Гб (формат parquet), ~15 миллионов строк
  • Распределённые вычисления на кластере Hadoop/Spark
  • Модели предполагается встроить в текущий пайплайн, добавить регистрацию в MLflow, настроить периодическую актуализацию


Требования:

Фокус: разработка моделей, дополнительный фичеинжениринг, тюнинг, тестирование, оформление документации

Стек: pyspark, python, pandas, scikit-learn, CatBoost

 

Критичные компетенции:

  • Работа с табличными данными и классическим ML (CatBoost, sklearn)
  • Знание метрик качества, балансировка классов
  • Опыт работы с моделями оттока, NBO или похожими задачами
  • Фичеинжениринг (корреляции, отбор, агрегации)
  • Умение формализовать гипотезы и оценивать их


Будет плюсом (можно не брать в расчет:

  • MLflow (настройка и регистрация моделей)
  • Интеграция моделей в пайплайн (Hadoop/Spark)
  • Оптимизация ресурсов
  • SparkML (распределенные вычисления)



Data Analyst / Scientist

Удаленно
Full-time

В поиске Senior/Lead Data Analyst / Scientist на проект химической компании по оптимизации технологических процессов и диагностики технического оборудования.

Функционал: проектирование, разработка, внедрение, тестирование ПО и информационных систем на основе алгоритмов искусственного интеллекта.


Задачи:

  • Проведение системного анализа бизнес процессов.
  • Обработка функциональных требований, экспертиза в области определения подходов к автоматизации или цифровизации процессов.
  • Разработка проектной документации.
  • Интеграционное тестирование новой функциональности.
  • Выполнение сложных настроек в информационных системах.
  • Обеспечение 3-го уровня поддержки.


Требования:

  • Уверенный опыт работы с Python: Pandas, Numpy, scikit-learn, Scipy, Catboost, Pytorch, TensorFlow, XGBoost, LightGBM, statsmodels, tsfresh, tslearn, shaply, seaborn, matplotlib, plotly, MLflow.
  • Знание и опыт работы с инструментами: MS Office, Jira, Confluence, Git, Grafana, AirFlow.
  • Отличные знания SQL.

Lead ML Engineer

Удаленно
Full-time

Responsibilities 

• Evaluate and adapt state-of-the-art machine learning (ML), computer vision (CV), generative AI, and time series forecasting algorithms to meet product and client objectives. 

• Research, design, and implement innovative ML algorithms for image, video, multimodal, and temporal data. 

• Architect and develop full-stack ML pipelines—from data acquisition and preprocessing to training, evaluation, and deployment in cloud (AWS) or edge environments. 

• Prototype and validate proof-of-concept (POC) solutions for vision, generative AI, and time-series forecasting problems. 

• Translate customer requirements into actionable tasks, ensuring a clear understanding of objectives, scope, and expected outcomes. 

• Analyze structured and unstructured data to uncover trends, patterns, and anomalies. Apply ML and statistical methods for prediction and forecasting. 

• Prepare detailed technical documentation, reports, and presentations for internal and external stakeholders. 

• Communicate complex technical topics effectively to both technical and non-technical stakeholders, including clients and business partners. 

• Lead projects from prototype to production, ensuring scalability, reliability, and performance of solutions. 

• Contribute to internal software development processes and team collaboration initiatives. 


Requirements 

• Strong hands-on experience in delivering ML solutions, including production-grade computer vision and forecasting models. 

• Proven expertise in forecasting and time series data handling (e.g., ARIMA, LSTM, temporal convolutional networks). 

• Proficiency in image and video processing, including segmentation, pose estimation, object detection, and multimodal data fusion. 

• Experience with generative AI models such as diffusion-based text-to-image/video, multimodal LLMs, and prompt engineering. 

• Skilled in reading, interpreting, and applying insights from academic research papers. 

• Expertise in deep learning frameworks like PyTorch or TensorFlow. 

• Strong object-oriented programming skills with clean, production-quality Python code.

• Familiarity with Vision Transformers (ViTs), especially for action recognition, object tracking, and video understanding tasks. 

• Cloud deployment experience, particularly with AWS. 

• Excellent communication skills in English (C1 or higher), both written and spoken. 

• Strong ability to work independently, prioritize tasks, and manage multiple projects simultaneously. 

Nice to Have 

• Master’s or Ph.D. degree in Machine Learning, Computer Science, Mathematics, or a related field.

• Contributions to open-source ML or CV libraries or participation in Kaggle competitions.

Руководитель RnD-проекта в сфере Data Science и ИИ для геологии | Удаленно

Возглавьте инновационный проект по созданию ИИ-инструмента для обработки геологических данных. Требуется опыт в RnD, Data Science и управлении командами. Перспектива роста до CEO продукта