Актуальные заказы по Data Scientists

Data Scientist / ML Engineer (Risk Modelling, Financial)

Удаленно

В поиске Data Science специалиста с опытом работы в банковских проектах для построения рисковых моделей (скоринг для кредитования).


Основные направления работы

Risk Modeling:

  • Полный цикл разработки ансамблевых моделей: подготовка и предобработка данных, разметка и разделение на обучающие и тестовые выборки.
  • Отбор и настройка базовых моделей с акцентом на их разнообразие для повышения качества прогнозов.
  • Разработка моделей машинного обучения для прогнозирования ежедневных остатков на расчетных счетах корпоративных клиентов, учитывая анализ временных рядов (неделя, месяц, квартал) и дополнительные факторы (дни недели, праздники, налоговые периоды, бизнес-циклы).
  • Обучение персонализированных моделей.
  • Применение методов объединения моделей (bagging, boosting, stacking) с оптимизацией весов в ансамбле.
  • Оценка производительности моделей с использованием метрик точности, полноты и F1-score для улучшения качества прогнозов.
  • Внедрение моделей в промышленную среду, мониторинг и регулярная оптимизация параметров.

Computer Vision:

  • Разработка и внедрение системы биометрической верификации личности, включая модули распознавания документов и сопоставления фотографий.
  • Анализ требований и проектирование архитектуры системы с учетом высоких стандартов безопасности и точности.
  • Реализация алгоритмов обработки изображений для извлечения данных из паспортов и сравнения с селфи-фотографиями.

Acquisition Analytics:

  • Анализ данных эквайрингового и РКО-портфеля: сбор и предобработка исторической информации о поведении клиентов.
  • Разработка признаков, отражающих транзакционную активность, финансовые показатели и паттерны использования услуг для выявления факторов оттока.
  • Построение и обучение ансамблевой модели прогнозирования с учетом специфики продуктов.
  • Внедрение системы скоринга клиентов по вероятности оттока на основе финансового поведения и длительности сотрудничества.


Требуемые технологии и инструменты: Python, SQL, Scikit-learn, XGBoost, LightGBM, CatBoost, TensorFlow/Keras, PyTorch, Random Forest, Gradient Boosting, Stacking, Pandas, NumPy, Matplotlib, Seaborn.

Data Analyst / Scientist

Удаленно
Full-time

В поиске Senior/Lead Data Analyst / Scientist на проект химической компании по оптимизации технологических процессов и диагностики технического оборудования.

Функционал: проектирование, разработка, внедрение, тестирование ПО и информационных систем на основе алгоритмов искусственного интеллекта.


Задачи:

  • Проведение системного анализа бизнес процессов.
  • Обработка функциональных требований, экспертиза в области определения подходов к автоматизации или цифровизации процессов.
  • Разработка проектной документации.
  • Интеграционное тестирование новой функциональности.
  • Выполнение сложных настроек в информационных системах.
  • Обеспечение 3-го уровня поддержки.


Требования:

  • Уверенный опыт работы с Python: Pandas, Numpy, scikit-learn, Scipy, Catboost, Pytorch, TensorFlow, XGBoost, LightGBM, statsmodels, tsfresh, tslearn, shaply, seaborn, matplotlib, plotly, MLflow.
  • Знание и опыт работы с инструментами: MS Office, Jira, Confluence, Git, Grafana, AirFlow.
  • Отличные знания SQL.

Lead Data Engineer

Удаленно
Full-time

The project, a platform for creating and publishing content on social media using artificial intelligence tools, is looking for a Lead Data Engineer.


Responsibilities:

- Design, develop, and maintain robust and scalable data pipelines for collecting, processing, and storing data from diverse social media sources and user interactions.

- Design of data warehouse.

- Implement rigorous data quality checks and validation processes to uphold the integrity.

accuracy, and reliability of social media data used by our AI models.

- Automate Extract, Transform, Load (ETL) processes to streamline data ingestion and transformation, reducing manual intervention and enhancing efficiency.

- Continuously monitor and optimize data pipelines to improve speed, reliability, and scalability, ensuring seamless operation of our AI Assistant.

- Collaborate closely with Data Scientists, ML Engineers, and cross-functional teams to understand data requirements and provide the necessary data infrastructure for model development and training.

- Enforce data governance practices, guaranteeing data privacy, security, and compliance with relevant regulations, including GDPR, in the context of social media data.

- Establish performance benchmarks and implement monitoring solutions to identify and address bottlenecks or anomalies in the data pipeline.

- Collaborate with data analysts and business teams to design interactive dashboards that enable data-driven decision-making.

- Develop and support data marts and dashboards that provide real-time insights into social media data.

- Stay updated with emerging data technologies, tools, and frameworks, evaluating their potential to improve data engineering processes.


Qualifications:

- Bachelor's or Master's degree in Computer Science, Data Engineering, or a related field.

- Proven experience in data engineering, focusing on ETL processes, data pipeline development, and data quality assurance.

- Strong proficiency in programming languages such as Python, SQL and knowledge of data engineering libraries and frameworks.

- Experience with cloud-based data storage and processing solutions, such as AWS, Azure, or Google Cloud.

- Familiarity with DataOps principles and Agile methodologies.

- Excellent problem-solving skills and the ability to work collaboratively in a cross-functional team.

- Strong communication skills to convey technical concepts to non-technical stakeholders.

- Knowledge of data governance and data privacy regulations is a plus.