Актуальные заказы по Python Numpy

Data Scientist / ML Engineer (Risk Modelling, Financial)

Удаленно

В поиске Data Science специалиста с опытом работы в банковских проектах для построения рисковых моделей (скоринг для кредитования).


Основные направления работы

Risk Modeling:

  • Полный цикл разработки ансамблевых моделей: подготовка и предобработка данных, разметка и разделение на обучающие и тестовые выборки.
  • Отбор и настройка базовых моделей с акцентом на их разнообразие для повышения качества прогнозов.
  • Разработка моделей машинного обучения для прогнозирования ежедневных остатков на расчетных счетах корпоративных клиентов, учитывая анализ временных рядов (неделя, месяц, квартал) и дополнительные факторы (дни недели, праздники, налоговые периоды, бизнес-циклы).
  • Обучение персонализированных моделей.
  • Применение методов объединения моделей (bagging, boosting, stacking) с оптимизацией весов в ансамбле.
  • Оценка производительности моделей с использованием метрик точности, полноты и F1-score для улучшения качества прогнозов.
  • Внедрение моделей в промышленную среду, мониторинг и регулярная оптимизация параметров.

Computer Vision:

  • Разработка и внедрение системы биометрической верификации личности, включая модули распознавания документов и сопоставления фотографий.
  • Анализ требований и проектирование архитектуры системы с учетом высоких стандартов безопасности и точности.
  • Реализация алгоритмов обработки изображений для извлечения данных из паспортов и сравнения с селфи-фотографиями.

Acquisition Analytics:

  • Анализ данных эквайрингового и РКО-портфеля: сбор и предобработка исторической информации о поведении клиентов.
  • Разработка признаков, отражающих транзакционную активность, финансовые показатели и паттерны использования услуг для выявления факторов оттока.
  • Построение и обучение ансамблевой модели прогнозирования с учетом специфики продуктов.
  • Внедрение системы скоринга клиентов по вероятности оттока на основе финансового поведения и длительности сотрудничества.


Требуемые технологии и инструменты: Python, SQL, Scikit-learn, XGBoost, LightGBM, CatBoost, TensorFlow/Keras, PyTorch, Random Forest, Gradient Boosting, Stacking, Pandas, NumPy, Matplotlib, Seaborn.

Senior Python Developer

Responsibilities: 

  • Building backend services and solutions for our digital portfolio and digital platforms that enable our customers to collect, process and visualize data. 
  • Develop reliable microservices for web application backends. 
  • Developing new reusable code and libraries for future use, and ensuring the technical feasibility of existing and future BE designs. 
  • Deliver error-free code through testing and working with QA teams, in order to meet the quality standards. 
  • Maintenance of existing software and code. You will be required to work and communicate with team members and product owners to ensure user requirements are understood, and design expectations are met. 


Requirements: 

5+ years of recent hands-on coding and software design Python

  • Experience with working in containerized environments. API use, design, and development such as for RESTful. 
  • Familiar with: Database technologies like MySQL, PostgreSQL, MS SQL, Influx, Redis Web frameworks Flask, Django 
  • Message brokers like RabbitMQ WebSockets protocol 
  • Knowledge of code versioning tools such as Git. An analytical mindset. 
  • Proven organizational and time management skills. 
  • Curious, and willing to learn new technologies. 
  • Comfortable working in an agile environment. 
  • Good communication and teamwork skills; working proficiency in English (written and spoken). 
  • Self-motivating, able to assume responsibility and work autonomously in a professional manner. 
  • Willingness to learn new languages, frameworks, and technologies. 


Nice to have:

  • Experience with Kubernetes. 
  • Experience with Jira and Confluence. 
  • Experience with AWS/Azure, other cloud platforms. 
  • Experience with ModBus protocol. Experience with NumPy. 
  • Experience with Swagger.

Data Analyst / Scientist

Удаленно
Full-time

В поиске Senior/Lead Data Analyst / Scientist на проект химической компании по оптимизации технологических процессов и диагностики технического оборудования.

Функционал: проектирование, разработка, внедрение, тестирование ПО и информационных систем на основе алгоритмов искусственного интеллекта.


Задачи:

  • Проведение системного анализа бизнес процессов.
  • Обработка функциональных требований, экспертиза в области определения подходов к автоматизации или цифровизации процессов.
  • Разработка проектной документации.
  • Интеграционное тестирование новой функциональности.
  • Выполнение сложных настроек в информационных системах.
  • Обеспечение 3-го уровня поддержки.


Требования:

  • Уверенный опыт работы с Python: Pandas, Numpy, scikit-learn, Scipy, Catboost, Pytorch, TensorFlow, XGBoost, LightGBM, statsmodels, tsfresh, tslearn, shaply, seaborn, matplotlib, plotly, MLflow.
  • Знание и опыт работы с инструментами: MS Office, Jira, Confluence, Git, Grafana, AirFlow.
  • Отличные знания SQL.

Senior NLP Engineer

Удаленно
Full-time

Компания занимает 3-е место в мире по количеству социальных открытий и объединяет людей с помощью онлайн-платформ, ориентированных на искусственный интеллект, игровые технологии и видеостриминг.


Обязанности:

  • Решение задач NLP, таких как суммаризация, классификация, кластеризация, NER, с использованием современных технологий, в том числе LLM;
  • Участие в полном цикле разработки, от постановки задачи до внедрения;
  • Построение пайплайна обработки данных и дообучения LLM для генерации текстов, разработки чат-ботов, RAG-систем;
  • Разработка новых подходов и процессов разметки данных для оценки качества работы LLM;
  • Извлечение данных из различных источников (чтение из файлов, API, базы данных);
  • Участие в формировании требований и необходимых данных по улучшению моделей;
  • Внедрение модели в продакшн, поддержка жизненного цикла модели, мониторинг и обновление.


Требования:

Опыт в роли Data Scientist/LLM engineer более 5 лет

  • Опыт работы в Data Science, связанный с обработкой естественного языка (NLP);
  • Уверенное владение Python, включая библиотеки NumPy, Pandas, Scikit-learn и библиотеки обработки текстовых данных;
  • Практический опыт разработки и внедрения NLP-моделей для классификации, кластеризации текста, NER (Named Entity Recognition) и др;
  • Опыт работы с фреймворками глубокого обучения (TensorFlow/Keras или PyTorch), включая построение, обучение и оценку моделей;
  • Знание архитектур GPT, BERT и других Transformer-моделей;
  • Знание различных метрик оценки качества моделей NLP (precision, recall, F1-score, AUC-ROC и др.), умение выбирать подходящие метрики для конкретной задачи;
  • Опыт вывода моделей в продакшн;
  • Опыт использования инструментов для мониторинга производительности и качества моделей в продакшне будет преимуществом;
  • Опыт внедрения LLM, разработки RAG-агентов, создания собственной LLM и ML-платформы будет преимуществом;
  • Опыт обучения Qwen, работы с llamaindex и Mistral.

Junior Data Analyst

Офис
Full-time
Постоянная работа
Требуется Junior Data Analyst для работы над трейдинговым продуктом. Задачи: - анализировать и оптимизировать текущие маркетинговые процессы; - поиск идей и областей, в которых можно улучшить данные; - визуализировать и представить результаты; - автоматизация отчетов и процессов; - работа с несколькими командами (предпочтительно по маркетингу), чтобы выяснить потребности и предложить соответствующие решения, которые окажут значительное влияние. Требования: - глубокое понимание структур данных и алгоритмов; - опыт работы с Python; - достаточно минимального опыта с Pandas, Numpy, Matplotlib); - знание SQL; - сильные аналитические и коммуникативные навыки; - опыт практического интеллектуального анализа данных и работы с большими объемами данных; - опыт работы с AWS или DataBricks является плюсом; - понимание того, как работает маркетинг, является плюсом; - образование в области естественных наук, экономики, математики, информатики, статистики; - уровень английского - С2; - будет плюсом, но не обязательно: PySpark, PowerBI, Klipfolio.