● Внедрение новых моделей для предсказания дефольта клиентов.
● Основной фокус был на исторических данных по кредитам — анкеты клиентов, транзакции, поведение по счетам, история просрочек.
● Я организовал процесс ETL: собрал и очистил данные, написал сложные SQL-запросы для извлечения признаков, сделал feature engineering.
● Затем построил и обучил несколько моделей классификации — логистическая регрессия, Random Forest, XGBoost — для предсказания вероятности дефолта.
● Настроил подбор гиперпараметров, провёл кросс-валидацию и A/B тестирование.
● После обучения внедрил модель в продакшн: настроил мониторинг метрик качества и автоматический алертинг, чтобы модель не деградировала со временем.
● В результате банк смог более точно оценивать риск клиентов и снизил уровень просроченной задолженности.
Обязонности и достижении:
● Организовал ETL исторических данных клиентов для формирования обучающих выборок.
● Выполнил анализ просроченной задолженности по портфелю, определил ключевые факторы дефолта.
● Написал сложные SQL-запросы для извлечения признаков и подготовки датасетов.
● Провёл анализ и проверку качества данных, обработку пропущенных значений и аномалий.
● Разработал и обучил модели классификации кредитного риска на основе алгоритмов машинного обучения (логистическая регрессия, Random Forest, XGBoost).
● Настроил гиперпараметры моделей и провёл подбор оптимальных параметров (Grid Search, Cross-Validation).
● Реализовал интерпретацию результатов модели (важность признаков, SHAP values) для соответствия требованиям регулятора.
● Организовал процесс развертывания модели в продуктивной среде и настроил автоматический мониторинг ключевых метрик качества.
● Сотрудничал с командами риск-аналитиков и IT для интеграции модели в бизнес-процессы.
● Результат: повысил точность оценки кредитного риска, снизив долю дефолтных кредитов на 10%.