← В ленту
Middle
Регистрация: 22.11.2024

Оганес Арустамян

Специализация: Data Scientist
— Сертифицированный специалист IBM по обработке данных.
— Сертифицированный специалист IBM по обработке данных.

Скиллы

Python
Numpy
Pandas
Matplotlib
Seaborn
Sklearn
Decision tree
Random Forest
AdaBoost
XGBoost
DB scan
K-means
K-metoids
Naural Networks
TensorFlow -Keras
NLP techniques
SQL
DVC
Docker
Git
Github
Power BI
Regression models

Опыт работы

Data Scientist
11.2023 - 08.2025 |ArmenianBank
Python, Microsoft SQL, Linux, ML, NumPy, Microsoft Excel, MatPlotLib, Pandas
● Внедрение новых моделей для предсказания дефольта клиентов. ● Основной фокус был на исторических данных по кредитам — анкеты клиентов, транзакции, поведение по счетам, история просрочек. ● Я организовал процесс ETL: собрал и очистил данные, написал сложные SQL-запросы для извлечения признаков, сделал feature engineering. ● Затем построил и обучил несколько моделей классификации — логистическая регрессия, Random Forest, XGBoost — для предсказания вероятности дефолта. ● Настроил подбор гиперпараметров, провёл кросс-валидацию и A/B тестирование. ● После обучения внедрил модель в продакшн: настроил мониторинг метрик качества и автоматический алертинг, чтобы модель не деградировала со временем. ● В результате банк смог более точно оценивать риск клиентов и снизил уровень просроченной задолженности. Обязонности и достижении: ● Организовал ETL исторических данных клиентов для формирования обучающих выборок. ● Выполнил анализ просроченной задолженности по портфелю, определил ключевые факторы дефолта. ● Написал сложные SQL-запросы для извлечения признаков и подготовки датасетов. ● Провёл анализ и проверку качества данных, обработку пропущенных значений и аномалий. ● Разработал и обучил модели классификации кредитного риска на основе алгоритмов машинного обучения (логистическая регрессия, Random Forest, XGBoost). ● Настроил гиперпараметры моделей и провёл подбор оптимальных параметров (Grid Search, Cross-Validation). ● Реализовал интерпретацию результатов модели (важность признаков, SHAP values) для соответствия требованиям регулятора. ● Организовал процесс развертывания модели в продуктивной среде и настроил автоматический мониторинг ключевых метрик качества. ● Сотрудничал с командами риск-аналитиков и IT для интеграции модели в бизнес-процессы. ● Результат: повысил точность оценки кредитного риска, снизив долю дефолтных кредитов на 10%.
ML Engineer / Data Scientist
02.2020 - 07.2022 |NDA
Python, Pandas, SQL, Scikit-learn, Matplotlib, Seaborn, XGBoost, Git, Linux, Docker
Проект - Разработка системы предсказания оттока и рекомендации персонализированных предложений для онлайн-магазина: ● Основная задача — сократить отток клиентов и увеличить повторные покупки. ● Для этого были собраны данные о заказах, визитах на сайт, транзакциях и отзывах. ● Построена модель предсказания оттока, выполнена сегментация пользователей по RFM и запущена система персонализированных акций. ● В результате бизнес смог повысить удержание клиентов и увеличить выручку за счёт персонализированного маркетинга. Функциональные обязанности: ● Собрал и выполнил предварительную обработку данных о заказах, корзинах, транзакциях и пользовательской активности на сайте. ● Провёл RFM-анализ (Recency, Frequency, Monetary) для сегментации клиентской базы и выделения групп с высоким риском оттока. ● Разработал и обучил модель предсказания оттока (churn prediction) для оценки вероятности ухода клиента. ● Построил систему генерации персонализированных рекомендаций скидок и акций на основе результатов модели. ● Использовал Python (pandas, scikit-learn, XGBoost) для подготовки данных и построения моделей. ● Написал SQL-запросы для извлечения данных и формирования признаков (feature engineering). ● Подготовил визуализации и отчёты для бизнеса с ключевыми выводами и рекомендациями. ● Настроил развёртывание моделей с помощью Docker и Git для интеграции с продуктовой средой.
Data Scientist
NDA
Git, SQL, Python, NumPy, Pandas, Docker, TensorFlow, MySQL, MatPlotLib, ML
● Разработка моделей классификации и регрессии для медицинских проектов, выбор данных из базы данных MySQL, предварительная обработка данных, выбор необходимых признаков, проектирование признаков (нормализация, стандартизация), создание модели, построение конвейера машинного обучения, реализация Docker и развертывание.

Образование

Computer Science (Бакалавр)
2012 - 2016
Ереванский государственный университет

Языки

АнглийскийСредний