← В ленту
Регистрация: 05.04.2023

Mikhail Sinitsyn

Специализация: Data Analyst|Engineer

Портфолио

Сбербанк, отдел рисков

● Протестировал 7+ потоков данных в тестовой среде и привел их в prod кластер. ● Выполнил более 10 регрессионных тестов в PySpark и Hive с миллиардом+ строк, что позволило перенести их на другую платформу и сохранить стабильность и качество хранения.

Дом.рф

● Создал и автоматизировал 9 ежемесячных кампаний для клиентского сегмента Premium в PL/SQL Developer, что сократило количество необработанных наборов клиентов на 20%. ● Отправлено более 150 сообщений через смс/электронную почту/колл-центр, что в моменте увеличило заявки на 10%. ● Создал 10+ наборов данных для специалистов по машинному обучению, которые использовали их для прогнозирования убытков в сегменте депозитных карт. ● Созданы дашборды для отделов продаж/маркетинга. Вел активность "пригласи друга", что дало стабильный приток 100 новых клиентов в неделю.

Сбербанк, отдел рисков

● Встроенная сквозная аналитика для таблиц с более чем 6 миллиардами строк, которая помогла компании сократить потери клиентов на 30% (почти 30 миллионов идентификаторов) в одном из самых важных потоков данных в Datamart с личными данными. ● Сделано более 15 тестов качества данных, которые позволили делать быстрые исправления.

Скиллы

Agile
Airflow
Banking and Finance
Bash scripting
BitBucket
CTL
ETL
Git
Grafana
Hadoop
HDFS
Hive
Jenkins
JIRA
Parquet/JSON/CSV
PL/SQL Developer
PostgreSQL
PowerBI
PySpark
Python (Pandas, Numpy, Scrapy, Requests, BS4)
Spark YARN
SQL
Tableau

Опыт работы

Аналитик данных/Инженер
07.2021 - 09.2022 |NDA
Datamart, PySpark, Hive, PL/SQL
- Встроенная сквозная аналитика для таблиц с более чем 6 миллиардами строк, которая помогла компании сократить потери клиентов на 30% (почти 30 миллионов идентификаторов) в одном из самых важных потоков данных в Datamart с личными данными. - Сделано более 15 тестов качества данных, которые позволили делать быстрые исправления. - Тестирование 7+ потоков данных в тестовой среде, приведение их в prod кластер. - Выполнение более 10 регрессионных тестов в PySpark и Hive с миллиардом+ строк, что позволило перенести их на другую платформу и сохранить стабильность и качество хранения.
Аналитик данных
03.2020 - 06.2021 |Дом.рф, отдел CRM и маркетинга
PL/SQL Developer
- Создание и автоматизация 9 ежемесячных кампаний для клиентского сегмента Premium в PL/SQL Developer, что сократило количество необработанных наборов клиентов на 20%. - Отправление более 150 сообщений через смс/электронную почту/колл-центр, что в моменте увеличило заявки на 10%. - Создание 10+ наборов данных для специалистов по машинному обучению, которые использовали их для прогнозирования убытков в сегменте депозитных карт. - Создание дашборды для отделов продаж/маркетинга. Введение активности "пригласи друга", что дало стабильный приток 100 новых клиентов в неделю.

Образование

Бизнес-информатика (Бакалавр)
2018 - 2023
Финансовый университет при правительстве Российской Федерации

Языки

РусскийРоднойАнглийскийВыше среднего