← В ленту
Регистрация: 25.01.2024

Мария Гребёнкина

Специализация: Data Scientist / Analyst

Портфолио

Provectus

● Разработано интеллектуальное решение для обработки документов на основе Amazon Textract и генеративных моделей, таких как GPT и T5. ● Использованы методы компьютерного зрения (CV) для обнаружения таблиц. ● Разработано решение для классификации текста с несколькими метками (BERT, CNN, HAN). ● Разработан модуль в Deepfake приложении на основе модели StyleCariGAN.

Точка-Точка

● Разработана модель регрессионного анализа для предсказания цены грузоперевозки.

YoChats

● Разработан чат-бот на основе модели GPT.

Скиллы

AWS
Docker
FastAPI
Flask
Git
LangChain
LLM
Machine Learning
MLOps
NLP
Numpy
Pandas
PostgreSQL
Python
PyTorch
RAG
Redis
Scikit-learn
SQL
Weaviate

Опыт работы

Data Scientist / LLM-app Инженер
2023 - 2023 |YoChats
Python, FastAPI, Asyncio, Weaviate, PostgreSQL, LangChain
- Разработка чат-бота на основе модели GPT - кастомизированный виджет, который можно интегрировать на сайт (тех. поддержка на основе AI), - Перевод информации в векторную базу данных.
Data Scientist / LLM-app Инженер
с 2023 - По настоящий момент |Defimoon
Python, FastAPI, Asyncio, Redis, LangChain
- Разработка чат-бота на основе модели GPT - приложение, обучающее теме исламских финансов в формате квизов, генерация обучающего материала происходила за счет gpt. - Создание микросервисной архитектуры с помощью FastApi - Организация передачи запросов на бэкенд, - Организация проверки ответов и финального квеста на основе ошибок.
ML Инженер
2022 - 2023 |Точка-Точка
Python, XGBoost, Dagster, MLflow, SQL
- Разработка модели регрессионного анализа для предсказания цены грузоперевозки - Сбор требований заказчика, их интерпритация для команды data science, -Изучение и анализ данных, - Выстраивание бизнесс-процессов, их реализация с помощью машинного обучения, - Анализ удовлетворенности бизнес метрик.
Backend Разработчик
2020 - 2021 |Provectus
Protobuf, Swagger, gRPC, Pytest, Request, Flask, JSON
- Разработан пользовательский интерфейс системы хранения и обработки данных медицинских учреждений.
ML Инженер
2020 - 2023 |Provectus
Docker, Docker Compose, Makefile, CI/CD Lambda, AWS State Machine
- Разработано интеллектуальное решение для обработки документов на основе Amazon Textract и генеративных моделей, таких как GPT и T5, - Использованы методы компьютерного зрения (CV) для обнаружения таблиц, - Разработано решение для классификации текста с несколькими метками (BERT, CNN, HAN), - Разработан модуль в Deepfake приложении на основе модели StyleCariGAN.

Образование

Информатика и вычислительная техника (Магистр)
2018 - 2020
Университет Иннополис
Прикладная математика и физика (Магистр)
2014 - 2016
Московский Физико-технический Институт (ГУ)
Прикладная математика и физика (Бакалавр)
2009 - 2014
Московский Физико-технический Институт (ГУ)

Языки

АнглийскийПродвинутыйРусскийРодной