Senior NLP Engineer
Оплата: По договоренности
Удаленно
Full-time
Компания занимает 3-е место в мире по количеству социальных открытий и объединяет людей с помощью онлайн-платформ, ориентированных на искусственный интеллект, игровые технологии и видеостриминг.
Обязанности:
- Решение задач NLP, таких как суммаризация, классификация, кластеризация, NER, с использованием современных технологий, в том числе LLM;
- Участие в полном цикле разработки, от постановки задачи до внедрения;
- Построение пайплайна обработки данных и дообучения LLM для генерации текстов, разработки чат-ботов, RAG-систем;
- Разработка новых подходов и процессов разметки данных для оценки качества работы LLM;
- Извлечение данных из различных источников (чтение из файлов, API, базы данных);
- Участие в формировании требований и необходимых данных по улучшению моделей;
- Внедрение модели в продакшн, поддержка жизненного цикла модели, мониторинг и обновление.
Требования:
Опыт в роли Data Scientist/LLM engineer более 5 лет
- Опыт работы в Data Science, связанный с обработкой естественного языка (NLP);
- Уверенное владение Python, включая библиотеки NumPy, Pandas, Scikit-learn и библиотеки обработки текстовых данных;
- Практический опыт разработки и внедрения NLP-моделей для классификации, кластеризации текста, NER (Named Entity Recognition) и др;
- Опыт работы с фреймворками глубокого обучения (TensorFlow/Keras или PyTorch), включая построение, обучение и оценку моделей;
- Знание архитектур GPT, BERT и других Transformer-моделей;
- Знание различных метрик оценки качества моделей NLP (precision, recall, F1-score, AUC-ROC и др.), умение выбирать подходящие метрики для конкретной задачи;
- Опыт вывода моделей в продакшн;
- Опыт использования инструментов для мониторинга производительности и качества моделей в продакшне будет преимуществом;
- Опыт внедрения LLM, разработки RAG-агентов, создания собственной LLM и ML-платформы будет преимуществом;
- Опыт обучения Qwen, работы с llamaindex и Mistral.