Опубликовано 17 дней назад
Data Scientist (NLP|LLM) в СберЗдоровье Москва
Data Scientist в команду медицинского AI крупнейшей Digital Health платформы России. Разработка и улучшение медицинских LLM, построение пайплайнов и агентов для медицинских задач.
Задачи:
- Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning).
- Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias.
- Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails.
- Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge там, где уместно, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде.
- Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.
Требования:
- 3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код.
- Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов.
- Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения.
- Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна.
- Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией.
Условия:
- Сильную команду профессионалов, увлеченных своим делом;
- Возможность развития в команде ведущей MedTech-компании России;
- Уютный офис в Сити с панорамным видом на город, гибридный формат работы;
- Корпоративную технику;
- Медицинскую программу, включающую телемедицинские консультации, очные приёмы в клиниках, психологов, стоматологию, лабораторные и инструментальные диагностики;
- Оплачиваемые курсы английского языка;
- Поддерживаем активный образ жизни — выбирай виды спорта по душе (корпоративные занятия сквошем, бегом, футболом в Москве и компенсация твоего спортивного абонемента);
- СберУниверситет и оплату профильного обучения и курсов.
Навыки:
- NLP
- LLM
- Python
- PyTorch
- HuggingFace
- Accelerate
- DeepSpeed
- MLflow
- ClearML
- LangGraph
- RAG
- vLLM
- Docker
- K8s
- FAISS
- Elastic
- pgvector
Эту вакансию мы нашли в Telegram-канал
СБ
СберЗдоровье
Москва
Похожие вакансии
Это единственная вакансия по вашему фильтру
Не то, что искал?