Детали вакансии

Машинное обучение
Синьор
Удаленка
Apr 23

Старший разработчик LLM в команду YandexGPT Reasoning

Старший разработчик LLM в команду YandexGPT Reasoning. Фокусируется на улучшении способностей к рассуждению семейства моделей Alice AI LLM, объединяя рассуждения, использование внешних функций и возможности поиска. Задачи включают разработку основного механизма рассуждений YandexGPT, интеграцию сигналов в единую модель и эксперименты с алгоритмами RL.

Наша команда занимается улучшением способностей к рассуждению семейства моделей Alice AI LLM. Мы стремимся создать единую модель, которая объединит сильные стороны рассуждений, использования внешних функций и возможностей поиска наших сервисов. Какие задачи ждут вас: • Разработка основного механизма рассуждений YandexGPT Ближайшая цель — научиться эффективнее масштабировать обучение RLVR и RLHF моделей рассуждений для B2C-задач для широкого круга пользователей. Вы будете проводить эксперименты по улучшению общих свойств модели (полезность, логичность, структурированность) за счёт повышения качества цепочек рассуждений и усиления паттернов (backtracking, verification) на задачах различной тематики. • Интеграция сигналов в единую модель Мы стремимся создать новые стадии выравнивания и системы вознаграждений, которые позволят нам объединить сигналы по математическим и научным задачам с креативными, улучшив качество рассуждений в каждой области по сравнению с независимым обучением. Вы будете проводить исследования с новыми reward-моделями, стадиями и дистилляцией в рамках единой модели. • Эксперименты с RL-алгоритмами Вы будете искать SOTA-подходы, которые принесут пользу реальному продукту: экспериментировать с RL-алгоритмами, тестировать методы стабилизации обучения Dense и MoE-архитектур.

Ждем, что вы: • Отлично разбираетесь в NLP и классическом ML • Владеете Python • Понимаете, как работают современные LLM, решали с их помощью прикладные задачи или имеете соответствующий исследовательский опыт

Мы заботимся о детях сотрудников Яндекса и устраиваем детские дни в офисе. Это не все бонусы — полный список здесь: https://yandex.ru/jobs/pages/benefits?utm_campaign=ya_nanimaet

Python
ml
NLP
RL
LLM

Не пропусти ни одну вакансию

Подпишись на наш Telegram-канал

Подписаться

Похожие вакансии

Старший ML-разработчик (NLP/LLM) в команду продукта Нейросейлз

Старший ML-разработчик (NLP/LLM) в команду продукта Нейросейлз. Разработка AI-помощника для усиления и ускорения продаж. Задачи включают генерацию лидов, сопровождение клиента и создание Copilot для менеджеров.

Я
Яндекс

Ведущий специалист по данным (LLM)

ИТ-центр МГТУ им. Н.Э. Баумана ищет ведущего специалиста по данным (LLM) в Москве, Россия. Полный рабочий день, возможна удаленная работа. Навыки: Senior, Python, LLM, NLP.

I
IT-center of Bauman Moscow State Technical University

Специалист по данным (NLP|LLM)

Специалист по данным (NLP|LLM) в СберЗдоровье в Москве, Россия. Полная занятость, возможна удаленная работа. Требуется опыт среднего уровня в NLP, LLM, компьютерном зрении и Python.

С
СберЗдоровье