Детали вакансии
Python Developer for Data Mining
Python Developer for Data Mining at Spravochnik, a platform that collects data about organizations. Focus on Python, C++, and ML for parsing, NLP, and Big Data. Hybrid work in Moscow.
Spravochnik — это платформа, которая собирает данные об организациях. Наша система обрабатывает миллионы сигналов: отзывы пользователей, обновления сайтов, исправления от владельцев бизнеса. Если вы хотите работать на стыке Python, C++ и ML, решая задачи парсинга, NLP и Big Data, присоединяйтесь к нам! Здесь ваши навыки превратятся в технологии, которыми каждый день пользуются миллионы людей. Какие задачи вас ждут: • Оптимизировать архитектуру для одновременной работы сотен парсеров, реализовать изолированное окружение для запуска парсеров и повысить эффективность взаимодействия с PostgreSQL • Создать пайплайн для автоматического перевода контента и разметки данных с помощью языковых моделей, а также адаптировать и настроить модели (YandexGPT и др.) под бизнес-задачи • Адаптировать платформу под новые страны и языки, организовать обработку данных через MapReduce YTsaurus и внутренний аналог AirFlow • Разработать методы сравнения и нормализации атрибутов организаций и ускорить критические компоненты системы на C++
Ждем, что вы: • Имеете опыт работы с C++ и Python (middle+) • Глубоко разбираетесь в алгоритмах, структурах данных и SQL • Умеете писать чистый, тестируемый код с документацией
Что мы предлагаем: Мы ценим саморазвитие, поэтому у нас есть собственная образовательная платформа с 700+ курсами. А если вам понадобится что-то особенное, что действительно поможет в работе, мы можем помочь с оплатой. Это не все бонусы — полный список здесь: https://yandex.ru/jobs/pages/benefits?utm_campaign=ya_nanimaet
Не пропусти ни одну вакансию
Подпишись на наш Telegram-канал