Детали вакансии

Инженерия данных
Гибрид
May 8

Инженер данных

Компания: Альфа-Банк. Инженер данных #гибрид Москва. Реализация высоконагруженных конвейеров обработки данных, подготовка данных для аналитических хранилищ.

Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем Банка. Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения. Разработка и поддержание в актуальном состоянии документации по разработанному функционалу. Своевременное отражение статуса выполнения задач в Jira. Проверка качества кода (код-ревью), написанного инженерами и младшими инженерами данных.

Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП (Функциональное программирование), опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных - numpy, pandas Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников. Способность разобраться с API поставщиков данных, используя доступную документацию. SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum. Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных. Airflow- Опыт разработки сложных, высоконагруженных приложений обработки данных на основе PySpark, уверенное знание настроек Spark и их влияния на производительность приложений Spark.

Россия
Pandas
NumPy
Python
SQL
Airflow
PySpark

Не пропусти ни одну вакансию

Подпишись на наш Telegram-канал

Подписаться

Похожие вакансии

Инженер данных

200 000 ₽

Инженер данных в BI Group, ведущем застройщике Центральной Азии. Зарплата от 200 000 рублей. Офис в Астане. Требуется более 3 лет опыта в построении пайплайнов данных, ClickHouse, Kafka, Airflow, DBT, SQL, Python и обеспечении качества данных.

Казахстан
B
BI Group

Инженер данных

Инженер данных в SayGames, издателе и разработчике мобильных игр. Фокус на конвейерах данных, оптимизации SQL и пользовательских данных. Гибридный формат работы (Лимассол, Пафос, Варшава) с возможностью удаленной работы. Гибкий график.

S
SayGames

Инженер данных

Инженер данных в Облако.ру, специализирующийся на проектировании и разработке конвейеров данных для обработки событий кибербезопасности, нормализации событий безопасности и оптимизации аналитических хранилищ данных. Удаленная позиция.

О
Облако.ру