Детали вакансии

Инженерия данных
Мидл
Офис
Полная занятость
May 6

Инженер данных (Качество точек выдачи)

Инженер данных в OZON, специализирующийся на качестве точек выдачи. Обязанности включают создание и поддержку ETL/пайплайнов, разработку сервисной модели для аналитиков и повышение надежности. Технологический стек: Apache Airflow, SQL, Python, Spark, ClickHouse, Kafka, Git, Docker, Hadoop.

Создание и поддержка ETL/пайплайнов: - Разработка, оптимизация и мониторинг для обеспечения доставки данных. Разработка сервисной модели для аналитиков: - Предоставление качественных, документированных и актуальных данных через витрины данных и инструменты автоматизации, сокращая время на рутинные запросы. Повышение надежности и прозрачности: - Участие во внедрении единых стандартов тестирования, мониторинга и оповещения для всех процессов обработки данных.

Знание SQL (CTE, оконные функции, оптимизация запросов). Базовые навыки профилирования и оптимизации SQL-запросов (чтение explain plan, понимание индексов). Понимание принципов построения ETL/ELT пайплайнов и опыт работы с Apache Airflow. Базовые знания Python для обработки данных (Pandas, PySpark). Опыт работы с Git. Понимание концепций распределенных систем и обработки больших данных (Spark, Kafka, архитектура Hadoop).

Россия
Git
Hadoop
Trino
vertica
Python
Spark
SQL
ELT
ETL
ClickHouse
Docker
Airflow
Kafka

Не пропусти ни одну вакансию

Подпишись на наш Telegram-канал

Подписаться

Похожие вакансии

Инженер данных

Компания: Альфа-Банк. Инженер данных #гибрид Москва. Реализация высоконагруженных конвейеров обработки данных, подготовка данных для аналитических хранилищ.

Россия
А
Альфа-Банк

Инженер данных

Инженер данных в Облако.ру, специализирующийся на проектировании и разработке конвейеров данных для обработки событий кибербезопасности, нормализации событий безопасности и оптимизации аналитических хранилищ данных. Удаленная позиция.

О
Облако.ру

Инженер данных

Вакансия Инженера данных в deeplay. Обязанности включают создание и поддержку ETL-процессов, пайплайнов данных, обеспечение качества данных и автоматизацию. Требуется коммерческий опыт от 1 года, Python, pandas, numpy, Apache Airflow и SQL.

d
deeplay