Детали вакансии

Инженерия данных
Мидл
Офис
Полная занятость
May 12

Инженер данных

RUB 200,000

Инженер данных в BI Group, ведущем застройщике Центральной Азии. Зарплата от 200 000 рублей. Офис в Астане. Требуется более 3 лет опыта в построении пайплайнов данных, ClickHouse, Kafka, Airflow, DBT, SQL, Python и обеспечении качества данных.

BI Group — крупнейшая девелоперская компания Центральной Азии.

– Опыт работы инженером данных или на смежной должности с фокусом на построении пайплайнов данных от 3 лет; – ClickHouse – глубокое понимание движков семейства MergeTree (ReplacingMergeTree, AggregatingMergeTree, SummingMergeTree), партиционирования, проекций, материализованных представлений; – Опыт настройки шардирования и репликации; – Навыки оптимизации тяжелых запросов; – Debezium + Kafka – опыт настройки CDC-коннекторов для реляционных и NoSQL источников, понимание snapshot/streaming режимов, работы с эволюцией схемы, работы с Kafka Connect; – Apache Airflow – уверенное написание DAG, опыт работы с TaskFlow API, разработка кастомных операторов и хуков, понимание архитектуры (scheduler, executor, workers), настройка мониторинга и алертинга; – DBT – построение моделей и тестов (generic и singular), макросы, инкрементальные модели, работа с sources и snapshots, поддержка документации; – Уверенный SQL: оконные функции, CTE, чтение и оптимизация планов выполнения; – Python на уровне production кода; – Опыт работы с data quality: написание тестов, data contracts, практики observability.

Казахстан
Data Quality
Data Engineering
Python
SQL
ClickHouse
Airflow
dbt
Kafka

Не пропусти ни одну вакансию

Подпишись на наш Telegram-канал

Подписаться

Похожие вакансии

Инженер данных

Инженер данных в Облако.ру, специализирующийся на проектировании и разработке конвейеров данных для обработки событий кибербезопасности, нормализации событий безопасности и оптимизации аналитических хранилищ данных. Удаленная позиция.

О
Облако.ру

Инженер данных

Вакансия Инженера данных в deeplay. Обязанности включают создание и поддержку ETL-процессов, пайплайнов данных, обеспечение качества данных и автоматизацию. Требуется коммерческий опыт от 1 года, Python, pandas, numpy, Apache Airflow и SQL.

d
deeplay