Middle Инженер данных в Москва | Резюме специалистов digital, маркетинга и affiliate на arbihunter.com

Middle Инженер данных

200000
Россия
Москва
Полная
Удаленная работа
Опыт работы
1 год 10 месяцев
Последнее место работы

Первый Бит

Data Engineer / BI-разработчик
1 год 10 месяцев

Резюме в Telegram-канале

10 резюме

Пост каждый день

О себе

О себе
Data Engineer с опытом разработки production-ready ETL/ELT пайплайнов и построения современных хранилищ данных (Data Warehouse / Data Lakehouse). Специализируюсь на: • Проектировании DWH, Lakehouse (Bronze→Silver→Gold), Star Schema • Оркестрации ETL/ELT процессов (Airflow), инкрементальной загрузке (CDC) • Оптимизации Spark-джобов и SQL-запросов • Автоматизации контроля качества данных (dbt tests, Great Expectations) • Разработке витрин для BI/DS и feature engineering • Потоковой обработке данных (Kafka + Spark Streaming) Стек: Python, PySpark, SQL, Apache Airflow, dbt, Apache Kafka, PostgreSQL, Greenplum, ClickHouse, Delta Lake, Docker, Git Портфолио: github.com/Giganmama (6 production-ready проектов с CI/CD, тестами и документацией) Открыт к работе в офисе, гибридном формате или полностью удалённо (Москва).

Опыт в Affiliate

Данные отсутствуют

Опыт работы
1 год 10 месяцев

Август 2024 - по н.в.
(1 год 10 месяцев)
Первый Бит
Data Engineer / BI-разработчик
Разработка production-ready ETL/ELT пайплайнов и аналитических решений для клиентов в ритейле, промышленности и энергетике. Ключевые проекты: 🔹 Tetra Pak (Упаковочные системы): - Спроектировал новый контур аналитики на отечественном стеке (Python, Airflow, ClickHouse, PixBI) - Разработал скрипты оркестрации загрузки данных и наполнения хранилища ClickHouse - Создал дата-модель и дашборды с кастомными JS-визуализациями 🔹 Île de Beauté (Ритейл): - Разработал 20+ аналитических приложений полного цикла - Построил сложные ETL-процессы: интеграция из шин, БД и файловых хранилищ - Внедрил автоматизированную отчетность с макросами для выгрузки в Excel - Реализовал механизм контроля качества данных (Data Quality): сравнение с эталонами, диагностика потерь через API 🔹 Внутренние продукты и R&D: - Разработал AI-ассистент: Telegram-бот с NLP-интерфейсом для получения выборок из БД - Настроил пайплайн выгрузки метрик из Jira в ClickHouse и дашборды в PixBI Стек: Python, Apache Airflow, ClickHouse, PostgreSQL, QlikView/Qlik Sense, PixBI, Docker, Git, SQL, ETL/ELT

Навыки

PySpark
Apache Airflow
dbt
Apache Kafka
ClickHouse
Greenplum
Delta Lake
Python
SQL
Apache Spark
Реализация процессов-ETL
Выстраивание ETL-процессов
PostgreSQL
Docker
Git

Владение языками

Средний Английский
Родной Русский

Занятость

Занятость
Полная
Формат работы
Удаленная работа, Гибрид, Офис
График работы
5/2
Переезд
Невозможен
Командировки
Командировки возможны