Middle Inżynier danych

200000
Rosja
Moskwa
Pełny etat
Zdalnie
Doświadczenie zawodowe
1 rok 10 miesięcy
Ostatnie doświadczenie zawodowe

Первый Бит

Data Engineer / BI-разработчик
1 rok 10 miesięcy

O mnie

O mnie
Data Engineer с опытом разработки production-ready ETL/ELT пайплайнов и построения современных хранилищ данных (Data Warehouse / Data Lakehouse). Специализируюсь на: • Проектировании DWH, Lakehouse (Bronze→Silver→Gold), Star Schema • Оркестрации ETL/ELT процессов (Airflow), инкрементальной загрузке (CDC) • Оптимизации Spark-джобов и SQL-запросов • Автоматизации контроля качества данных (dbt tests, Great Expectations) • Разработке витрин для BI/DS и feature engineering • Потоковой обработке данных (Kafka + Spark Streaming) Стек: Python, PySpark, SQL, Apache Airflow, dbt, Apache Kafka, PostgreSQL, Greenplum, ClickHouse, Delta Lake, Docker, Git Портфолио: github.com/Giganmama (6 production-ready проектов с CI/CD, тестами и документацией) Открыт к работе в офисе, гибридном формате или полностью удалённо (Москва).

Doświadczenie afiliacyjne

Brak danych

Doświadczenie zawodowe
1 rok 10 miesięcy

Sierpień 2024 - do teraz
(1 rok 10 miesięcy)
Первый Бит
Data Engineer / BI-разработчик
Разработка production-ready ETL/ELT пайплайнов и аналитических решений для клиентов в ритейле, промышленности и энергетике. Ключевые проекты: 🔹 Tetra Pak (Упаковочные системы): - Спроектировал новый контур аналитики на отечественном стеке (Python, Airflow, ClickHouse, PixBI) - Разработал скрипты оркестрации загрузки данных и наполнения хранилища ClickHouse - Создал дата-модель и дашборды с кастомными JS-визуализациями 🔹 Île de Beauté (Ритейл): - Разработал 20+ аналитических приложений полного цикла - Построил сложные ETL-процессы: интеграция из шин, БД и файловых хранилищ - Внедрил автоматизированную отчетность с макросами для выгрузки в Excel - Реализовал механизм контроля качества данных (Data Quality): сравнение с эталонами, диагностика потерь через API 🔹 Внутренние продукты и R&D: - Разработал AI-ассистент: Telegram-бот с NLP-интерфейсом для получения выборок из БД - Настроил пайплайн выгрузки метрик из Jira в ClickHouse и дашборды в PixBI Стек: Python, Apache Airflow, ClickHouse, PostgreSQL, QlikView/Qlik Sense, PixBI, Docker, Git, SQL, ETL/ELT

Umiejętności

PySpark
Apache Airflow
dbt
Apache Kafka
ClickHouse
Greenplum
Delta Lake
Python
SQL
Apache Spark
Realizacja procesów ETL
Budowanie procesów ETL
PostgreSQL
Docker
Git

Znajomość języków

Średniozaawansowany Angielski
Ojczysty Rosyjski

Typ zatrudnienia

Typ zatrudnienia
Pełny etat
Tryb pracy
Zdalnie, Hybrydowo, Biuro
Grafik pracy
5/2
Relokacja
Niemożliwa
Wyjazdy służbowe
Możliwe wyjazdy służbowe
    Middle Inżynier danych w Moskwa — Specjaliści ds. marketingu cyfrowego i afiliacji | ArbiHunter