Widok CV
Middle Inżynier danych
200000 ₽
RosjaMoskwa
Pełny etatZdalnie
Doświadczenie zawodowe
1 rok 10 miesięcy
Ostatnie doświadczenie zawodowe
Первый Бит
Data Engineer / BI-разработчик
1 rok 10 miesięcy
O mnie
O mnie
Data Engineer с опытом разработки production-ready ETL/ELT пайплайнов и построения современных хранилищ данных (Data Warehouse / Data Lakehouse).
Специализируюсь на:
• Проектировании DWH, Lakehouse (Bronze→Silver→Gold), Star Schema
• Оркестрации ETL/ELT процессов (Airflow), инкрементальной загрузке (CDC)
• Оптимизации Spark-джобов и SQL-запросов
• Автоматизации контроля качества данных (dbt tests, Great Expectations)
• Разработке витрин для BI/DS и feature engineering
• Потоковой обработке данных (Kafka + Spark Streaming)
Стек: Python, PySpark, SQL, Apache Airflow, dbt, Apache Kafka, PostgreSQL, Greenplum, ClickHouse, Delta Lake, Docker, Git
Портфолио: github.com/Giganmama (6 production-ready проектов с CI/CD, тестами и документацией)
Открыт к работе в офисе, гибридном формате или полностью удалённо (Москва).
Doświadczenie afiliacyjne
Brak danych
Doświadczenie zawodowe1 rok 10 miesięcy
Sierpień 2024 - do teraz
(1 rok 10 miesięcy)
Первый Бит
Data Engineer / BI-разработчик
Разработка production-ready ETL/ELT пайплайнов и аналитических решений для клиентов в ритейле, промышленности и энергетике.
Ключевые проекты:
🔹 Tetra Pak (Упаковочные системы):
- Спроектировал новый контур аналитики на отечественном стеке (Python, Airflow, ClickHouse, PixBI)
- Разработал скрипты оркестрации загрузки данных и наполнения хранилища ClickHouse
- Создал дата-модель и дашборды с кастомными JS-визуализациями
🔹 Île de Beauté (Ритейл):
- Разработал 20+ аналитических приложений полного цикла
- Построил сложные ETL-процессы: интеграция из шин, БД и файловых хранилищ
- Внедрил автоматизированную отчетность с макросами для выгрузки в Excel
- Реализовал механизм контроля качества данных (Data Quality): сравнение с эталонами, диагностика потерь через API
🔹 Внутренние продукты и R&D:
- Разработал AI-ассистент: Telegram-бот с NLP-интерфейсом для получения выборок из БД
- Настроил пайплайн выгрузки метрик из Jira в ClickHouse и дашборды в PixBI
Стек: Python, Apache Airflow, ClickHouse, PostgreSQL, QlikView/Qlik Sense, PixBI, Docker, Git, SQL, ETL/ELT
Umiejętności
PySpark
Apache Airflow
dbt
Apache Kafka
ClickHouse
Greenplum
Delta Lake
Python
SQL
Apache Spark
Realizacja procesów ETL
Budowanie procesów ETL
PostgreSQL
Docker
Git
Znajomość języków
Średniozaawansowany Angielski
Ojczysty Rosyjski
Typ zatrudnienia
Typ zatrudnienia
Pełny etat
Tryb pracy
Zdalnie, Hybrydowo, Biuro
Grafik pracy
5/2
Relokacja
Niemożliwa
Wyjazdy służbowe
Możliwe wyjazdy służbowe