Перегляд резюме
Middle Інженер даних
200000 ₽
РосiяМосква
ПовнаВіддалена робота
Досвід роботи
1 рік 10 місяців
Останнє місце роботи
Первый Бит
Data Engineer / BI-разработчик
1 рік 10 місяців
Про себе
Про себе
Data Engineer с опытом разработки production-ready ETL/ELT пайплайнов и построения современных хранилищ данных (Data Warehouse / Data Lakehouse).
Специализируюсь на:
• Проектировании DWH, Lakehouse (Bronze→Silver→Gold), Star Schema
• Оркестрации ETL/ELT процессов (Airflow), инкрементальной загрузке (CDC)
• Оптимизации Spark-джобов и SQL-запросов
• Автоматизации контроля качества данных (dbt tests, Great Expectations)
• Разработке витрин для BI/DS и feature engineering
• Потоковой обработке данных (Kafka + Spark Streaming)
Стек: Python, PySpark, SQL, Apache Airflow, dbt, Apache Kafka, PostgreSQL, Greenplum, ClickHouse, Delta Lake, Docker, Git
Портфолио: github.com/Giganmama (6 production-ready проектов с CI/CD, тестами и документацией)
Открыт к работе в офисе, гибридном формате или полностью удалённо (Москва).
Досвід в Affiliate
Дані відсутні
Досвід роботи1 рік 10 місяців
Серпень 2024 - по т.ч.
(1 рік 10 місяців)
Первый Бит
Data Engineer / BI-разработчик
Разработка production-ready ETL/ELT пайплайнов и аналитических решений для клиентов в ритейле, промышленности и энергетике.
Ключевые проекты:
🔹 Tetra Pak (Упаковочные системы):
- Спроектировал новый контур аналитики на отечественном стеке (Python, Airflow, ClickHouse, PixBI)
- Разработал скрипты оркестрации загрузки данных и наполнения хранилища ClickHouse
- Создал дата-модель и дашборды с кастомными JS-визуализациями
🔹 Île de Beauté (Ритейл):
- Разработал 20+ аналитических приложений полного цикла
- Построил сложные ETL-процессы: интеграция из шин, БД и файловых хранилищ
- Внедрил автоматизированную отчетность с макросами для выгрузки в Excel
- Реализовал механизм контроля качества данных (Data Quality): сравнение с эталонами, диагностика потерь через API
🔹 Внутренние продукты и R&D:
- Разработал AI-ассистент: Telegram-бот с NLP-интерфейсом для получения выборок из БД
- Настроил пайплайн выгрузки метрик из Jira в ClickHouse и дашборды в PixBI
Стек: Python, Apache Airflow, ClickHouse, PostgreSQL, QlikView/Qlik Sense, PixBI, Docker, Git, SQL, ETL/ELT
Навички
PySpark
Apache Airflow
dbt
Apache Kafka
ClickHouse
Greenplum
Delta Lake
Python
SQL
Apache Spark
Реалiзацiя процесiв ETL
Побудова ETL-процесiв
PostgreSQL
Docker
Git
Володіння мовами
Середнiй Англiйська
Рiдна мова Росiйська
Зайнятість
Зайнятість
Повна
Формат роботи
Віддалена робота, Гібрид, Офіс
Графік роботи
5/2
Переїзд
Неможливий
Відрядження
Відрядження можливі