Просмотр резюме
Middle Инженер данных
200000 ₽
РоссияМосква
ПолнаяУдаленная работа
Опыт работы
1 год 10 месяцев
Последнее место работы
Первый Бит
Data Engineer / BI-разработчик
1 год 10 месяцев
Резюме в Telegram-канале
10 резюме
Пост каждый день

О себе
О себе
Data Engineer с опытом разработки production-ready ETL/ELT пайплайнов и построения современных хранилищ данных (Data Warehouse / Data Lakehouse).
Специализируюсь на:
• Проектировании DWH, Lakehouse (Bronze→Silver→Gold), Star Schema
• Оркестрации ETL/ELT процессов (Airflow), инкрементальной загрузке (CDC)
• Оптимизации Spark-джобов и SQL-запросов
• Автоматизации контроля качества данных (dbt tests, Great Expectations)
• Разработке витрин для BI/DS и feature engineering
• Потоковой обработке данных (Kafka + Spark Streaming)
Стек: Python, PySpark, SQL, Apache Airflow, dbt, Apache Kafka, PostgreSQL, Greenplum, ClickHouse, Delta Lake, Docker, Git
Портфолио: github.com/Giganmama (6 production-ready проектов с CI/CD, тестами и документацией)
Открыт к работе в офисе, гибридном формате или полностью удалённо (Москва).
Опыт в Affiliate
Данные отсутствуют
Опыт работы1 год 10 месяцев
Август 2024 - по н.в.
(1 год 10 месяцев)
Первый Бит
Data Engineer / BI-разработчик
Разработка production-ready ETL/ELT пайплайнов и аналитических решений для клиентов в ритейле, промышленности и энергетике.
Ключевые проекты:
🔹 Tetra Pak (Упаковочные системы):
- Спроектировал новый контур аналитики на отечественном стеке (Python, Airflow, ClickHouse, PixBI)
- Разработал скрипты оркестрации загрузки данных и наполнения хранилища ClickHouse
- Создал дата-модель и дашборды с кастомными JS-визуализациями
🔹 Île de Beauté (Ритейл):
- Разработал 20+ аналитических приложений полного цикла
- Построил сложные ETL-процессы: интеграция из шин, БД и файловых хранилищ
- Внедрил автоматизированную отчетность с макросами для выгрузки в Excel
- Реализовал механизм контроля качества данных (Data Quality): сравнение с эталонами, диагностика потерь через API
🔹 Внутренние продукты и R&D:
- Разработал AI-ассистент: Telegram-бот с NLP-интерфейсом для получения выборок из БД
- Настроил пайплайн выгрузки метрик из Jira в ClickHouse и дашборды в PixBI
Стек: Python, Apache Airflow, ClickHouse, PostgreSQL, QlikView/Qlik Sense, PixBI, Docker, Git, SQL, ETL/ELT
Навыки
PySpark
Apache Airflow
dbt
Apache Kafka
ClickHouse
Greenplum
Delta Lake
Python
SQL
Apache Spark
Реализация процессов-ETL
Выстраивание ETL-процессов
PostgreSQL
Docker
Git
Владение языками
Средний Английский
Родной Русский
Занятость
Занятость
Полная
Формат работы
Удаленная работа, Гибрид, Офис
График работы
5/2
Переезд
Невозможен
Командировки
Командировки возможны