Vista del currículum
Middle Ingeniero de datos
200000 ₽
RusiaMoscú
Tiempo completoTrabajo remoto
Experiencia laboral
1 año 11 meses
Último empleo
Первый Бит
Data Engineer / BI-разработчик
1 año 11 meses
Sobre ti
Sobre ti
Data Engineer с опытом разработки production-ready ETL/ELT пайплайнов и построения современных хранилищ данных (Data Warehouse / Data Lakehouse).
Специализируюсь на:
• Проектировании DWH, Lakehouse (Bronze→Silver→Gold), Star Schema
• Оркестрации ETL/ELT процессов (Airflow), инкрементальной загрузке (CDC)
• Оптимизации Spark-джобов и SQL-запросов
• Автоматизации контроля качества данных (dbt tests, Great Expectations)
• Разработке витрин для BI/DS и feature engineering
• Потоковой обработке данных (Kafka + Spark Streaming)
Стек: Python, PySpark, SQL, Apache Airflow, dbt, Apache Kafka, PostgreSQL, Greenplum, ClickHouse, Delta Lake, Docker, Git
Портфолио: github.com/Giganmama (6 production-ready проектов с CI/CD, тестами и документацией)
Открыт к работе в офисе, гибридном формате или полностью удалённо (Москва).
Experiencia en afiliación
No hay datos disponibles
Experiencia laboral1 año 11 meses
Agosto 2024 - hasta la actualidad
(1 año 11 meses)
Первый Бит
Data Engineer / BI-разработчик
Разработка production-ready ETL/ELT пайплайнов и аналитических решений для клиентов в ритейле, промышленности и энергетике.
Ключевые проекты:
🔹 Tetra Pak (Упаковочные системы):
- Спроектировал новый контур аналитики на отечественном стеке (Python, Airflow, ClickHouse, PixBI)
- Разработал скрипты оркестрации загрузки данных и наполнения хранилища ClickHouse
- Создал дата-модель и дашборды с кастомными JS-визуализациями
🔹 Île de Beauté (Ритейл):
- Разработал 20+ аналитических приложений полного цикла
- Построил сложные ETL-процессы: интеграция из шин, БД и файловых хранилищ
- Внедрил автоматизированную отчетность с макросами для выгрузки в Excel
- Реализовал механизм контроля качества данных (Data Quality): сравнение с эталонами, диагностика потерь через API
🔹 Внутренние продукты и R&D:
- Разработал AI-ассистент: Telegram-бот с NLP-интерфейсом для получения выборок из БД
- Настроил пайплайн выгрузки метрик из Jira в ClickHouse и дашборды в PixBI
Стек: Python, Apache Airflow, ClickHouse, PostgreSQL, QlikView/Qlik Sense, PixBI, Docker, Git, SQL, ETL/ELT
Habilidades
PySpark
Apache Airflow
dbt
Apache Kafka
ClickHouse
Greenplum
Delta Lake
Python
SQL
Apache Spark
Implementación de procesos ETL
Diseño de procesos ETL
PostgreSQL
Docker
Git
Dominio de idiomas
Intermedio Inglés
Nativo Ruso
Tipo de empleo
Tipo de empleo
Tiempo completo
Formato de trabajo
Trabajo remoto, Híbrido, Presencial
Horario de trabajo
5/2
Reubicación
No posible
Viajes de trabajo
Viajes posibles