Middle Деректер инженері ішінде Мәскеу | arbihunter.com сайтындағы сандық, маркетинг және серіктестік маманының түйіндемелері

Middle Деректер инженері

200000
Ресей
Мәскеу
Толық
Қашықтан жұмыс
Жұмыс тәжірибесі
1 жыл 10 ай
Соңғы жұмыс орны

Первый Бит

Data Engineer / BI-разработчик
1 жыл 10 ай

Өзің туралы

Өзің туралы
Data Engineer с опытом разработки production-ready ETL/ELT пайплайнов и построения современных хранилищ данных (Data Warehouse / Data Lakehouse). Специализируюсь на: • Проектировании DWH, Lakehouse (Bronze→Silver→Gold), Star Schema • Оркестрации ETL/ELT процессов (Airflow), инкрементальной загрузке (CDC) • Оптимизации Spark-джобов и SQL-запросов • Автоматизации контроля качества данных (dbt tests, Great Expectations) • Разработке витрин для BI/DS и feature engineering • Потоковой обработке данных (Kafka + Spark Streaming) Стек: Python, PySpark, SQL, Apache Airflow, dbt, Apache Kafka, PostgreSQL, Greenplum, ClickHouse, Delta Lake, Docker, Git Портфолио: github.com/Giganmama (6 production-ready проектов с CI/CD, тестами и документацией) Открыт к работе в офисе, гибридном формате или полностью удалённо (Москва).

Affiliate тәжірибесі

Деректер жоқ

Жұмыс тәжірибесі
1 жыл 10 ай

Тамыз 2024 - қазіргі уақытқа дейін
(1 жыл 10 ай)
Первый Бит
Data Engineer / BI-разработчик
Разработка production-ready ETL/ELT пайплайнов и аналитических решений для клиентов в ритейле, промышленности и энергетике. Ключевые проекты: 🔹 Tetra Pak (Упаковочные системы): - Спроектировал новый контур аналитики на отечественном стеке (Python, Airflow, ClickHouse, PixBI) - Разработал скрипты оркестрации загрузки данных и наполнения хранилища ClickHouse - Создал дата-модель и дашборды с кастомными JS-визуализациями 🔹 Île de Beauté (Ритейл): - Разработал 20+ аналитических приложений полного цикла - Построил сложные ETL-процессы: интеграция из шин, БД и файловых хранилищ - Внедрил автоматизированную отчетность с макросами для выгрузки в Excel - Реализовал механизм контроля качества данных (Data Quality): сравнение с эталонами, диагностика потерь через API 🔹 Внутренние продукты и R&D: - Разработал AI-ассистент: Telegram-бот с NLP-интерфейсом для получения выборок из БД - Настроил пайплайн выгрузки метрик из Jira в ClickHouse и дашборды в PixBI Стек: Python, Apache Airflow, ClickHouse, PostgreSQL, QlikView/Qlik Sense, PixBI, Docker, Git, SQL, ETL/ELT

Дағдылар

PySpark
Apache Airflow
dbt
Apache Kafka
ClickHouse
Greenplum
Delta Lake
Python
SQL
Apache Spark
ETL-процестерді іске асыру
ETL-процестерді құру
PostgreSQL
Docker
Git

Тілдерді білу

Орташа Ағылшын
Ана тілі Орыс тілі

Жұмыспен қамту

Жұмыспен қамту
Толық
Жұмыс форматы
Қашықтан жұмыс, Гибрид, Офис
Жұмыс кестесі
5/2
Көшу
Мүмкін емес
Іссапарлар
Іссапарлар мүмкін