Опубликовано 25 дней назад
Big data developer / java developer в Сбербанк Москва
Разработчик ETL на Apache Spark для долгосрочного проекта в Сбербанке. Работа с большими данными, оптимизация пайплайнов.
Задачи:
- Разработка ETL на Apache Spark (Java стек)
- Разработка ETL-пайплайнов (Apache Spark, HDFS (parquets), Hive, Greenplum, ClickHouse)
- Разработка витрин данных в Greenplum и ClickHouse
- Оркестрация ETL-процессов
- Оптимизация ETL-процессов (батчинг, ретраи, SLA-контроль)
- Взаимодействие с BI-разработчиками и DevOps для своевременной доставки данных в Superset
Требования:
- Java(Scala) под Spark обязательно
- Опыт работы с Apache Spark от 1 года
- Опыт работы с СУБД (Greenplum, ClickHouse, PostgreSQL) от 2 лет
- Опыт работы с Hadoop (HDFS, Hive)
- Опыт проектирования и разработки потоков данных, алгоритмов загрузки и обработки данных
- Опыт оптимизации ETL-пайплайнов и SQL кода
- Продвинутые знания SQL
- Понимание принципов работы распределенных систем
- Готовность осваивать Java для использования Spark
Условия:
- Гибрид, 2-3 дня работы из офиса на ул. Вавилова
- Варианты трудоустройства: ТК РФ, ГПХ
Навыки:
- Java
- Scala
- Apache Spark
- Greenplum
- ClickHouse
- PostgreSQL
- Hadoop
- HDFS
- Hive
- SQL
- ETL
- Superset
Эту вакансию мы нашли в Telegram-канал @recrytingIT
СБ
Сбербанк
Москва
Похожие вакансии
Это единственная вакансия по вашему фильтру
Не то, что искал?