Описание курса
Курс углубленного изучения Data Engineering для тех, кто немного знает Python.
Вы освоите экосистему Hadoop, работу с разными источниками данных (файлы, JDBC, SQL), фреймворком Apache Spark, системой Apache Airflow для оркестрации конвейеров и настройки Data Pipelines. Изучите нюансы работы с облачными сервисами Google, Amazon, Azure, работу с ОС Linux и базами данных.
Выпускной Big Data проект: настройка пайплайнов и хранилища данных.
Требования к поступающим: базовые знания языка Python.