Содержание программы должно включать темы:
- инструменты для работы с большими данными;
- инженерия данных: организация хранения данных;
- инженерия данных: высокоуровневое проектирование систем работы с данными;
- работа ClickHouse с использованием Docker, PostgreSQL в
операционных системах Windows и Linux;
- ETL (Python + SQL);
- типы данных, преобразование типов. Условные конструкции. Работа с датами. Работа со строковыми данными, регулярные выражения;
- группировка и агрегатные функции. Объединение таблиц-JOIN. Подзапросы, общие табличные выражения (CTE);
- объединения: Union, Except, intersect;
- создание/изменение таблиц, связи между таблицами (ключи), индексы;
- использование словарей;
- использование массивов;
- модели распределения вычислений. Распределенные запросы;
- оптимизация запросов;
- оконные функции.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |