Задачи:
1.Установить MySQL. Можно вместе со средой или использовать альтернативы DBeaver/DataGrip.
2. Запустить dump-файл для создания и заполнения базы
3. Придумать запросы в соответствии со структурой базы и реализовать их:
• 4 запроса по одной таблице
• 3 запроса на join двух таблиц
• 2 запроса на join 2х и более таблиц
• 2 запроса с использованием вложенных запросов
Результаты работы зафиксировать в формате отчета со скриншотами работы. Желательно,
продемонстрировать работы на своем ПК.
1. Установить на виртуальную машину образ Hadoop (Для этого также понадобится VirtualBox
или VMware
2. Выполнить следующие шаги в терминале для доступа к панели администратора:
a. hostname # Покажет имя хоста: quickstart.cloudera
b. hdfs dfs -ls / # Проверка на наличие доступа и работу кластера. Покажет файлы в
системе HDFS
c. service cloudera-scm-server status # Указывает, какую команду вам нужно ввести,
чтобы использовать cloudera express бесплатно
d. su - #Вход в рута
e. service cloudera-scm-server status # Пароль для рута: cloudera
3. [Исследовательское] Сколько узлов одновременно можно потерять без потери данных в
кластере из 10 узлов? Из 100 узлов?
4. Опробовать консольные утилиты для работы с кластером
• Создать/скопировать/удалить папку
• Положить в HDFS любой файл
• Скопировать/удалить этот файл
• Просмотреть размер любой папки
• Посмотреть как файл хранится на файловой системе (см. команду fsck)
• Установить нестандартный фактор репликации (см. команду setrep)
5. Запустить Cloudera Express и Cloudera Manager. Изучить интерфейс.
Написать программу для подсчета количества слов на языке
java или воспользоваться примерами программ. И выполнить
следующую последовательность действий:
1. Перед запуском примера необходимо создать места ввода и вывода в
формате HDFS. Используйте следующие команды для создания
каталога ввода/пользователя/cloudera/wordcount/ввода в HDFS
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |