Тольяттинский государственный университет (Росдистант), ТГУ. Разработка программного обеспечения для Big Data (9602, 11715). Промежуточные и итоговый тесты. Ответы на вопросы.
Для Росдистант имеются и другие готовые работы. Пишем уникальные работы под заказ. Помогаем с прохождением онлайн-тестов. Пишите, пожалуйста, в личку (Евгений).
ИТОГОВЫЙ ТЕСТ (в базе более 100 вопросов)
Что из следующего не является допустимой структурой данных для NoSQL БД?
Выберите один ответ:
На основе ключа/значения
На основе столбца
На основе графика
На основе таблицы
Информация, которая не хранится или не собирается организациями специально, а формируется случайно (попутно) в процессе ведения бизнеса или взаимодействия с сетевыми сервисами и остается в интернет-архивах, – это
Выберите один ответ:
операционные данные
«темные» данные
коммерческие данные
официальные данные
информация из социальных сетей и сервисов
Определение Big Data основано на методе
Выберите один ответ:
мультиV
мультиB
мультиD
мультиBD
Какой оператор в MongoDB используется для вычисления максимального значения в агрегации?
Выберите один ответ:
$last
$means
$count(max)
$max
К каким компонентам доступ осуществляется с помощью команд T-SQL?
Выберите один ответ:
Таблицы, оптимизированные для памяти
Хранимые процедуры, скомпилированные в собственном коде
Таблицы, скомпилированные в собственном коде
Хранимые процедуры, оптимизированные для памяти
Какой оператор в MongoDB помещает значение в результирующий массив, но не создает дубликаты?
Выберите один ответ:
$addToSet
$push
$addToArray
$pushToSet
In-Memory – это
Выберите один ответ:
технология выполнения компьютерных вычислений полностью в памяти компьютера
технология проверки ОЗУ
технология управления памятью
тип ОЗУ
Для какой структуры данных In-Memory OLTP все данные хранятся в памяти и страницы не нужно помещать в пул буферов или кэш?
Выберите один ответ:
Таблица, оптимизированная для памяти
Хранимая процедура, скомпилированная в собственном коде
Таблица, скомпилированная для оптимизации памяти
Хранимая процедура, оптимизированная для синхронизации памяти
На рисунке
представлен базовый пример того, как будет выглядеть
Выберите один ответ:
база данных
коллекция
документ
запись
Выберите наиболее популярные фреймворки, используемые при работе с большими данными.
Выберите один или несколько ответов:
Hadoop
Cassandra
Pentaho
Cloudera
Scala
Какие типы объектов позволяют еще больше сократить продолжительность выполнения отдельной транзакции за счет сокращения циклов ЦП, необходимых для обработки операций?
Выберите один ответ:
Таблицы, оптимизированные для памяти
Неустойчивые таблицы
Табличные типы, оптимизированные для памяти
Скомпилированные в собственном коде модули T-SQL
С чем связаны затруднения по введению систем Big Data?
Выберите один или несколько ответов:
Разнообразием источников данных
Качеством получаемых данных
Итоговой визуализацией данных
Разнообразием используемых технологий
Какие данные легко вводить, запрашивать и анализировать?
Выберите один ответ:
Структурированные
Полуструктурированные
Неструктурированные
Расструктурированные
Укажите свойства, которые определяют наборы данных.
Выберите один или несколько ответов:
Объем
Скорость
Разнообразие
Время
Для создания курсора в MongoDB используется команда
Выберите один ответ:
let cursor = db.Книги.find()
cursor = db.Книги.find()
db.Книги.find()
set cursor = db.Книги.find()
Какие уровни включают компоненты архитектуры анализа больших данных?
Выберите один или несколько ответов:
Уровень источников больших данных
Уровень управления и хранения
Уровень потребления
Уровень моделирования и визуализации данных
Приведите примеры источников больших данных.
Выберите один или несколько ответов:
GPS-навигаторы
Спутниковые данные
Электронная торговля
Интернет-запросы
Школьный журнал с оценками
Какой параметр MongoDB отвечает за хранение данных в документах Json, где она предоставляет богатую модель данных, которая безупречно сопоставляется с типами языка программирования?
Выберите один ответ:
Гибкость
Скорость
Мощность
Масштабируемость
MongoDB используется
Выберите один ответ:
для хранения больших объемов данных
для обработки больших объемов данных
для обработки больших документов
для хранения больших документов
Какие данные разделены на несколько таблиц для повышения целостности данных путем создания одной записи для отображения объекта?
Выберите один ответ:
Структурированные
Полуструктурированные
Неструктурированные
Расструктурированные
В базе данных MongoDB нет коллекции «Клиенты». Результатом выполнения команды db.Клиенты.insert({"name": "Tom", "age": 28, languages: ["english", "spanish"]}) является
Выберите один ответ:
создание коллекции «Клиенты» и добавление в нее документа
добавление документа в любую существующую коллекцию БД
сообщение об ошибке
создание новой базы данных «Клиенты» и добавление в нее документа
Результатом выполнения какой команды в MongoDB является сортировка документов по убыванию?
Выберите один ответ:
db.Книги.find().sort({Наименование:-1})
db.Книги.sort({Наименование:-1})
db.Книги.find().sort(Наименование:-1)
db.Книги.find().sort({Наименование:1})
Что означает термин Big Data в информационных технологиях?
Выберите один ответ:
Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов
Представление времени, дня, месяца и года в качестве значения количества миллисекунд, прошедших с начала нашей эры
Файлы с большим количеством данных
Комплексный набор методов для создания файлов большого объёма
Укажите этапы обработки больших данных.
Выберите один или несколько ответов:
Интегрирование
Управление
Анализ данных
Агрегация
На каких компонентах построена In-Memory OLTP?
Выберите один или несколько ответов:
Таблицах, оптимизированных для памяти
Хранимых процедурах, скомпилированных в собственном коде
Таблицах, скомпилированных в собственном коде
Хранимых процедурах, оптимизированных для памяти
Какая утилита Hadoop нацелена на выявление конфликтующих задач внутри всей системы, нерационального использования ресурсов?
Выберите один ответ:
HDFS
Whirr
YARN
Zookeeper
К NewSQL СУБД относятся
Выберите один или несколько ответов:
VoltDB
NuoDB
Cockroach
Cassandra
Какой оператор в MongoDB помещает значение в результирующий массив, но не создает дубликаты?
Выберите один ответ:
$addToSet
$push
$addToArray
$pushToSet
Какой фреймворк предлагает распределенную отказоустойчивую систему обработки в реальном времени?
Выберите один ответ:
Storm
Cassandra
HPCC
Atlas.ti
Какой тип данных в MongoDB является меткой времени?
Выберите один ответ:
Timestamp
Date
Binary data
Datetime
Соотнесите технологии, применяемые при работе с большими данными, и их описание.
Apache Hadoop
Выберите...
Фреймворк для обеспечения безопасности данных в Hadoop
Данные хранятся в оперативной памяти
Неструктурированные хранилища для большого количества «сырых» данных, не подвергающихся каким-либо изменениям перед сохранением
Позволяет обеспечивать работу распределённых программ на кластерах из сотен и тысяч узлов
Apache Ranger
Выберите...
Фреймворк для обеспечения безопасности данных в Hadoop
Данные хранятся в оперативной памяти
Неструктурированные хранилища для большого количества «сырых» данных, не подвергающихся каким-либо изменениям перед сохранением
Позволяет обеспечивать работу распределённых программ на кластерах из сотен и тысяч узлов
In-Memory базы данных
Выберите...
Фреймворк для обеспечения безопасности данных в Hadoop
Данные хранятся в оперативной памяти
Неструктурированные хранилища для большого количества «сырых» данных, не подвергающихся каким-либо изменениям перед сохранением
Позволяет обеспечивать работу распределённых программ на кластерах из сотен и тысяч узлов
Озёра данных (data lakes)
Выберите...
Фреймворк для обеспечения безопасности данных в Hadoop
Данные хранятся в оперативной памяти
Неструктурированные хранилища для большого количества «сырых» данных, не подвергающихся каким-либо изменениям перед сохранением
Позволяет обеспечивать работу распределённых программ на кластерах из сотен и тысяч узлов
· Фреймворк для обеспечения безопасности данных в Hadoop
· Данные хранятся в оперативной памяти
· Неструктурированные хранилища для большого количества «сырых» данных, не подвергающихся каким-либо изменениям перед сохранением
· Позволяет обеспечивать работу распределённых программ на кластерах из сотен и тысяч узлов
Результатом выполнения команды db.Книги.find({},{Название:1,_id:0}) в MongoDB является
Выберите один ответ:
отображение поля «Название» всех документов в коллекции «Книги»
отображение поля «Название» первого документа в коллекции «Книги»
отображение полей _id и «Название» всех документов в коллекции «Книги»
сообщение об ошибке
Для условного перехода в T-SQL используется команда
Выберите один ответ:
WHILE
FOR
DO WHILE
IF ELSE
Определите последовательность создания таблицы, оптимизированной для памяти.
Создание таблицы, оптимизированной для памяти
Добавление контейнера в файловую группу
Работа с таблицей, оптимизированной для памяти
Создание файловой группы для таблиц, оптимизированных для памяти
Выберите...
1
4
2
3
Для повышения эффективности OLTP-системы используются
Выберите один или несколько ответов:
SSD
технология In-Memory
технология NewSQL
сильная нормализация данных
База данных в MongoDB используется
Выберите один ответ:
для хранения всех коллекций
для хранения всех документов
для хранения всех данных
для хранения объектов
Какое свойство определяет, насколько правдивы данные и насколько на них можно полагаться?
Выберите один ответ:
Объем
Скорость
Разнообразие
Ценность
Достоверность
Особенность какого языка программирования заключается в возможности запуска параллельных процессов при работе с большими массивами данных?
Выберите один ответ:
Scala
R
Go
Python
Java
Какой язык сериализации означает расширяемый язык разметки?
Выберите один ответ:
XML
JSON
YAML
JAVA
Оболочкой и языком запросов для MongoDB является
Выберите один ответ:
JavaScript
Java
VBA
Python
На рисунке
изображена архитектура
Выберите один ответ:
In-Memory OLTP-системы
типовой OLTP-системы
OLTP-клиент
OLAP-машины
– это пример
Выберите один ответ:
структурированных данных
полуструктурированных данных
неструктурированных данных
расструктурированных данных
Какое утверждение верное?
Выберите один ответ:
Эффективность OLTP-систем определяется количеством транзакций в секунду
Эффективность OLTP-систем определяется количеством транзакций за отчетный период
Эффективность OLTP-систем определяется количеством одновременно обслуживаемых пользователей
Эффективность OLTP-систем определяется объемом собранной информации
Чего не могут стандартные реляционные базы (MySQL, Oracle, MS SQL)?
Выберите один ответ:
Хранить данные с изменяющейся структурой
Хранить данные на нескольких физических серверах
Хранить большие объемы (терабайты+)
Обрабатывать запросы большого количества клиентов (миллионы)
Для сортировки курсора в MongoDB по возрастанию используется команда
Выберите один ответ:
cursor.sort({name:1})
cursor.sort({name:-1})
cursor.sort(name:-1)
cursor.sort(name)
Выделите основные функции, которые характеризуют программную библиотеку Apache Hadoop.
Выберите один или несколько ответов:
Поддержка расширенных атрибутов файловой системы в стиле POSIX
Наличие технологии и инструментов для работы с большими данными, которые предлагают надежную экосистему, которая хорошо подходит для удовлетворения аналитических потребностей разработчиков
Интегрированный способ работы с данными
Это один из высокоэффективных инструментов для работы с большими данными, который выполняет задачи с большими данными с гораздо меньшим количеством кода
Распределенная служба, позволяющая собирать, сортировать и перемещать большие объемы данных журнала событий, – это
Выберите один ответ:
HDFS
Whirr
YARN
Flume
Какой уровень архитектуры анализа больших данных получает данные из источника, преобразует данные в формат, понятный для инструмента анализа данных?
Выберите один ответ:
Уровень источников больших данных
Уровень управления и хранения
Уровень анализа
Уровень потребления
Выберите программную среду с открытым исходным кодом, используемую для разработки приложений обработки данных, которые выполняются в распределенной вычислительной среде.
Выберите один ответ:
Hadoop
Cassandra
Pentaho
Cloudera
Как называется тип данных с неизвестной формой или структурой?
Выберите один ответ:
Структурированный
Полуструктурированный
Неструктурированный
Расструктурированный
Какой оператор в MongoDB используется для вычисления минимального значения в агрегации?
Выберите один ответ:
$means
$count(min)
$min
$first
Выделите принципы архитектуры больших данных.
Выберите один или несколько ответов:
ETL для больших данных
API служб данных
Сервис пользовательского интерфейса
Сервисно ориентированный подход
Какие типы больших данных вы знаете?
Выберите один или несколько ответов:
Структурированный
Полуструктурированный
Неструктурированный
Расструктурированный
В каких из приведённых примеров наиболее эффективны NoSQL решения типа ключ – значение?
Выберите один ответ:
Потоковая обработка логов кластера серверов и быстрого сохранения без требования оперативной аналитики
Оперативная аналитика сохранённых логов кластера серверов
Кластеризация логов кластера серверов на основе заранее известных признаков лог-файла
Хранение данных о клиентах международной корпорации
Инструмент для анализа больших данных, который имеет мощный механизм профилирования данных, – это
Выберите один ответ:
Apache Flink
DataCleaner
Open Refine
RapidMiner
Какая команда в MongoDB используется для создания коллекции?
Выберите один ответ:
createCollection
createTable
collectionCreate
useCollection
Назовите состояния, в которых может находиться транзакция базы данных.
Выберите один или несколько ответов:
Терпит неудачу
Завершается успешно
Остается в ожидании
Остается в промежуточном состоянии
К проекциям MongoDB относятся команды
Выберите один или несколько ответов:
db.Книги.find({},{Название:1,_id:0})
db.Книги.find({},{Название:1}).sort()
db.Книги.find({},{Название:1})
db.Книги.find().sort()
Для ограничения размера выборки в МongoDB используется метод
Выберите один ответ:
limit()
min()
max()
restrict()
Укажите библиотеку с алгоритмами для управления облачными сервисами.
Выберите один ответ:
HDFS
Whirr
YARN
Zookeeper
Какие новые взаимосвязанные принципы обработки информации диктует большой объем данных?
Выберите один или несколько ответов:
Способность анализировать все данные, а не их часть или статистические выборки
Готовность иметь дело с неупорядоченными данными в ущерб точности
Способность анализировать часть данных
Готовность иметь дело со структурированными данными
Метод db.createCollection(), который позволяет создавать коллекции без добавления в них каких-либо документов, называется
Выберите один ответ:
неявно
явно
реально
нереально
Изначально не систематизированные данные о социально-экономическом развитии и окружающей среде, генерируемые на основе информационно-коммуникационных технологий вне официальной статистики, – это
Выберите один ответ:
большие данные
огромные данные
массивы данных
мегаданные
Результатом выполнения команды db.Книги.find().sort({Наименование:-1}) является
Выберите один ответ:
сортировка документов по убыванию
сортировка документов по возрастанию
сообщение об ошибке
удаление первого документа
К свойствам распределенной системы по теореме САР относятся
Выберите один или несколько ответов:
согласованность данных
доступность
устойчивость к разделению
надежность
Какое утверждение верное?
Выберите один ответ:
Для повышения эффективности OLTP-системы используются жесткие диски
Для повышения эффективности OLTP-системы используется слабая нормализация данных
Для повышения эффективности OLTP-системы используется технология In-Memory
Для повышения эффективности OLTP-системы используется технология NoSQL
Какой индекс использует оператор ">" или "<"?
Выберите один ответ:
Хэш-индекс
Индекс диапазона
Индекс запроса
Индекс таблицы
Какой метод в MongoDB используется для выбора одного документа из коллекции?
Выберите один ответ:
findOne()
find(1)
selectOne()
seekOne()
Для создания циклов в MongoDB используются операторы
Выберите один или несколько ответов:
while
for
loop
ring
Укажите типы таблицы оптимизации памяти.
Выберите один или несколько ответов:
SCHEMA_AND_DATA
SCHEMA_ONLY
SCHEMA_AND_ONLY
SCHEMA_DATA
Что не относится к NoSQL?
Выберите один ответ:
Масштабируемость
Поддержка ACID
Простой интерфейс
Поддержка BASE
В базе данных MongoDB есть коллекция «Клиенты». Результатом выполнения команды db.Клиенты.insert({"name": "Tom", "age": 28, languages: ["english", "spanish"]}) является
Выберите один ответ:
удаление существующей и создание новой коллекции «Клиенты» с последующим добавлением в нее документа
добавление документа в существующую коллекцию
сообщение об ошибке
удаление существующей и создание новой коллекции «Клиенты» без добавления документа
Сколько всего свойств распределенной системы представлены в теореме САР?
Выберите один ответ:
2
3
4
5
Какие понятия содержит в себе принцип трех V?
Выберите один ответ:
Volume, Variety, Virtuality
Volume, Variety, Velocity
Velocity, Volume, Verbosity
Verbosity, Volume, Virtuality
В каком случае метод save() в MongoDB будет работать как update()?
Выберите один ответ:
Если не указан _id в документе
Если указан _id в документе
Во всех случаях
Метод save() не используется для ввода документов
Что не относится к технологии NewSQL?
Выберите один ответ:
Реляционная модель БД
Не поддерживает ACID
Обработка больших данных
Использование диалектов SQL
Каковы основные отличительные особенности BigData?
Выберите один или несколько ответов:
Традиционные технологии хранения
Большой объем информации
Распределенный подход к обработке
Фиксированный набор истоков данных
Как называются таблицы, в которых в случае сбоя сервера или аварийного переключения данные не будут восстановлены, поскольку буферы памяти будут сброшены?
Выберите один ответ:
Устойчивыми
Неустойчивыми
Стабильными
Динамическими
Какое выражение в инструкции CREATE TABLE используется для создания таблицы In-Memory в T-SQL?
Выберите один ответ:
MEMORY_OPTIMIZED=ON
IN-MEMORY=ON
MEMORY_OPTIMIZED=OFF
IN-MEMORY=OFF
Для обработки Big Data используются
Выберите один ответ:
языки высокого уровня
диалекты SQL
собственные языки запросов СУБД
все варианты верны
Какое утверждение неверное?
Выберите один ответ:
Если коллекция не существует в БД, MongoDB создаст эту коллекцию и вставит в нее документ
Имя поля документа в MongoDB может состоять из двух и более отдельных слов
MongoDB – нереляционная СУБД
В добавленном документе, если не указан параметр _id, MongoDB назначает уникальный ObjectId для этого документа
От чего зависит выбор языка программирования при работе с большими данными?
Выберите один ответ:
От варианта использования, который требуется разработать
От компетентности разработчика
От уровня задачи
От сроков исполнения
Следующие факторы влияют на повышение производительности при использовании OLTP в памяти.
Выберите один или несколько ответов:
OLTP в памяти достигает наивысшей производительности при использовании хранимых процедур, скомпилированных в собственном коде, вместо интерпретированных хранимых процедур или выполнения запроса
Некластеризованные, оптимизированные для памяти индексы поддерживают просмотр диапазона и упорядоченные просмотры
Производительность приложений, которая зависит от параллелизма компонента уровня СУБД
Производительность приложений, которая зависит от конфликтов кратковременной блокировки, значительно понижается при переходе на OLTP в памяти
Платформа для In-Memory вычислений – это
Выберите один ответ:
Redis
Tarantool
MapReduce
Hadoop
Результатом выполнения команды db.Книги.find({Название:/A.*/}).sort({Наименование:-1}) является
Выберите один ответ:
выбор документов из коллекции «Книги», названия которых начинаются с буквы А, и сортировка их по убыванию
выбор документов из коллекции «Книги», названия которых начинаются с буквы А, и сортировка их по возрастанию
сообщение об ошибке
выбор документов из коллекции «Книги», названия которых начинаются с буквы А, и удаление первого документа
Сколько свойств согласно теореме CAP может иметь распределенная система?
Выберите один ответ:
2
1
3
4
Какое утверждение для MongoDB неверное?
Выберите один ответ:
Метод find() используется для выбора документов из коллекции
Метод sort() используется для сортировки выбранных документов
Для вычисления суммы в агрегации используется $sum
Метод insert() не используется для добавления документов в коллекцию
В MongoDB проекция означает
Выберите один ответ:
выбор только необходимых данных
выбор всех данных документа
отображение данных документов
сравнение данных документов
Выберите верное утверждение.
Выберите один ответ:
Файл данных используется для хранения команд DML, а дельта-файл используется для удаленных строк
Дельта-файл используется для хранения команд DML, а файл данных используется для удаленных строк
Файл данных и дельта-файл используются для хранения команд DML
Файл данных и дельта-файл используются для удаленных строк
Какой элемент высокоуровневой архитектуры Hadoop помогает управлять состоянием узла HDFS и позволяет взаимодействовать с блоками?
Выберите один ответ:
Имя узла
Узел данных
Мастер-узел
Ведомый узел
Как называется результат выборки, получаемой в MongoDB с помощью метода find?
Выберите один ответ:
Курсор
Отбор
Выборка
Набор
Какой язык программирования логичен, минималистичен и обладает красивым стройным синтаксисом?
Выберите один ответ:
Scala
R
Go
Python
Java
Какое ключевое действие по работе с большими данными требует хранения?
Выберите один ответ:
Интеграция
Управление
Анализ
Аудит
Какая инструкция T-SQL используется для создания таблицы In-Memory?
Выберите один ответ:
CREATE TABLE, модифицированная для In-Memory
CREATE TABLE стандартная
CREATE IN-MEMORY TABLE
OPEN IN-MEMORY TABLE
Инструкция CREATE EXTERNAL TABLE используется
Выберите один ответ:
для создания внешней таблицы Hive
для загрузки данных в SQL Server
для создания внешней таблицы SQL Server
для загрузки данных в Hive
Apache Spark – это
Выберите один ответ:
фреймворк с открытым исходным кодом для распределённой пакетной и потоковой обработки неструктурированных больших данных
нереляционная СУБД
хранилище данных Hadoop
файловая система
---
ПРОМЕЖУТОЧНЫЙ ТЕСТ 1
Разнородный источник данных, содержащий комбинацию простых текстовых файлов, изображений, видео является примером
Выберите один ответ:
структурированных данных
полуструктурированных данных
неструктурированных данных
расструктурированных данных
Выделите преимущества, которые дает использование больших данных.
Выберите один или несколько ответов:
Большие данные позволяют получить более полные ответы, потому что предоставляют больше информации
Более полные ответы означают большую уверенность в данных, а это означает совершенно другой подход к решению проблем
Большие данные можно использовать только в случаях предопределенных функций
Любое изменение требований будет означать обновление всех этих структурированных данных для удовлетворения новых потребностей
Основными особенносями нереляционных СУБД являются
Выберите один или несколько ответов:
слабая поддержка ACID
высокая отказоустойчивость
простой интерфейс
сильная модель параллелизма
Какое свойство определяет, что наборы больших данных содержат разные типы данных в одной и той же неструктурированной базе данных?
Выберите один ответ:
Объем
Скорость
Разнообразие
Время
На каком этапе обработки больших данных корпорация внедряет основные информационные технологии для сбора больших данных?
Выберите один ответ:
Интегрирование
Управление
Анализ данных
Агрегация
Большие данные характеризуются следующими признаками.
Выберите один или несколько ответов:
Большой объем информации
Высокая скорость изменения информации
Разнообразие и разнородность данных
Разный тип данных в структуре описания
К признакам определения больших данных относятся
Выберите один или несколько ответов:
объем, превышающий десятки терабайт
скорость обработки, приближающаяся к показателям систем реального времени
неструктурированные типы данных
использование алгоритмов Data mining
Технология NoSQL расшифровывается как
Выберите один ответ:
не SQL
не только SQL
новый SQL
SQL – это прошлое
Какие данные создают множество проблем с точки зрения их обработки для извлечения из них ценности?
Выберите один ответ:
Структурированные
Полуструктурированные
Неструктурированные
Расструктурированные
Данные, у которых нет строго зафиксированного формата (например: текстовые документы, PDF, изображения и видеозапись) являются
Выберите один ответ:
квазиструктурированными
неструктурированными
полуструктурированными
структурированными
Какой язык сериализации представляет собой облегченный формат файлов с открытым стандартом для обмена данными?
Выберите один ответ:
XML
JSON
YAML
JAVA
Какое ключевое действие включает то, что большие данные объединяют данные из множества разрозненных источников и приложений?
Выберите один ответ:
Интеграция
Управление
Анализ
Аудит
Какими данными традиционное программное обеспечение для обработки данных просто не может управлять?
Выберите один ответ:
Большие данные
Огромные данные
Массивы данных
Мегаданные
Как называется тип данных, которые не связаны какой-либо жесткой схемой хранения и обработки данных?
Выберите один ответ:
Структурированный
Полуструктурированный
Неструктурированный
Расструктурированный
ПРОМЕЖУТОЧНЫЙ ТЕСТ 2
Дайте определение MapReduce.
Выберите один ответ:
Модель распределенных вычислений, предназначенная для параллельных вычислений над очень большими (до нескольких петабайт) объемами данных
Набор компонентов и интерфейсов для распределенных файловых систем и общего ввода-вывода
Распределенная файловая система, работающая на больших кластерах типовых
машин
Распределенный сервис для коллекционирования, сбора, и перемещения больших массивов данных
Какая из СУБД относится к технологии NewSQL?
Выберите один ответ:
MongoDB
VoltDB
DB2
OrientDB
Какой фреймворк выполняет распределенную обработку больших наборов данных между кластерами компьютеров?
Выберите один ответ:
Hadoop
Cassandra
Pentaho
Cloudera
На каком этапе работы MapReduce входные данные делятся на блоки данных предопределенного размера?
Выберите один ответ:
input read
map
partition
reduce
Инструмент для анализа больших данных, который предлагает набор продуктов для создания новых процессов интеллектуального анализа данных и настройки прогнозного анализа, – это
Выберите один ответ:
Apache Flink
CouchDB
Open Refine
RapidMiner
Выделите основные функции, которые характеризуют автономную платформу управления большими данными Qubole Data.
Выберите один или несколько ответов:
Он использует технологии и инструменты больших данных, которые используют параллельные вычисления, выполняемые на кластере машин
Наличие технологии и инструментов для работы с большими данными, предлагающие надежную экосистему, которая хорошо подходит для удовлетворения аналитических потребностей разработчиков
Это программное обеспечение для больших данных с открытым исходным кодом, имеющее движки, оптимизированные для облака
Предоставляет действенные оповещения, информацию и рекомендации для оптимизации надежности, производительности и затрат
Программный продукт, который упрощает создание и поддержку технически сложных либо нагруженных проектов, – это
Выберите один ответ:
фреймворк
утилита
драйвер
интерпретатор
Инструмент для работы с большими данными для извлечения, подготовки и объединения данных – это
Выберите один ответ:
Storm
CouchDB
Pentaho
Atlas.ti
Какая из следующих СУБД подходит для организации высокодоступного и распределённого хранилища?
Выберите один или несколько ответов:
Cassandra
Hbase
MongoDB
CouchDB
Укажите основные преимущества фреймворков.
Выберите один или несколько ответов:
Простой процесс диагностики и отладки
Повышенная эффективность кода
Ускоренная разработка
Автоматический процесс разработки
Инструмент для работы с большими данными, который лучше всего подходит для приложений, которые не могут позволить себе потерять данные, даже если весь центр обработки данных не работает, – это
Выберите один ответ:
Storm
Cassandra
Qubole Data
Atlas.ti
Как называются таблицы, данные в которые загружаются внешними системами, без участия Hive ?
Выберите один ответ:
Внутренние
Внешние
Корпоративные
Системные таблицы
Программный код, выполняющийся в общем случае на выделенной машине экземпляра HDFS и отвечающий за файловые операции, такие как открытие и закрытие файлов, создание и удаление каталогов, – это
Выберите один ответ:
NameNode
DataNode
FileNode
SystemNode
На каком этапе работы MapReduce результаты, полученные на этапе reduce, записываются в выходной поток?
Выберите один ответ:
output write
close
partition
write
Самая быстрая, простая и безопасная современная платформа для работы с большими данными – это
Выберите один ответ:
Apache Flink
CouchDB
Pentaho
Cloudera
ПРОМЕЖУТОЧНЫЙ ТЕСТ 3
Выберите неверные утверждения.
Выберите один или несколько ответов:
Язык R имеет статическую типизацию
Язык R имеет динамическую типизацию
Язык R имеет статическую типизацию с элементами динамической
Язык R не имеет типизации
Какими плюсами обладает язык программирования Scala?
Выберите один или несколько ответов:
Сочетает в себе объектно-ориентированный и функциональный языки программирования, что делает его одним из наиболее подходящих языков для работы с большими данными
Есть множество библиотек, подходящих для задач data science
Универсальный язык, позволяющий создавать любые проекты – от простых приложений до программ машинного обучения
Имеет открытый исходный код и позволяет работать со многими операционными системами благодаря тому, что этот инструмент является кроссплатформенным
Какой язык программирования выбрать, если планируется создавать решения для работы с большими данными, используя только традиционно доступные инструменты?
Выберите один ответ:
Scala
R
Go
Python
Java
Какой язык программирования используется для анализа данных и является точным в количественном выражении?
Выберите один ответ:
Scala
R
Go
Python
Java
Какой язык программирования разрабатывался как язык для научного программирования со скоростью, достаточной для удовлетворения потребностей в моделировании на интерактивном языке с последующей неизбежной обработкой кода на языке компиляции?
Выберите один ответ:
Scala
Julia
Python
Java
Какой язык программирования может легко интегрироваться с существующими платформами больших данных, такими как Apache Hadoop и Apache Spark?
Выберите один ответ:
Scala
R
Go
Python
Java
Какой язык программирования можно использовать для создания мобильных приложений, когда есть необходимость связать большие данные и искусственный интеллект?
Выберите один ответ:
Scala
Julia
SAS
Swift
Укажите парадигмы программирования при работе с большими данными.
Выберите один или несколько ответов:
Императивная
Декларативная
Параллельные вычисления
Объектно-ориентированная
Какой язык программирования поддерживает множество инфраструктур больших данных и инструментов обработки?
Выберите один ответ:
Scala
R
Go
Python
Java
ПРОМЕЖУТОЧНЫЙ ТЕСТ 4
Выделите проблемы больших данных.
Выберите один или несколько ответов:
Затраты на обработку
Конфиденциальность
Потеря информации
Сфера применения
Что включают задания для обработки данных с помощью длительных пакетных заданий?
Выберите один или несколько ответов:
Чтение исходных файлов
Обработку исходных файлов
Запись вывода в новые файлы
Чтение полученных файлов
Сбор неструктурированных данных включает
Выберите один или несколько ответов:
данные журналов событий внутренних систем
существующие архивы данных
данные GPS
аналоговые источники информации
Виды классификации информации, включаемой в большие данные, – это
Выберите один или несколько ответов:
операционные данные
коммерческие данные
официальные данные
свободные данные
Выберите главные характеристики Big Data.
Выберите один ответ:
Огромный объем данных, скорость обработки больших данных, скорость появления новых данных
Огромный объем данных, скорость анализа данных, скорость обработки данных
Огромный объем данных, достоверность данных, ценность накопленной информации
Огромный объем данных, сложность типов данных и их структуры, скорость появления новых данных
Каковы проблемы инфраструктуры больших данных?
Выберите один или несколько ответов:
Безопасность, которая усложняется с большими наборами данных
Прогнозирование будущих потребностей и тенденций
Предоставление рассогласованных методов внедрения технологий, решающих сопоставимые проблемы
Масштабирование, которое может влиять на производительность
Механизм анализа в рамках больших данных включает следующую последовательность.
Выберите один ответ:
Сбор информации – анализ полученных данных – построение выводов
Сбор информации – построение выводов – анализ полученных данных
Анализ полученных данных – сбор информации – построение выводов
Анализ полученных данных – построение выводов – сбор информации
Для какой группы подходов к Big Data обработка не предполагает получения новых знаний, ее результаты соотносятся с априорными знаниями и позволяют судить о том, как протекают те или иные процессы?
Выберите один ответ:
Быстрые данные
Большая аналитика
Глубокое проникновение
Глубокая аналитика
Что предполагает анализ больших данных?
Выберите один ответ:
Распределение функций сбора, хранения и анализа данных между несколькими программами-исполнителями
Распределение функций сбора и хранения данных между несколькими программами-исполнителями
Распределение функций сбора и анализа данных между несколькими программами-исполнителями
Распределение функций сбора, хранения и анализа данных внутри программы-исполнителя
Какой уровень архитектуры анализа больших данных получает результаты от уровня анализа больших данных и представляет их соответствующему уровню вывода, также известному как уровень бизнес-аналитики?
Выберите один ответ:
Уровень источников больших данных
Уровень управления и хранения
Уровень анализа
Уровень потребления
Какой принцип архитектуры больших данных считает, что архитектура приложения для работы с большими данными должна иметь интуитивно понятный дизайн, который можно настраивать, он должен быть доступен через текущие используемые информационные панели и доступен в облаке?
Выберите один ответ:
Предварительный этап
ETL для больших данных
API служб данных
Сервис пользовательского интерфейса
ПРОМЕЖУТОЧНЫЙ ТЕСТ 5
Из каких компонентов состоит HBase?
Выберите один или несколько ответов:
Клиентской библиотеки
Главного сервера
Нескольких распределенных серверов
Библиотек интегрированных приложений
Какой элемент высокоуровневой архитектуры Hadoop представляет все файлы и каталоги, которые используются в пространстве имен?
Выберите один ответ:
Имя узла
Узел данных
Мастер-узел
Ведомый узел
Какой компонент Apache Hadoop представляет собой вычислительную модель и программную среду для написания приложений?
Выберите один ответ:
MapReduce
HDFS
YARN
Zookeeper
Какой компонент Apache Hadoop создает несколько реплик блоков данных и распределяет их по вычислительным узлам в кластере?
Выберите один ответ:
MapReduce
HDFS
YARN
Zookeeper
Какой компонент экосистемы Hadoop является нереляционной БД?
Выберите один ответ:
MapReduce
Hbase
Hive
Data Storage
Платформа, используемая для анализа больших наборов данных и основанная на языке высокого уровня для выражения программ анализа данных, включает инфраструктуру оценки этих программ
Выберите один ответ:
HDFS
Mahout
HBase
Pig
Какие компоненты входят в состав Apache Hadoop?
Выберите один или несколько ответов:
MapReduce
HDFS
YARN
Zookeeper
Укажите преимущества Hadoop.
Выберите один или несколько ответов:
Хранение и быстрая обработка любых данных
Высокая мощность вычислений
Устойчивость к отказам
Не поддерживает небольшие файлы, потому что она предназначена для работы с большими объемами
Какие задачи во время работы программы MapReduce выполняются на этапе Reduce?
Выберите один или несколько ответов:
Разделение данных
Отображение данных
Перетасовывание данных
Сокращение данных
Какие модули входят в базовую структуру Hadoop?
Выберите один или несколько ответов:
HDFS
MapReduce
YARN
Hadoop Common
Какой элемент высокоуровневой архитектуры Hadoop позволяет хранить данные для проведения сложных вычислений?
Выберите один ответ:
Имя узла
Узел данных
Мастер-узел
Ведомый узел
На каком уровне архитектуры экосистемы Hadoop проходят основные процессы обработки и анализа данных в рамках поставленной задачи?
Выберите один ответ:
Уровень хранения данных в распределенных реестрах
Уровень запроса данных
Уровень обработки данных
Уровень управления данными
ПРОМЕЖУТОЧНЫЙ ТЕСТ 6
In-Memory OLTP вводит следующие концепции.
Выберите один или несколько ответов:
Оптимизированные в памяти таблицы и индексы
Скомпилированные в собственном коде хранимые процедуры и пользовательские функции
Оптимизированный для памяти тип таблицы для табличной переменной
Скомпилированные в собственном коде модули T-SQL
Каковы преимущества технологии In-Memory OLTP?
Выберите один или несколько ответов:
Данные располагаются в памяти
Используются новые, специально разработанные структуры данных, которые лишены блокировок
Используются скомпилированные в машинные коды хранимые процедуры, которые хранят бизнес-логику
Меняется инфраструктура самой базы данных
Выполняющаяся в памяти OLTP позволяет повысить производительность обработки транзакций
Выберите один или несколько ответов:
путем оптимизации доступа к данным и выполнения транзакций
за счет устранения конфликтов блокировок
за счет устранения кратковременных блокировок между параллельно выполняемыми транзакциями
путем агрегации доступа к данным и синхронизации транзакций
Укажите типы рабочих нагрузок, которые Microsoft рекомендует для использования In-Memory OLTP.
Выберите один или несколько ответов:
Приложения с высокой скоростью вставки данных, поступающие из нескольких одновременных подключений
Приложения, которые требуют масштабируемой производительности чтения для периодических пакетных вставок и обновлений
Задачи управления состоянием сеанса
Веб-приложения по обработке заявок от пользователей
Что включает транзакция базы данных?
Выберите один или несколько ответов:
Изменение
Вставка
Удаление
Запрос данных
Вывод данных
Выделите причины быстрой работы оптимизированных для памяти таблиц.
Выберите один или несколько ответов:
Двойное представление
Без блокировок
Меньше затрат на ведения журнала
Отсутствие версий строк
Какой параметр для встроенных методов оптимизации памяти рассматривается как параметр по умолчанию при создании таблиц, оптимизированных для памяти?
Выберите один ответ:
MEMORY_OPTIMIZED=ON
DURABILITY = SCHEMA_ONLY
DURABILITY = SCHEMA_AND_DATA
MEMORY_OPTIMIZED_DATA=ON
Выберите характеристики In-Memory OLTP.
Выберите один или несколько ответов:
Интегрирована с ядром базы данных SQL Server
Может использоваться для обработки таблиц данных транзакций, хранящихся в системной памяти
Может извлекать таблицы данных транзакций из дискового хранилища
Построена на двух основных компонентах
Какие типы объектов используются для возвращающих табличные значения параметров, а также для промежуточных результирующих наборов в хранимых процедурах?
Выберите один ответ:
Таблицы, оптимизированные для памяти
Неустойчивые таблицы
Табличные типы, оптимизированные для памяти
Скомпилированные в собственном коде модули T-SQL
Каковы ключевые особенности In-Memory OLTP?
Выберите один или несколько ответов:
Долговечность данных
Оптимизированный журнал транзакций
Резервное восстановление
Наличие буферного пула
ПРОМЕЖУТОЧНЫЙ ТЕСТ 7
Как называются таблицы, данные которых в случае сбоя или переключения сервера будут восстановлены из журналов транзакций?
Выберите один ответ:
Устойчивыми
Неустойчивыми
Стабильными
Динамическими
Какие модели восстановления поддерживаются для базы данных?
Выберите один или несколько ответов:
Простая
С неполным протоколированием
Полная
Без протокола
Какая структура данных In-Memory OLTP хранит свои данные в памяти, используя несколько версий данных каждой строки?
Выберите один ответ:
Таблица, оптимизированная для памяти
Хранимая процедура, скомпилированная в собственном коде
Таблица, скомпилированная для оптимизации памяти
Хранимая процедура, оптимизированная для синхронизации памяти
Во сколько раз рекомендуемое значение при указании индекса BUCKET COUNT должно превышать ожидаемое количество уникальных значений?
Ответ:
Тип индекса, который представляет собой список указателей, – это
Выберите один ответ:
хэш-индекс
диапазонный индекс
кластеризованный индекс
некластеризованный индекс
Скомпилированные в собственном коде хранимые процедуры можно использовать для поддерживаемых конструкций T-SQL
Выберите один или несколько ответов:
подзапросы
скалярные пользовательские функции
встроенные математические функции
системы интеграции
Для какой структуры данных для сохранения механизм OLTP в памяти создает набор файлов контрольных точек в файловой группе файлового потока?
Выберите один ответ:
Таблица, оптимизированная для памяти
Хранимая процедура, скомпилированная в собственном коде
Таблица, скомпилированная для оптимизации памяти
Хранимая процедура, оптимизированная для синхронизации памяти
OLTP в памяти автоматически устанавливается
Выберите один или несколько ответов:
с 64-разрядной версией SQL Server 2014
с 64-разрядной версией SQL Server 2016 Enterprise
с 64-разрядной версией SQL Server 2016 Developer
с 32-разрядной версией SQL Server
Во сколько раз рекомендуемое значение при указании индекса BUCKET COUNT должно превышать ожидаемое количество уникальных значений?
Выберите один ответ:
2
0,5
3
1,5
Выберите In-Memory технологии.
Выберите один или несколько ответов:
Redis
Tarantool
MapReduce
Hadoop
ПРОМЕЖУТОЧНЫЙ ТЕСТ 8
Тип таблицы оптимизации памяти, который сохраняет свою структуру таблиц в случае сбоя сервера или его остановки, – это
Выберите один ответ:
SCHEMA_AND_DATA
SCHEMA_ONLY
SCHEMA_AND_ONLY
SCHEMA_DATA
Выберите верные утверждения.
Выберите один или несколько ответов:
Оптимизированная для памяти табличная переменная хранится только в памяти и не имеет компонента на диске
Оптимизированная для памяти табличная переменная может передаваться в хранимую процедуру как возвращающий табличное значение параметр
Оптимизированная для памяти табличная переменная должна иметь по крайней мере один индекс
Оптимизированная для памяти табличная переменная требует использования базы данных tempdb или создает конфликт
Тип таблицы оптимизации памяти, который представляет собой таблицу, которая находится в памяти, где данные доступны после сбоя сервера, завершения работы или перезапуска SQL Server, – это
Выберите один ответ:
SCHEMA_AND_DATA
SCHEMA_ONLY
SCHEMA_AND_ONLY
SCHEMA_DATA
Укажите сценарии приложений, в которых успешно используется выполняющаяся в памяти OLTP.
Выберите один или несколько ответов:
Обработка транзакций с высокой пропускной способностью и низкой задержкой
Прием данных из разных источников, включая интернет вещей
Кэширование и состояние сеанса
Обработка транзакций с низкой пропускной способностью и высокой задержкой
Выберите верные утверждения.
Выберите один или несколько ответов:
Табличные переменные, оптимизированные для памяти, не могут быть объявлены встроенными
Табличные переменные, оптимизированные для памяти, нужно создать заранее
Табличные переменные, оптимизированные для памяти, создаются по завершении процедур оптимизации
Таблицы, оптимизированные для памяти, должны иметь по крайней мере один индекс
Выберите характеристики таблиц, оптимизированных для памяти.
Выберите один или несколько ответов:
Находятся в базе данных tempdb
Находятся в пространстве памяти пользовательской базы данных
Схема исчезает при закрытии последнего сеанса, использующего ее
Схема сохраняется как часть пользовательской базы данных
Какую команду используют, чтобы оптимизировать переменную в хранимой процедуре?
Выберите один ответ:
memory_optimized
SCHEMA_ONLY
dbo.test_memory
memory-optimized table
ПРОМЕЖУТОЧНЫЙ ТЕСТ 9
Нереляционные СУБД подразделяются на какие типы?
Выберите один или несколько ответов:
Графовые
Колончатые
Документоориентированные
Использующие модель «ключ – значение»
Отметьте СУБД, обладающие встроенной поддержкой MapReduce.
Выберите один или несколько ответов:
Cassandra
Redis
CouchDB
MongoDB
По используемой модели данных нереляционные СУБД подразделяются на следующие типы.
Выберите один или несколько ответов:
Использующие модель «ключ – значение»
Документоориентированные
Графовые
Колончатые
Что из перечисленного не является сильной стороной для баз данных NoSQL?
Выберите один ответ:
Масштабируемость
Данные легко хранятся на нескольких серверах
Более быстрый доступ к данным, чем РСУБД
Реляционные данные
Выберите верные высказывания.
Выберите один или несколько ответов:
Коллекция – это не что иное, как набор документов MongoDB
База данных в MongoDB – это не что иное, как контейнер для коллекций
Коллекции – это способ хранения связанных данных
При наличии схемы любой документ в MongoDB может быть сохранен в базе данных
Какая из СУБД является графовой?
Выберите один ответ:
RiakKV
MongoDB
OrientDB
Cassandra
Укажите общие термины, используемые в MongoDB.
Выберите один или несколько ответов:
Коллекция
База данных
Документ
Запрос
Чтобы отобразить все базы данных в системе, к которым есть доступ, используют команду
Выберите один ответ:
show dbs
db.getName()
db.stats()
show collections
Какие базы данных используются для аналитической обработки большого объема данных из-за легкого горизонтального масштабирования?
Выберите один ответ:
Документоориентированная база данных NoSQL
Объектно-ориентированная база данных NoSQL
Сервисно ориентированная база данных NoSQL
Сервисно-документальная база данных NoSQL
Каковы ключевые особенности MongoDB?
Выберите один или несколько ответов:
Богатый язык запросов, поддерживающий текстовый поиск, агрегирование и CRUD-операции
Требует меньше операций ввода/вывода из-за встраиваемых моделей данных
Поддержка механизма шардинга для горизонтального масштабирования
Поддержка одного хранилища, что позволяет оптимизировать рабочую нагрузку
Укажите причины, по которым следует начать использовать MongoDB.
Выберите один или несколько ответов:
Ориентированность на документы
Индексирование
Репликация
Балансировка нагрузки
Агрегирование
Какова цель NoSQL?
Выберите один ответ:
Базы данных NoSQL позволяют хранить неструктурированные данные
NoSQL предоставляет альтернативу базам данных SQL для хранения текстовых данных
NoSQL – это новый формат данных для хранения больших наборов данных
NoSQL не подходят для хранения структурированных данных
Как называется совокупность приемов и операций, употребляемых только по отношению к действиям, связанным с коллекцией и базой данных?
Выберите один ответ:
Метод
Оператор
Команда
Параметр
Cassandra минимизирует какую операцию?
Выберите один ответ:
Дисковый ввод/вывод
Журналы
Использование памяти
События
Укажите варианты создания новой коллекции в MongoDB.
Выберите один или несколько ответов:
Неявно
Явно
Реально
Нереально
Что использует MongoDB?
Выберите один или несколько ответов:
Документы
Коллекции
Таблицы
Строки
Укажите параметры, характерные для MongoDB.
Выберите один или несколько ответов:
Гибкость
Скорость
Мощность
Масштабируемость
ПРОМЕЖУТОЧНЫЙ ТЕСТ 10
Какие методы в MongoDB используются для добавления документов в коллекцию?
Выберите один или несколько ответов:
insert()
save()
append()
add()
Какой метод в MongoDB используется для отображения результатов выполнения запроса в отформатированном виде?
Выберите один ответ:
pretty()
findpretty()
orderby()
sort()
Какое утверждение верное?
Выберите один ответ:
Документы в коллекции MongoDB должны иметь одинаковую структуру
Коллекция является обязательным объектом базы данных MongoDB
Для удаления данных в MongoDB используется метод delete()
Оболочкой и языком запросов для MongoDB является PHP
Какая команда в MongoDB выбирает названия книг из коллекции «Книги»?
Выберите один ответ:
db.Книги.find()
db.Книги.find({},{Название:1,_id:0})
db.Книги.find({},{Название:1})
db.Книги.find(1)
Какая команда в MongoDB используется для удаления базы данных?
Выберите один ответ:
databaseDrop
deleteDatabase
closeDatabase
dropDatabase
Какой оператор в MongoDB помещает значение в результирующий массив?
Выберите один ответ:
$push
$means
$first
$last
Какой метод в MongoDB используется для проверки наличия следующего в курсоре документа?
Выберите один ответ:
hasNext()
next()
haveNext
skip()
Какое утверждение неверное?
Выберите один ответ:
Документы в коллекции MongoDB должны иметь одинаковую структуру
Имя поля документа в MongoDB не может состоять из двух и более отдельных слов
MongoDB относится к технологии NoSQL
Оболочкой и языком запросов для MongoDB является JavaScript
Какой метод в MongoDB используется для создания индексов?
Выберите один ответ:
ensureIndex()
Index()
createIndex()
openIndex()
Для создания переменных в MongoDB используются операторы
Выберите один или несколько ответов:
let
var
assign
set
Для создания курсора в MongoDB используются команды
Выберите один или несколько ответов:
let cursor = db.Книги.find()
var cursor = db.Книги.find()
set cursor = db.Книги.find()
create cursor = db.Книги.find()
Что нужно указать вместо «?» в команде db.mycol.update({title:'Учебник'}, {$set:{title:'Контент'}},{?}) для обновления всех выбранных документов?
Выберите один ответ:
multi:true
one:false
true
multi:1
Результатом выполнения команды db.Книги.find(1) является
Выберите один ответ:
проекция
выборка всех данных
агрегация
сообщение об ошибке
В MongoDB код создания базы данных testdb
Выберите один ответ:
>use testdb
>db.createCollection("Книги")
>use testdb
>open testdb
>db.createCollection("Книги")
>create testdb
Результатом выполнения команды db.createCollection("Группы") в MongoDB является
Выберите один ответ:
создание коллекции «Группы»
создание базы данных «Группы»
создание документа «Группы»
все варианты верны