Введение в анализ больших данных. Синергия. Ответы на итоговый + компетентностный тесты

Раздел
Программирование
Тип
Просмотров
510
Покупок
16
Антиплагиат
Не указан
Размещена
21 Июл в 15:08
ВУЗ
Синергия
Курс
Не указан
Стоимость
350 ₽
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
pdf
Ответы
361.8 Кбайт 350 ₽
Описание

Ответы представлены на итоговый и компетентностный тесты.

Перед покупкой сверьте список вопросов и убедитесь, что вам нужны ответы именно на эти вопросы!

С вопросами и вы можете ознакомиться ДО покупки.

Для быстрого поиска вопроса используйте Ctrl+F.

При возникновении вопросов или необходимости пройти тест по другому предмету пишите в личные сообщения https://studwork.ru/mail/259571

Другие мои работы можно найти по ссылке https://studwork.ru/shop?user=259571

Ответы вы сможете скачать сразу после оплаты.

Оглавление

В реляционной модели представленные данные для пользователя передаются в виде …

·      таблиц

·      списков

·      графа типа дерева

·      произвольного графа

·      файлов

 

В числовом ряду 3, 5, 8, 12, 2, 9, 6, 10, 11, 14 медиана (с точностью до 0,1) равна …

 

В языке программирования R используются такие типы данных, как … (укажите 5 вариантов ответа)

·      numeric

·      integer

·      quantitative

·      attributive

·      logical

·      complex

·      character

 

В языке программирования R тип данных «строка» – это …

 

Вектор частных производных функции потерь по весам нейронной сети, который указывает на направление наибольшего роста этой функции, – это …

 

Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это …

·      перцептрон

·      градиент

·      нейрон

·      протон

 

Группа элементов, обладающих каким-то общим свойством и находящихся на небольшом расстоянии другу от друга, – это …

 

Данные являются структурированными в … (укажите 2 варианта ответа)

·      отчете о продажах, составленном в MS Excel

·      таблице с ежедневными показаниями температуры помещения за год в файле формата CSV

·      файлах Google Sheets

·      фильмах, представленных в формате mpeg на одном жестком диске

 

Деревья классификации относятся к стратегии …

·      обучения с учителем

·      обучения без учителя

·      обучения с подкреплением

·      ленивого обучения

 

Если все значения признака увеличить в 16 раз, дисперсия увеличится в … раз

 

Интеграция – это …

·      сбор данных из нескольких источников в единое место хранения

·      объединение данных из различных источников для получения их согласованного представления

·      привлечение к решению инновационных задач широкого круга лиц по типу субподрядной работы на добровольных началах

·      область исследования, занимающаяся созданием компьютерных алгоритмов для преобразования данных в обоснованные действия

 

Консолидация – это …

·      сбор данных из нескольких источников в единое место хранения

·      объединение данных из различных источников для получения их согласованного

·      представления привлечение к решению инновационных задач широкого круга лиц по типу субподрядной работы на добровольных началах

·      область исследования, занимающаяся созданием компьютерных алгоритмов для преобразования данных в обоснованные действия

 

Краудсорсинг – это …

·      сбор данных из нескольких источников в единое место хранения

·      объединение данных из различных источников для получения их согласованного представления

·      привлечение к решению инновационных задач широкого круга лиц по типу субподрядной работы на добровольных началах

·      область исследования, занимающаяся созданием компьютерных алгоритмов для преобразования данных в обоснованные действия

 

Машинное обучение – это …

·      сбор данных из нескольких источников в единое место хранения

·      объединение данных из различных источников для получения их согласованного представления

·      привлечение к решению инновационных задач широкого круга лиц по типу субподрядной работы на добровольных началах

·      область исследования, занимающаяся созданием компьютерных алгоритмов для преобразования данных в обоснованные действия

 

Метод Data Mining, который относит объекты к одному из заранее известных классов, – это …

 

Метод, используемый для предотвращения дублирования данных в реляционных базах данных, – …

 

Минимальная единица измерения информации – это …

 

Нажатие клавиши «…» предложит возможные варианты продолжения текста кода, включая выбор параметров и переменных в аргументах набираемых команд

 

Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания "

 

Название на английском языке системы или репозитория данных, хранящихся в необработанном формате, – …

 

Неверно, что MapReduce …

·      это интерфейс для массово-параллельной обработки данных, где вычисления производятся на узлах

·      это две операции: распределения и сборки данных

·      был придуман разработчиками Hadoop

·      был анонсирован разработчиками Google

 

Неверно, что Variety в контексте характеристик Big Data означает … (укажите 3 варианта ответа)

·      высокую скорость генерирования данных

·      разные типы данных в колонках таблиц реляционных систем управления базами данных (СУБД)

·      разнообразие отраслей, являющихся источниками данных

·      разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные

 

Определите правильную последовательность этапов распределенных вычислений MapReduce:

1.   Input

2.   Splitting

3.   Mapping

4.   Shuffling

5.   Reducing

 

Первые большие наборы данных начали использовать …

·      в 1990-х гг.

·      в 1960–70-х гг.

·      в 1980-х гг.

·      после 2012 г.

 

Причина создания баз данных NoSQL – …

·      высокая стоимость горизонтальной масштабируемости RDBMS при сохранении требования высокой доступности

·      недостаточная гибкость языка запросов SQL

·      невозможность хранения больших объемов информации в базе данных

·      дороговизна лицензий RDBMS

 

Простейший вид нейронной сети, который представляет собой алгоритм для выполнения двоичной классификации, – это …

 

Процесс преобразования данных в код, который можно распознать только с помощью определенного ключа или пароля, – это …

 

Разветвляющийся алгоритм – это …

·      присутствие в алгоритме хотя бы одного условия

·      набор команд, которые выполняются последовательно друг за другом

·      многократное выполнение одних и тех же действий

·      алгоритм, использующий подпрограммы

 

Расположите в правильной последовательности этапы дивизимного метода кластерного анализа:

1.   все объекты помещаются в один кластер С1

2.   выбирается объект, у которого среднее значение расстояния до других объектов в этом кластере наибольшее

3.   выбранный объект удаляется из кластера С1 и формирует первый элемент второго кластера С2

4.   объект в кластере С1, для которого разность между средним расстоянием до объектов, находящихся в С2, и средним расстоянием до объектов, остающихся в С1, наибольшая, переносится в С2

5.   каждый последующий уровень применяет процедуру разделения к одному из кластеров, полученных на предыдущем уровне

 

Расположите в правильной последовательности этапы кластерного анализа методом k-средних:

1.   выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов

2.   все объекты разбиваются на k групп, наиболее близких к одному из центров

3.   вычисляются новые центры кластеров

4.   проводится новое разбиение всех объектов на основании близости к новым центрам

 

Сокращенное английское название семейства нереляционных баз данных – …

 

Укажите правильную последовательность шагов алгоритма машинного обучения (ML):

1.   сбор данных

2.   исследование и подготовка данных

3.   обучение модели

4.   оценка модели

5.   улучшение модели

 

Укажите правильную последовательность этапов анализа данных в языке программирования R:

1.   сбор данных

2.   импорт данных из источника в программную среду r

3.   разведочный анализ

4.   очистка и трансформация данных

5.   моделирование

6.   презентация результатов Вопрос: 41 - й

 

Установите правильный порядок действий при проектировании баз данных (БД):

1.   анализ предметной области с учетом требования конечных пользователей

2.   обобщенное описание БД с использованием естественного языка, математических формул, графиков и других средств

3.   формализация представления данных в БД

4.   решение проблемы передачи данных

 

Установите соответствие баз данных и их характеристик:

 

Установите соответствие видов искусственных нейронных сетей и их характеристик:

 

Установите соответствие между аргументами функции leaflet() и их содержанием:

 

Установите соответствие между метриками расстояния между объектами и формулами расчета:

 

Установите соответствие между понятием и его содержанием:

 

Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления:

 

Установите соответствие целей инфраструктуры Hadoop и их характеристик:

 

Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – …

 

Целое четырехзначное число, отражающее количество зеттабайт в йоттабайте, – …

 

Циклический алгоритм используется при вычислении … (укажите 2 варианта ответа)

·      суммы всех чисел от 1 до 100

·      площади трапеции

·      корня квадратного уравнения

·      суммы двух чисел, введенных с клавиатуры

·      среднего арифметического всех двухзначных чисел

 

Чтобы получить помощь в программной среде R, можно … (укажите 3 варианта ответа)

·      поставить курсор на название функции и нажать F1

·      перед названием функции напечатать знак вопроса

·      воспользоваться функцией help()

·      поставить курсор на название функции и нажать ALT + F1

·      поставить курсор перед названием функции и нажать F1

 

Язык программирования R является потомком языка …

·      JavaScript

·      S

·      Python

·      С++

 

… – это группа файлов стандартной структуры, служащих для хранения данных и организованных таким образом, чтобы обеспечить легкий доступ к ним, эффективное управление и обновление

 

… – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий

 

… является шириной коробки в диаграмме «ящик с усами»

·      Диапазон

·      Интерквартильный размах

·      Стандартное отклонение

·      Нижний квартиль

·      Медиана

 

Data Mining – это процесс обнаружения в сырых данных … (укажите 3 варианта ответа)

·      ранее сформулированных гипотез

·      неочевидных закономерностей

·      практических закономерностей  

·      объективных закономерностей

·      большого количества закономерностей

 

SQL – это …

·      реляционная база данных

·      язык неструктурированных запросов

·      язык структурированных запросов

·      средство для создания пайплайнов

 

Velocity в контексте характеристик Big Data означает …

·      высокую скорость генерирования данных

·      разные типы данных в колонках таблиц реляционных систем управления базами данных (СУБД)

·      разнообразие отраслей, являющихся источниками данных

·      разнообразие типов данных, включающих структурированные, полуструктурированные и неструктурированные

 

Web Mining применяет технологию Data Mining для анализа … (укажите 4 варианта ответа)

·      неструктурированной информации

·      структурированной информации

·      неоднородной информации

·      однородной информации

·      распределенной и значительной по объему информации

·      информации, содержащейся на веб-узлах

 

 

В вашей компании необходимо организовать сбор, хранение и обработку больших данных. На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных?

·      Обеспечить управление доступом, которое должно защищать данные.

·      Оценить уровень риска и отменить контрмеры.

·      Обеспечить необходимый уровень доступности, целостности и конфиденциальности данных.

·      Обеспечить удобство использования данных при анализе.

 

Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем. Какую функцию вы будете использовать?

·      read.text()

·      read.table()

·      read_text()

·      read_table():

 

Вам необходимо организовать потоковую обработку событий в режиме реального времени. Какую технологию необходимо использовать?

·      Spark Streaming

·      Apache Kafka

·      Apache Hadoop

·      MapReduce

 

Вам необходимо предсказать значения непрерывной числовой величины для входных данных. Какой метод вам в этом поможет?

·      Переобучение.

·      Регрессия.

·      Кластеризация.

·      Классификация

 

Вам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения вам в этом поможет?

·      Компьютерное зрение.

·      Латентная модель.

·      Обучение ранжированию.

·      Предсказательное моделирование

 

Ваша компания использует различные технологии для сбора и хранения данных. Приведите пример данных, когда эффективнее использовать технологию Hadoop.

·      Поминутное сохранение данных транзакций торговых точек.

·      Построение графика ежегодной выручки.

·      Анализ 10 Гб данных.

·      Сравнение цен с конкурентами.

 

Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти. Какой метод Data Mining вы будете использовать?

·      Прогнозирование.

·      Кластеризация.

·      Классификация

·      Поиск ассоциативных правил.

 

Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании. Какой метод Data Mining вы будете использовать?

·      Прогнозирование.

·      Кластеризация.

·      Классификация.

·      Поиск ассоциативных правил

 

Выполнены следующие строки кода в программной среде RStudio: vec

·      2

·      5

·      10

·      2,5

 

Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации. Что следует предпринять руководству?

·      Снизить уровень классификации этой информации.

·      Улучшить контроль за безопасностью этой информации.

·      Требовать подписания специального разрешения каждый раз, когда человеку требуется доступ к этой информации.

·      Открыть временный доступ к информации по запросу пользователей.

Вам подходит эта работа?
Похожие работы
Базы данных
Курсовая работа Курсовая
18 Ноя в 19:41
10 +1
0 покупок
Базы данных
Курсовая работа Курсовая
18 Ноя в 17:28
11 +1
0 покупок
Базы данных
Курсовая работа Курсовая
18 Ноя в 16:06
13
0 покупок
Базы данных
Курсовая работа Курсовая
18 Ноя в 15:48
10
0 покупок
Другие работы автора
Международное право
Тест Тест
20 Ноя в 10:07
12 +1
0 покупок
Темы журнала
Показать ещё
Прямой эфир