Введение в анализ больших данных Синергия сдан на 93 балла (отлично) (51 вопрос)

Раздел
Программирование
Тип
Просмотров
310
Покупок
12
Антиплагиат
70% Антиплагиат.РУ (модуль - Интернет Free)eTXTАнтиплагиат.ВУЗ
Размещена
19 Мар 2023 в 10:35
ВУЗ
ниверситет Синергия (Московский финансово-промышленный университет «Синергия»
Курс
Не указан
Стоимость
250 ₽
Демо-файлы   
1
pdf
Введение в анализ больших данных_ОЦЕНКА_и_СКРИНЫ 3-х ПОПЫТОК Введение в анализ больших данных_ОЦЕНКА_и_СКРИНЫ 3-х ПОПЫТОК
9.6 Мбайт 9.6 Мбайт
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
pdf
Введение в анализ больших данных_ТЕСТ
456.9 Кбайт 250 ₽
Отзывы о работе
Описание

ПЕРЕД ПОКУПКОЙ ПРОВЕРЬТЕ ВОПРОСЫ ПРЕДСТАВЛЕННЫЕ В ОГЛАВЛЕНИИ НА СООТВЕТСТВИЕ ВАШЕМУ ТЕСТУ !!!

Ответы к тесту "Введение в анализ больших данных" СИНЕРГИЯ 3 семестр (сдан на 93 из 100 баллов). Отлично)))

  • Представлены 51 вопрос. Вопросы по алфавиту.
  • Сдан предмет на 93 балла "Отлично" ЭКЗАМЕН
  • Ответы к тесту выделены в файле.
  • После покупки вы сможете скачать файл со всеми ответами.
  • Все вопросы указаны ниже в оглавлении.
  • Для быстрого поиска вопроса используйте сочетание клавиш Ctrl+F.
Оглавление

1. Алгоритм – это:

Тип ответа: Одиночный выбор

указание на выполнение действий

процесс выполнения вычислений, приводящих к решению задачи

система правил, описывающая последовательность действий, которые необходимо выполнить для решения задачи

2. Бизнес процесс – это:

Тип ответа: Одиночный выбор

Взаимосвязанные виды деятельности, преобразующие входы в выходы

Совокупность взаимосвязанных и взаимодействующих видов деятельности, преобразующая входы в выходы, представляющие ценность для клиента

Совокупность разнородных и существенных видов деятельности, преобразующая входы в выходы, которые могут быть полезны для клиента

Множество видов деятельности, объединённых производством одного продукта, услуги

3. Большинство методов Data mining были разработаны в рамках …

Тип ответа: Одиночный выбор

теории искусственного интеллекта

классического анализа данных

теории баз данных

4. В каких из приведенных ниже случаев речь идёт о структурированных данных:

Тип ответа: Множественный выбор

Данные о продажах фирмы, представленные в виде отчётов в MS Excel

Таблица с ежедневными показаниями температуры помещения за год в файле формата CSV

Текст книги, представленный в формате PDF

Фильмы, представленных в формате mpeg на одном жестком диске

5. Горизонтальная масштабируемость при обработке Big Data – это…

Тип ответа: Одиночный выбор

Расширение механизма обработки данных при росте объёма данных

Увеличение скорости обработки при росте объёма данных

Спад скорости обработки при росте объёма данных

Изменение масштабов представления результатов обработки данных

6. Деревья решений относятся к группе (группам) …

Тип ответа: Множественный выбор

статистических методов

кибернетических методов

логических методов

методов кросс-табуляции

7. Заказчик бизнес-процесса – это должностное лицо:

Тип ответа: Одиночный выбор

Имеет в своём распоряжении средства для заказа выхода бизнес - процесса

Имеет в своём распоряжении материальные и информационные ресурсы бизнес - процесса, управляет его ходом, несёт ответственность за результат и эффективность

Имеет в своём распоряжении ресурсы и полномочия для принятия решений о проведении работ по описанию, регламентации или аудиту бизнес - процесса

Имеет в своём распоряжении необходимый инструментарий для проектирования бизнес - процессом и его управления

8. Закончите следующее предложение: С точки зрения машины, информация становится структурированной, если...

Тип ответа: Одиночный выбор

– Машина проинструктирована, каким образом её обрабатывать

– Информация разделена на части и озаглавлена

– Информация имеет логическую взаимосвязь внутри себя

– Машина знает из каких частей состоит информация

9. Какая функция dplyr служит для вертикального объединения таблиц?

Тип ответа: Одиночный выбор

bind()

bind_rows()

left_join()

union()

bind_cols()

join()

10. Как в R обозначаются пропущенные значения?

Тип ответа: Текстовый ответ

11. Какие данные имеют наибольший объём на сегодняшний день?

Тип ответа: Одиночный выбор

– Структурированные

– Квазиструктурированные

– Полуструктурированные

– Неструктурированные

12. Какие из задач решаются Big Data?

Тип ответа: Одиночный выбор

– Мониторинг оборудования

– Анализ социальных сетей

– Оптимизация автомобильного движения

– Все вышеперечисленное

13. Какие типы данных используются в R:

Тип ответа: Множественный выбор

numeric

integer

quantitative

attributive

logical

complex

character

14. Какие циклы доступны в базовом синтаксисе языка R?

Тип ответа: Множественный выбор

For

Which

Repeat

While

Next

goto

15. Каким образом можно объявить переменную «а» на языке R:

Тип ответа: Множественный выбор

а =

а<-

а >-

a!=

16. Как можно получить помощь в R:

Тип ответа: Множественный выбор

В R-Studio можно поставить курсор на название функции и нажать F1

перед названием функции можно напечатать знак вопроса;

можно воспользоваться функцией help()

17. Как называется в R тип данных «булевы»?

Тип ответа: Текстовый ответ

18. Как называется в R тип данных «числа с плавающей точкой»?

Тип ответа: Текстовый ответ

19. Как называется в R тип данных «целые числа»?

Тип ответа: Текстовый ответ

20. Как называется в R тип данных «строки»?

Тип ответа: Текстовый ответ

21. Какой из ниже перечисленных принципов работы не применятся к Big Data?

Тип ответа: Одиночный выбор

– Отказоустойчивость

– Вертикальная масштабируемость

– Локальность данных

– Горизонтальная масштабируемость

22. К основным характеристикам Big Data относятся:

Тип ответа: Одиночный выбор

Virtualization, Volume, Variability, Vehicle

Variety, Velocity, Volume, Value

Verification, Volume, Velocity, Visualization

Video, Value, Variety, Volume

23. Кто и в каком году впервые ввел термин «Big Data»?

Тип ответа: Одиночный выбор

– Разработчик компании Google в 2009 году

– Инженер компании Amazon в 2006 году

– Клиффорд Линч, редактор журнала Nature, в 2008 году

– Профессор Стэнфордского университета в 2007 году

24. Локальность данных Big Data – это:

Тип ответа: Одиночный выбор

Расширение механизма обработки данных при росте объёма данных

Обработка и хранение происходит на одной машине

Время коммуникации не может быть выше времени обработки

Данные не стоит обрабатывать на сервере их хранения

25. Медианой для выборки 1,_,3,7,10,15,16,18 является:

Тип ответа: Одиночный выбор

7,714286

7

8,5

рассчитать медиану невозможно из-за пропущенных значений

26. Назовите сложности иерархических методов кластеризации:

Тип ответа: Множественный выбор

Ограничение объёма набора данных

Выбор меры близости

Негибкость полученных классификаций

Наличие предположений относительно числа кластеров.

27. На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез?

Тип ответа: Одиночный выбор

Понимание бизнеса (Business understanding)

Понимание данных (Data Understanding)

Моделирование (Modeling)

Оценка (Evaluation)

28. Неверно, что дендрограмма – является результатом работы …

Тип ответа: Одиночный выбор

дивизимного кластерного анализа

быстрого кластерного анализа

агломеративного кластерного анализа

29. Неверно, что к достоинствам алгоритма кластеризации k-средних относится:

Тип ответа: Одиночный выбор

простота использования

быстрота использования

понятность и прозрачность алгоритма

нечувствительность к выбросам

30. Неверно, что Классификация относится к:

Тип ответа: Одиночный выбор

контролируемому обучению

управляемому обучению

обучению без учителя

31. Объём накопленных человечеством цифровых данных на 2022 год измеряется:

Тип ответа: Одиночный выбор

Петабайтами

Зеттабайтами

Экзабайтами

Йоттабайтами

32. Одна из главных целей Data Mining – это получение…

Тип ответа: Одиночный выбор

– связей малых выборок данных, распространение их на большие массивы

– скриншотов всех обработок данных

– аудита сайтов, веб-ресурсов

– гарантированной сетевой безопасности

33. Основные отличительные особенности BigData?

Тип ответа: Множественный выбор

– Традиционные технологии хранения

– Большой объём информации

– Распределенный подход к обработке

– Фиксированный набор истоков данных

34. Отказоустойчивость Big Data – это, когда:

Тип ответа: Одиночный выбор

Активируются до 1000 компьютеров

Сбой в одном звене системы не ведёт к сбоям в других звеньях

Недостоверные данные удаляются из системы

Данные обрабатываются на других серверах

35. Первый этап жизненного цикла данных в соответствии с методологией CRISP-DM:

Тип ответа: Одиночный выбор

Моделирование (Modeling)

Внедрение (Deployment)

Подготовка данных (Data Preparation)

Понимание бизнеса (Business understanding)

36. Процессы маркетинга относят к группе:

Тип ответа: Одиночный выбор

Процессы управления

Поддерживающие процессы

Операционные процессы

37. Процессы подбора персонала относят к группе:

Тип ответа: Одиночный выбор

Процессы управления

Поддерживающие процессы

Операционные процессы

38. Решение задачи прогнозирования ...

Тип ответа: Одиночный выбор

возможно без обучающей выборки данных

требует некоторой обучающей выборки данных

является решением задачи "обучения без учителя"

39. Сколько в 1 зеттабайте тарабайт?

Тип ответа: Одиночный выбор

1,073742∙109

2,147484∙109

1,888947∙107

1024

40. Сколько Петабайт в Зеттабайте?

Тип ответа: Одиночный выбор

– 1024

– 128

– 32

– 4

41. Технология Web mining применяет технологию Data Mining для анализа:

Тип ответа: Множественный выбор

неструктурированной информации

структурированной информации

неоднородной информации

однородной информации

распределённой и значительной по объёму информации

информации, содержащейся на Web-узлах

42. Установите соответствие между алгоритмами объединения двух кластеров и их характеристиками:

Тип ответа: Сопоставление

A. Метод дальнего соседа

D. Степень близости оценивается по степени близости между наиболее отдалёнными объектами кластеров

B. Метод средней связи

E. Степень близости оценивается как средняя величина степеней близости между объектами кластеров

C. Метод медианной связи

F. Расстояние между любым кластером S и новым кластером, который получился в результате объединения кластеров P и Q, определяется как расстояние от центра кластера S до середины отрезка, соединяющего центры кластеров P и Q

43. Установите соответствие между способами обучения нейронной сети и их характеристиками:

Тип ответа: Сопоставление

A. Обучение без учителя

D. Модель использует неразмеченные данные, из которых алгоритм самостоятельно пытается извлечь признаки и зависимости

B. Обучение с учителем

E. Нейронная сеть обучается на размеченном наборе данных и предсказывает ответы, которые используются для оценки точности алгоритма на обучающих данных

C. Обучение с подкреплением

F. Система обучается в процессе взаимодействия с окружающей средой, а не на исторических данных

44. Установите соответствие между наиболее распространенными подходами обработки данных и их характеристиками:

Тип ответа: Сопоставление

A. SQL

D. Язык структурированных запросов, позволяющий работать с базами данных. С его помощью можно создавать и модифицировать данные, а управлением массива данных занимается соответствующая система управления базами данных (СУБД)

B. MapReduce

E. Модель распределения вычислений. Используется для параллельных вычислений над очень большими наборами данных (петабайты и более). В программном интерфейсе не данные передаются на обработку программе, а программа – данным. Таким образом, запрос представляет собой отдельную программу. Принцип работы заключается в последовательной обработке данных двумя методами

C. SAP HANA

F. Высокопроизводительная платформа для хранения и обработки данных. Обеспечивает высокую скорость обработки запросов. Еще одним отличительным признаком является то, что эта платформа упрощает системный ландшафт, уменьшая затраты на поддержку аналитических систем

45. Что из перечисленного помогает следить за эволюцией документа, над созданием которого работает одновременно большое количество авторов?

Тип ответа: Одиночный выбор

– Пространственный поток

– Исторический поток

– Визуальный поток

– Интерактивный поток

46. Что не является целью процесса Business Intelligence?

Тип ответа: Одиночный выбор

– Интерпретация большого количества данных

– Моделирование исходов различных вариантов действий

– Модификация существующего программного обеспечения

– Отслеживание результатов решений

47. Что такое Business Intelligence (Bl):

Тип ответа: Одиночный выбор

Синоним понятия «бизнес-анализ»

Технологии и программное обеспечение для преобразования больших объёмов необработанной информации в данные, необходимые для выработки управленческих решений

Система конкурентной разведки сбор, обработка и анализ информации из различных источников с целью обоснования управленческих решений, позволяющих повысить конкурентоспособность бизнеса

48. Что означает термин «Big Data» в информационных технологиях?

Тип ответа: Одиночный выбор

– Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов

– Представление времени, дня, месяца и года в качестве знания количества миллисекунд, прошедших с начала нашей эры

– Файлы с большим количеством данных

– Комплексный набор методов для создания файлов большого объёма

49. Что такое SQL?

Тип ответа: Одиночный выбор

– Реляционная база данных

– Язык неструктурированных запросов

– Язык структурированных запросов

– Средство для создания пайплайнов

50. Эффективно применять Data Mining с целью защиты от…

Тип ответа: Одиночный выбор

– мошенников

– инфицирующих ботов

– инфицированных клиентов

– инсайдеров

51. Hadoop – это…

Тип ответа: Одиночный выбор

– набор утилит, и программный каркас для выполнения распределённых программ, работающих на кластерах

– распределённая СУБД, позволяющая обрабатывать большие данные

– язык выполнения заданий в парадигме MapReduce

– распределённая файловая система, предназначенная для хранения файлов большого объёма

Список литературы
  1. Лучшая книга для того, чтобы освоить основы big data: «BIG DATA. Вся технология в одной книге» Андреас Вайгенд, «Укрощение больших данных» Билл Фрэнкс и «Большие данные» Виктор Майер-Шенбергер, Кеннет Кукьер.
  2. Для тех, кто уже знаком с технологией Big Data, чтобы увеличить свой опыт в этой теме рекомендуется прочитать книгу «Spark для профессионалов» Сэнди Риза, Ури Лезерсон, Шон Оуэн, Джош Уиллс.
  3. Для общей информации и ознакомления с темой можно прочитать книги: «Big data простым языком» Алексей Благирев, Наталья Хапаева, «Работа с BigData в облаках» Александр Сенько и «Теоретический минимум по Big Data» Анналин Ын, Кеннет Су.
Вам подходит эта работа?
Похожие работы
Основы программирования
Курсовая работа Курсовая
28 Мар в 15:54
22 +15
0 покупок
Основы программирования
Курсовая работа Курсовая
28 Мар в 15:53
21 +14
0 покупок
Основы программирования
Курсовая работа Курсовая
28 Мар в 15:52
19 +11
0 покупок
Темы журнала
Показать ещё
Прямой эфир