База ответов к тестам по Введение в анализ больших данных
Подходит для Синергии, МТИ, МОИ, МосАП
1. Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания "<-"
2. Reddis - хранилище «ключ – значение»
3. Какие циклы доступны в базовом синтаксисе языка R?
4. Неверно, что Классификация относится к:
5. распределенных задач с использованием большого количества компьютеров, образующих кластер, – …
6. Как в R обозначаются пропущенные значения?
7. Совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки, – это …
8. Аналитическим отделом компании был получен спам по e-mail с приложенным файлом:
9. Установите соответствие целей инфраструктуры Hadoop и их характеристик:
10. Сокращенное английское название семейства нереляционных баз данных – …
11. Технология Web mining применяет технологию Data Mining для анализа:
12. Вам необходимо принять решение о выдаче кредита клиенту. Какой метод машинного обучения вам в этом поможет?
13. Метод Data Mining, который относит объекты к одному из заранее известных классов, – это …
14. Заказчик бизнес-процесса – это должностное лицо:
15. К основным характеристикам Big Data относятся:
16. Ваша компания использует различные технологии для сбора и хранения данных. Приведите пример данных, когда эффективнее использовать технологию Hadoop.
17. Локальность данных Big Data – это:
18. Минимальная единица измерения информации – это …
19. Отказоустойчивость Big Data – это, когда:
20. Вам необходимо предсказать значения непрерывной числовой величины для входных данных. Какой метод вам в этом поможет?
21. Метод исследования, характеризующийся выделением и изучением отдельных частей объектов исследования, – … (слово происходит от греч. «разложение»)
22. Расположите в правильной последовательности этапы дивизимного метода кластерного анализа:
23. Hadoop – это проект …
24. Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
25. Название на английском языке системы или репозитория данных, хранящихся в необработанном формате, – …
26. Объём накопленных человечеством цифровых данных на 2022 год измеряется:
27. Как назвается в R тип данных «числа с плавающей точкой»?
28. Как назвается в R тип данных «целые числа»?
29. Какая функция dplyr служит для вертикального объединения таблиц?
30. … – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий
31. Язык программирования, который объединяет объектно- ориентированный и функциональный подходы и используется в Apache Spark, – это язык …
32. Язык программирования … имеет лицензию от компании MathWorks и широко используется для вычислений как в научных, так и в промышленных целях
33. Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления:
34. В числе примеров структурированных данных – … (укажите 2 варианта ответа)
35. Вам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения вам в этом поможет?
36. Укажите правильную последовательность этапов анализа данных в языке программирования R:
37. Установите соответствие между способами обучения нейронной сети и их характеристиками:
38. Вам необходимо организовать потоковую обработку событий в режиме реального времени. Какую технологию необходимо использовать?
39. Элементы матрицы факторных нагрузок меняются в пределах …
40. Деревья классификации относятся к стратегии …
41. В языке программирования R ошибочными являются такие варианты присвоения, как … (укажите 2 варианта ответа)
42. Web Mining применяет технологию Data Mining для анализа … (укажите 4 варианта ответа)
43. Чтобы получить помощь в программной среде R, можно … (укажите 3 варианта ответа)
44. Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это …
45. Установите соответствие между описательными статистиками и их определением:
46. Какие типы данных используются в R:
47. Установите соответствие между пакетами языка программирования R и их назначением:
48. Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
49. Установите соответствие между метриками расстояния между объектами и формулами расчета:
50. Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
51. Алгоритм — это:
52. Процесс привлечения к решению задач в инновационной сфере широкого круга лиц по типу субподрядной работы на добровольных началах с применением информационно- коммуникационных технологий – это …
53. Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
54. Процедура снижения признакового пространства …
55. Установите правильную последовательность этапов процесса MapReduсe подсчета цветов в текстовых файлах:
56. Velocity в контексте характеристик Big Data означает …
57. Установите соответствие между аргументами функции leaflet() и их содержанием:
58. Какой метод Data Mining вы будете использовать?
59. Установите соответствие между алгоритмами объединения двух кластеров и их характеристиками:
60. … является шириной коробки в диаграмме «ящик с усами»
61. Интеграция – это …
62. Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании. Какой метод Data Mining вы будете использовать?
63. Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти.
64. Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации. Что следует предпринять руководству?
65. Что такое Business Intelligence (Bl):
66. Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления:
67. Такой вид машинного обучения, как …, основывается на взаимодействии обучаемой системы со средой
68. Сокращенное английское название языка структурированных запросов – …
69. Назовите сложности иерархических методов кластеризации:
70. Установите соответствие этапов MapReduce и их содержания:
71. Что следует предпринять?
72. Данные являются структурированными в … (укажите 2 варианта ответа)
73. Краудсорсинг – это …
74. Решение задачи прогнозирования ...
75. Процесс преобразования данных в код, который можно распознать только с помощью определенного ключа или пароля, – это …
76. Язык программирования R является потомком языка …
77. В числовом ряду 3, 5, 8, 12, 2, 9, 6, 10, 11, 14 медиана (с точностью до 0,1) равна …
78. Горизонтальная масштабируемость при обработке Big Data – это:
79. Установите соответствие баз данных и их характеристик: MongoDB - хранилище документов
80. Neo4J - графовая база данных
81. Медианой для выборки 1, ,3,7,10,15,16,18 является:
82. Cassandra - столбцовая база данных
83. Как назвается в R тип данных «строки»?
84. Процессы маркетинга относят к группе:
85. Сколько в 1 зеттабайте тарабайт?
86. Библиотека … является базовой для Data Science на языке программирования Python
87. SQL – это …
88. Разветвляющийся алгоритм – это …
89. Выполнены следующие строки кода в программной среде RStudio:
90. Английское название фреймворка для вычисления наборов
91. Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – …
92. В вашей компании необходимо организовать сбор, хранение и обработку больших данных. На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных?
93. Как можно получить помощь в R:
94. Установите соответствие между наиболее распространенными подходами обработки данных и их характеристиками:
95. В реляционной модели представленные данные для пользователя передаются в виде …
96. В каких из приведенных ниже случаев речь идет структурированных данных:
97. Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем. Какую функцию вы будете использовать?
98. Каким образом можно объявить переменную «а» на языке R:
99. Процессы подбора персонала относят к группе:
100. Установите соответствие между понятием и его содержанием:
101. Неверно, что существует такой вид искусственных нейронных сетей, как …
102. Если расстоянием между кластерами называется минимальное из расстояний между парами объектов, один из которых входит в первый кластер, а другой – во второй, то это расстояние …
103. На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез?
104. Компьютер, выделенный из группы персональных компьютеров (или рабочих станций) для выполнения какой-либо сервисной задачи без непосредственного участия человека, – это …
105. Реляционные базы данных организованы в виде …
106. Циклический алгоритм используется при вычислении … (укажите 2 варианта ответа)