- Занятие 1
- Занятие 2
Бизнес процесс – это:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Взаимосвязанные виды деятельности, преобразующие входы в выходы
- Cовокупность взаимосвязанных и взаимодействующих видов деятельности, преобразующая входы в выходы, представляющие ценность для клиента
- Cовокупность разнородных и существенных видов деятельности, преобразующая входы в выходы, которые могут быть полезны для клиента
- Множество видов деятельности, объединенных производством одного продукта, услуги
Большинство методов Data mining были разработаны в рамках …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- теории искусственного интеллекта
- классического анализа данных
- теории баз данных
В каких из приведенных ниже случаев речь идет структурированных данных:
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- Данные о продажах фирмы, представленные в виде отчётов в MS Excel
- Таблица с ежедневными показаниями температуры помещения за год в файле формата CSV
- Текст книги, представленный в формате PDF
- Фильмы, представленных в формате mpeg на одном жестком диске
Горизонтальная масштабируемость при обработке Big Data – это:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Расширение механизма обработки данных при росте объема данных
- Увеличение скорости обработки при росте объема данных
- Спад скорости обработки при росте объема данных
- Изменение масштабов представления результатов обработки данных
Заказчик бизнес-процесса – это должностное лицо:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Имеет в своем распоряжении средства для заказа выхода бизнес - процесса
- Имеет в своем распоряжении материальные и информационные ресурсы бизнес - процесса, управляет его ходом, несет ответственность за результат и эффективность
- Имеет в своем распоряжении ресурсы и полномочия для принятия решений о проведении работ по описанию, регламентации или аудиту бизнес - процесса
- имеет в своем распоряжении необходимый инструментарий для проектирования бизнес - процессом и его управления
К основным характеристикам Big Data относятся:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Virtualization, Volume, Variability, Vehicle
- Variety, Velocity, Volume, Value
- Verification
- Video, Value, Variety, Volume
Как можно получить помощь в R:
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- В R-Studio можно поставить курсор на название функции и нажать F1
- перед названием функции можно напечатать знак вопроса;
- можно воспользоваться функцией help()
Как назвается в R тип данных «строки»?
Тип ответа: Текcтовый ответ
Как назвается в R тип данных «целые числа»?
Тип ответа: Текcтовый ответ
Как назвается в R тип данных «числа с плавающей точкой»?
Тип ответа: Текcтовый ответ
Какая функция dplyr служит для вертикального объединения таблиц?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- bind()
- bind_rows()
- left_join()
- union()
- bind_cols()
- join()
Какие типы данных используются в R:
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- numeric
- integer
- quantitative
- attributive
- logical
- complex
- character
Каким образом можно объявить переменную «а» на языке R:
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
Локальность данных Big Data – это:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Расширение механизма обработки данных при росте объема данных
- Обработка и хранение происходит на одной машине
- Время коммуникации не может быть выше времени обработки
- Данные не стоит обрабатывать на сервере их хранения
Медианой для выборки 1,__,3,7,10,15,16,18 является:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- 7,714286
- 7
- 8,5
- рассчитать медиану невозможно из-за пропущенных значений
На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Понимание бизнеса (Business understanding)
- Понимание данных (Data Understanding)
- Моделирование (Modeling)
- Оценка (Evaluation)
Назовите сложности иерархических методов кластеризации:
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- Ограничение объема набора данных
- Выбор меры близости
- Негибкость полученных классификаций
- Наличие предположений относительно числа кластеров
Неверно, что дендрограмма – является результатом работы …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- дивизимного кластерного анализа
- быстрого кластерного анализа
- агломеративного кластерного анализа
Неверно, что метод, рекомендуемый при небольших объемах выборки?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- метод k–средних
- метод ближнего соседа
- вся группа иерархических методов
- все ответы неверны
Основные меры расстояния между объектами при использовании иерархического метода КА:
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- евклидово расстояние
- квадрат евклидова расстояния
- манхэттенское расстояние
- расстояние Чебышева
Отказоустойчивость Big Data – это, когда:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Активируются до 1000 компьютеров
- Сбой в одном звене системы не ведет к сбоям в других звеньях
- Недостоверные данные удаляются из системы
- Данные обрабатываются на других серверах
При использовании какого метода необходимо задавать количество кластеров?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- метод k-средних
- метод ближнего соседа
- вся группа иерархических методов
- все ответы неверны
Процессы маркетинга относят к группе:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Процессы управления
- Поддерживающие процессы
- Операционные процессы
Процессы подбора персонала относят к группе:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Процессы управления
- Поддерживающие процессы
- Операционные процессы
Решение задачи прогнозирования ...
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- возможно без обучающей выборки данных
- требует некоторой обучающей выборки данных
- является решением задачи "обучения без учителя"
Сколько в 1 зеттабайте тарабайт?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- 1,073742∙〖10〗^9
- 2,147484∙〖10〗^9
- 1,888947∙〖10〗^7
Технология Web mining применяет технологию Data Mining для анализа:
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- неструктурированной информации
- структурированной информации
- неоднородной информации
- однородной информации
- распределенной и значительной по объему информации
- информации, содержащейся на Web-узлах
Установите соответствие между алгоритмами объединения двух кластеров и их характеристиками:
Тип ответа: Сопоставление
- A. Метод дальнего соседа
- B. Метод средней связи
- C. Метод медианной связи
- D. Степень близости оценивается по степени близости между наиболее отдаленными объектами кластеров
- E. Степень близости оценивается как средняя величина степеней близости между объектами кластеров
- F. Расстояние между любым кластером S и новым кластером, который получился в результате объединения кластеров P и Q, определяется как расстояние от центра кластера S до середины отрезка, соединяющего центры кластеров P и Q
Установите соответствие между наиболее распространенными подходами обработки данных и их характеристиками:
Тип ответа: Сопоставление
- A. SQL
- B. MapReduce
- C. SAP HANA
- D. Язык структурированных запросов, позволяющий работать с базами данных. С его помощью можно создавать и модифицировать данные, а управлением массива данных занимается соответствующая система управления базами данных (СУБД)
- E. Модель распределения вычислений. Используется для параллельных вычислений над очень большими наборами данных (петабайты и более). В программном интерфейсе не данные передаются на обработку программе, а программа – данным. Таким образом, запрос представляет собой отдельную программу. Принцип работы заключается в последовательной обработке данных двумя методами
- F. Высокопроизводительная платформа для хранения и обработки данных. Обеспечивает высокую скорость обработки запросов. Еще одним отличительным признаком является то, что эта платформа упрощает системный ландшафт, уменьшая затраты на поддержку аналитических систем
Что такое Business Intelligence (Bl):
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Синоним понятия «бизнес-анализ»
- Tехнологии и программное обеспечение для преобразования больших объемов необработанной информации в данные, необходимые для выработки управленческих решений
- Cистема конкурентной разведки — сбор, обработка и анализ информации из различных источников с целью обоснования управленческих решений, позволяющих повысить конкурентоспособность бизнеса