- Занятие
Алгоритм k-средних предназначен для решения задачи:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Классификации
- Кластеризации
- Прогнозирования
- Снижения размерности
Большие данные – это:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Данные объемом более 10Тб
- Данные объемом более 100Тб
- Данные объемом более 150Тб
- Нет ограничений на минимальный объем
Большинство методов Data mining были разработаны в рамках …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- классического анализа данных
- теории баз данных
- теории искусственного интеллекта
Деревья решений относятся к группам …
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- статистических методов
- кибернетических методов
- логических методов
- методов кросс-табуляции
Для какой шкалы применимы только такие операции как равно и не равно?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- номинальная шкала
- порядковая шкала
- интервальная шкала
Интервальная шкала – это шкала…
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла
- разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла
- содержащая только категории, которые не могут упорядочиваться
Какие типы данных используются в R:
Тип ответа: Сортировка
- 1 logical
- 2 numeric
- 3 integer
- 4 character
- 5 attributive
- 6 complex
Какой пакет позволяет загружать данные из листа Excel файла?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- readxl
- excelreadr
- googlesheets
- vroom
- sheets_read
Классификация относится к стратегии:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- обучения с учителем
- обучения без учителя
- обучения с подкреплением
Кластер можно охарактеризовать как …
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- группу объектов, имеющих общие свойства
- один объект, изолированный от других
- группу объектов, имеющую внутреннюю однородность
Кто создал первую модель искусственных нейронных сетей?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Фрэнк Розенблатт
- Уоррен Мак-Каллок и Уолтер Питтс
- Ян Лекун
- Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс
Найдите соответствие между понятием и его описанием
Тип ответа: Сопоставление
- A. Data lake
- B. Data science
- C. Data mining
- D. Machine learning
- E. Хранилище больших данных в необработанном виде.
- F. Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме.
- G. Интеллектуальный анализ данных с целью выявления закономерностей.
- H. Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта.
Найдите соответствие между функцией в R и еe описанием:
Тип ответа: Сопоставление
- A. с(…)
- B. sеq(from, to, by=)
- C. list(…)
- D. сbind(…)
- E. Объединяет аргументы в вектор
- F. Генерирует последовательность чисел с шагом
- G. Создает список объектов
- H. Объединяет объекты по столбцам
Найдите соответствие между функцией в R и еe описанием:
Тип ответа: Сопоставление
- A. str(оbject)
- B. summаry(оbject)
- C. hеad(x)
- D. tаil(x)
- E. Внутренняя структура объекта
- F. Общая информация об объекте
- G. Посмотреть начальные строки объекта
- H. Посмотреть последние строки объекта
Не верно утверждение о том, что:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных.
- Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации.
- Удешевление систем хранения на единицу информации привело к росту рынка больших данных.
- Большое разнообразие источников данных.
Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- быть очевидными
- быть неочевидными
- быть практически полезными
- быть объективными
Не верно, что технология Web Mining применяет Data Mining для анализа:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Неоднородной информации
- Неструктурированной информации
- Структурированной информации
- Распределенной и значительной по объему информации
Не верно, что Variety в контексте характеристик Big Data означает:
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- Высокая скорость генерирования данных.
- Разные типы данных в колонках таблиц реляционных СУБД.
- Разнообразие отраслей, являющихся источниками данных.
- Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные.
Объём накопленных человечеством цифровых данных на 2023 год измеряется:
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Петабайтами
- Зеттабайтами
- Экзабайтами
- Йоттабайтами
Определите правильную последовательность модели распределенных вычислений MapReduce:
Тип ответа: Сортировка
- 1 Reduce
- 2 предварительные
- 3 данные
- 4 выбирает
- 5 их
- 6 агрегирует
- 7 Map
Определите правильную последовательность термина «Big Data»:
Тип ответа: Сортировка
- 1 цифровой информации
- 2 быстро поступающей
- 3 неоднородной
- 4 огромные объемы
- 5 которые
- 6 традиционными
- 7 невозможно
- 8 обработать
- 9 инструментами
Регрессионный и дискриминантный анализ относятся…
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- к статистическим методам Data mining
- к кибернетическим методам Data mining
- не являются методами Data mining
Сколько Петабайт в Зеттабайте?
Тип ответа: Текcтовый ответ
Такие данные как температура воздуха относятся к …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- атрибутивным данным
- непрерывным данным
- дискретным данным
- альтернативным данным
Услуги по построению архитектуры системы базы данных, обустройству и оптимизации инфраструктуры, и обеспечению безопасности хранения данных относятся к…
Тип ответа: Текcтовый ответ
Установите соответствие между функциями и их определениями:
Тип ответа: Сопоставление
- A. mutate_at
- B. transmute
- C. mutate
- D. изменяет определенные переменные по имени
- E. добавляет новые переменные во фрейм данных и удаляет существующие переменные
- F. добавляет новые переменные во фрейм данных, сохраняя существующие переменные
Установите соответствие целей инфраструктуры Hadoop и их определений:
Тип ответа: Сопоставление
- A. Надежность
- B. Отказоустойчивость
- C. Масштабируемость
- D. Портируемость
- E. достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя
- F. обнаружение сбоев и их автоматическое и применение автоматического восстановления
- G. данные и их обработка распределяются в кластерах
- H. возможность установки на всех видах устройств и операционных систем
Data Mining — это процесс обнаружения в сырых данных…
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- ранее сформулированных гипотез
- неочевидных закономерностей
- практических закономерностей
- объективных закономерностей
- большого количества закономерностей