Больше работ можно посмотреть по ссылке https://studwork.ru/shop?user=767252
После покупки Вы получите файл с ответами на вопросы которые указаны ниже
Алгоритм k-средних предназначен для решения задачи:
Классификации
Кластеризации
Прогнозирования
Снижения размерности
Большие данные – это:
Данные объемом более 10Тб
Данные объемом более 100Тб
Данные объемом более 150Тб
Нет ограничений на минимальный объем
Большинство методов Data mining были разработаны в рамках …
классического анализа данных
теории баз данных
теории искусственного интеллекта
Деревья решений относятся к группам …
статистических методов
кибернетических методов
логических методов
методов кросс-табуляции
Для какой шкалы применимы только такие операции как равно и не равно?
номинальная шкала
порядковая шкала
интервальная шкала
Интервальная шкала – это шкала…
содержащая категории, которые могут упорядочиваться, однако разности не
имеют смысла
разности между значениями которой могут быть вычислены, однако их
отношения не имеет смысла
содержащая только категории, которые не могут упорядочиваться
Какие типы данных используются в R:
Тип ответа: Сортировка
logical
numeric
3integer
4character
5attributive
6complex
Какой пакет позволяет загружать данные из листа Excel файла?
readxl
excelreadr
googlesheets
vroom
sheets_read
Классификация относится к стратегии:
обучения с учителем
обучения без учителя
обучения с подкреплением
Кластер можно охарактеризовать как …
группу объектов, имеющих общие свойства
один объект, изолированный от других
группу объектов, имеющую внутреннюю однородность
Кто создал первую модель искусственных нейронных сетей?
Фрэнк Розенблатт
Уоррен Мак-Каллок и Уолтер Питтс
Ян Лекун
Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс
Найдите соответствие между понятием и его описанием (соотношение по цветам )
A. Data lake
B. Data science
C. Data mining
D. Machine learning
E. Хранилище больших данных в необработанном виде.
F. Дисциплина, изучающая проблемы анализа, обработки и представления
информации в цифровой форме.
G. Интеллектуальный анализ данных с целью выявления закономерностей.
H. Теория и практика разработки самообучающихся программ, большая область
искусственного интеллекта.
Найдите соответствие между функцией в R и еe описанием( соотношение по цветам)
A. с(…)
B. sеq(from, to, by=)
C. list(…)
D. сbind(…)
E. Объединяет аргументы в вектор
F. Генерирует последовательность чисел с шагом
G. Создает список объектов
H. Объединяет объекты по столбцам
Найдите соответствие между функцией в R и еe описанием: (правильное соотношение по цветам )
A. str(оbject)
B. summаry(оbject)
C. hеad(x)
D. tаil(x)
E. Внутренняя структура объекта
F. Общая информация об объекте
G. Посмотреть начальные строки объекта
H. Посмотреть последние строки объекта
Не верно утверждение о том, что:
Большие объёмы данных приводят к слабой их структуризации, поэтому
появляется такое разнообразие данных.
Увеличившаяся производительность телекоммуникационных каналов привела к
росту объёмов передаваемой информации.
Удешевление систем хранения на единицу информации привело к росту рынка
больших данных.
Большое разнообразие источников данных.
Не верно, что закономерности, определенные с использованием технологии Data Mining
должны обладать такими свойствами:
быть очевидными
быть неочевидными
быть практически полезными
быть объективными
Не верно, что технология Web Mining применяет Data Mining для анализа:
Неоднородной информации
Неструктурированной информации
Структурированной информации
Распределенной и значительной по объему информации
Не верно, что Variety в контексте характеристик Big Data означает:
Высокая скорость генерирования данных.
Разные типы данных в колонках таблиц реляционных СУБД.
Разнообразие отраслей, являющихся источниками данных.
Разнообразие типов данных, включающих в себя структурированные,
полуструктурированные и неструктурированные.
Объём накопленных человечеством цифровых данных на 2023 год измеряется:
Петабайтами
Зеттабайтами
Экзабайтами
Йоттабайтами
Определите правильную последовательность модели распределенных вычислений MapReduce:правильный порядок по цвету
Reduce
предварительные
данные
выбирает
их
агрегирует
Map
Определите правильную последовательность термина «Big Data»: правильный порядок по цвету
цифровой информации
быстро поступающей
неоднородной
огромные объемы
которые
традиционными
невозможно
обработать
инструментами
Регрессионный и дискриминантный анализ относятся…
к статистическим методам Data mining
к кибернетическим методам Data mining
не являются методами Data mining
Такие данные как температура воздуха относятся к …
атрибутивным данным
непрерывным данным
дискретным данным
альтернативным данным
Установите соответствие между функциями и их определениями: правильное соотношение по цветам
A. mutate_at
B. transmute
C. mutate
D. изменяет определенные переменные по имени
E. добавляет новые переменные во фрейм данных и удаляет существующие
переменные
F. добавляет новые переменные во фрейм данных, сохраняя существующие
переменные
Установите соответствие целей инфраструктуры Hadoop и их определений: правильное соотношение по цветам
A. Надежность
B. Отказоустойчивость
C. Масштабируемость
D. Портируемость
E. достигается посредством создания нескольких копий данных и повторного
применения логики обработки в случае сбоя
F. обнаружение сбоев и их автоматическое и применение автоматического
Восстановления
G. данные и их обработка распределяются в кластерах
H. возможность установки на всех видах устройств и операционных систем
Data Mining — это процесс обнаружения в сырых данных…
ранее сформулированных гипотез
неочевидных закономерностей
практических закономерностей
объективных закономерностей
большого количества закономерностей
Услуги по построению архитектуры системы базы данных, обустройству и оптимизации инфраструктуры, и обеспечению безопасности хранения данных относятся к…