Ответы представлены на ИТОГОВЫЙ ТЕСТ (Введение в технологии Big Data.ти)
Результат - 97-100 баллов
Перед покупкой сверьте список вопросов и убедитесь, что вам нужны ответы именно на эти вопросы!
С вопросами вы можете ознакомиться ДО покупки.
Для быстрого поиска вопроса используйте Ctrl+F.
При возникновении вопросов или необходимости пройти тест по другому предмету пишите в личные сообщения https://studwork.ru/mail/259571
Другие мои работы можно найти по ссылке https://studwork.ru/shop?user=259571
Ответы вы сможете скачать сразу после покупки.
BI (бизнес-аналитику) в компании применяют для…
· ликвидации опозданий на работу
· прогнозирования финансового состояния
· распределения премий между сотрудниками
· анализа инновационных товаров
Big Data отражает эффект (феномен)…
· скорости интернет
· разнообразия данных
· криптовалютных отношений
· отказа от баз данных
BigData – это …
· Представление фактов, понятий или инструкций в форме, приемлемой для интерпретации, или обработки
· Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов
· Колоссальный объем данных, собранных человечеством
· Класс в Java, предназначенный для хранения данных от 100 Гб
BigData – это…
· Класс в Java, предназначенный для хранения данных от 100 Гб
· Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов
· Колоссальный объем данных, собранных человечеством
· Представление фактов, понятий или инструкций в форме, приемлемой для интерпретации, или обработки
Data Mining — это процесс обнаружения в сырых данных знаний, необходимых для…
· Принятия решений в различных сферах человеческой деятельности
· Замены аналитика в процессе принятия решений
· Увеличения стоимости анализа данных
· Уменьшения стоимости анализа данных
Data Mining позволяет всегда…
· увеличивать объем данных
· визуализировать данные
· избавляться от спама
· применять лишь 2D-представление данных
Hadoop – это…
· набор утилит, и программный каркас для выполнения распределённых программ, работающих на кластерах
· распределённая СУБД, позволяющая обрабатывать большие данные
· язык выполнения заданий в парадигме MapReduce
· распределённая файловая система, предназначенная для хранения файлов большого объёма
R не является…
· языком программирования для статистической обработки данных и работы с графикой, созданный на основе языка S
· свободной программной средой вычислений с открытым исходным кодом
· высокоуровневым языком программирования общего назначения, ориентированным на повышение производительности разработчика и читаемости кода
· языком программирования с динамической типизацией данных
Аналитик это …
· специалист в области анализа и моделирования
· специалист в предметной области
· человек, решающий определенные задачи
· человек, который имеет опыт в программировании
Более полно и точно, краудсорсинг – это модель…
· передачи управления народу
· типа договора оферта
· договора подряда
· оплаты по максимальной ставке
В 2016 году программа AlphaGo обыграла одного из мировых по шахматам чемпионов Ли Седоля. Какая компания разработала ИИ AlphaGo?
· Microsoft
· Yandex
В Big Data возможны…
· виртуальные типы данных
· лишь одинакового типа данные
· лишь одинакового типа данные
· лишь одинаковые области применения данных
· разные типы и области происхождения данных
В Big Data не акцентируется…
· Volume (Объем)
· Velocity (Скорость)
· Variety (Разнообразие)
· Voicing (Озвучивание)
В базе данных есть следующие записи: длительность звонков, общее число звонков, общее число переданных сообщений, количество потраченных гигабайтов трафика. Вы хотите предсказывать объем трафика, который потратят клиенты. Что будет объектом модели в этой задаче?
· Длительность звонков
· Общее число звонков
· Клиент
· Количество трафика
В какие игры нейросеть еще не научилась обыгрывать человека?
· Го
· «Марио»
· Бридж
· Шахматы
В каком году впервые был введен термин Большие данные?
· 2002
· 2004
· 2006
· 2008
В каком из приведённых примеров наиболее эффективны NoSQL решения типа ключ-значение?
· потоковая обработка логов кластера серверов и быстрого сохранения без требования оперативной аналитики
· оперативная аналитика сохранённых логов кластера серверов
· кластеризация логов кластера серверов на основе заранее известных признаков лог-файла
· хранение данных о клиентах международной корпорации
В краудсорсинге вклад в проект каждого участника осуществляется…
· лишь финансами
· лишь затратами времени
· ресурсами – компьютер, время и др.
· привлечением аутсорсинга
В краудсорсинге могут быть задействованы…
· лишь профессионалы
· лишь любители
· разработчики площадки и посетители
· профессионалы и любители
В любых Big Data информация целиком распределена…
· по компьютеру
· по всей сети
· по всему интернет
· по всем облакам
В результате использования инструментов Data Mining пользователь может …
· Получить гипотезы о взаимосвязях в данных, самостоятельно выдвинутые инструментом Data Mining
· Получить подтверждение или опровержение гипотез, выдвинутых пользователем
· Проверить гипотезы о взаимосвязях в данных, самостоятельно выдвинутые пользователем инструмента Data Mining
В чём преимущество колоночно-ориентированных СУБД?
· они позволяют выполнять более сложные SQL-запросы по сравнению с реляционными СУБД
· они позволяют динамически дополнять содержание записей новыми полями
· они имеют более гибкие возможности аналитики
· они позволяют эффективно делать межколоночные сравнения
Вы взяли среднесуточные температуры за последние два года и построили регрессионную модель для прогнозирования дневного спроса на товары. Для мороженого она работает хорошо, а для шуб плохо. Почему?
· Шубы продают нечасто — мало данных
· На рынке шуб много «серых» продаж — данные недостоверны
· Продажи шуб вообще нельзя спрогнозировать
· Мороженое — спонтанная покупка
Выберите верное высказывание…
· большие данные – это обработка или хранение более 1 Тб информации
· проблема больших данных – это такая проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна
· большие данные – это огромная PR-акция крупных вендоров и не более того
· большие данные – это явление, когда цифровые данные наиболее полно представляют изучаемый объект
Выберите неверное высказывание про MapReduce…
· интерфейс для массово-параллельной обработки данных, где вычисления производятся на узлах, где информация изначально была сохранена
· MapReduce – это две операции: распределения и сборки данных
· MapReduce был придуман разработчиками Hadoop
· MapReduce был анонсирован разработчиками Google
Выберите неверное высказывание…
· большие данные – это данные объёма свыше 1 Тб
· проблема больших данных – это проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна
· большие данные – это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров
· большие данные как правило не структурированы
Выберите технологию потоковой обработки событий в режиме реального времени
· Apache Kafka
· Apache Hadoop
· MapReduce
· Spark Streaming
Горизонтальная масштабируемость при обработке Big Data – это…
· расширение механизма обработки данных при росте объема данных
· увеличение скорости обработки при росте объема данных
· спад скорости обработки при росте объема данных
· изменение масштабов представления результатов обработки данных
Дайте определение Big Data
· Комплексный набор инструментов обработки структурированных данных колоссальных объемов
· Комплексный набор подходов, инструментов и методов обработки структурированных и неструктурированных данных колоссальных объемов
· Комплексный набор методов обработки неструктурированных данных колоссаль
· Комплексный набор методов обработки структурированных данных колоссальных объемов
Дайте определение Map Reduce…
· Модель распределенных вычислений, предназначенная для параллельных вычислений над очень большими (до нескольких петабайт) объемами данных
· Набор компонентов и интерфейсов для распределенных файловых систем и общего ввода-вывода
· Распределенная файловая система, работающая на больших кластерах типовых машин
· Распределенный сервис для коллекционирования, сбора, и перемещения больших массивов данных
Данные могут быть получены в результате...
· Измерений
· Экспериментов
· Арифметических и логических операций
Данные представляют собой...
· Факты и графики
· Текст
· Картинки, звуки, аналоговые или цифровые видео-сегменты
Для машинного обучения подходят данные…
· Бинарные
· Числовые типа int
· Любых форматов в цифровом виде
· Предварительно подготовленные, очищенные от ошибок, пропусков и выбросов, а также нормализованные и представленные в виде числовых векторов
Для обработки больших данных наиболее актуально…
· привлечь больше вычислительных мощностей для обработки
· ускорить обработку или увеличить объем обрабатываемых данных
· заработать обработкой данных или обрабатывать их для заработка
· оставить для обработки только однотипные данные (например, числовые)
До появления Big Data невозможно было…
· обрабатывать всю вузовскую информацию полностью
· управлять автоматизированной линией по сборке авто
· оплачивать товары в электронных платежных системах
· работать с данными дистанционного зондирования Земли
До появления Data Mining невозможно было найти связи…
· студентов вуза и их успеваемости по предмету
· течения COVID-19 и осложнений после заболевания по всей РФ
· рекламирования и покупательской активности на сайте веб-магазина
· сроков доставки заказа через службу доставки и числом курьеров
Допустим, нам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения нам в этом пригодится?
· Латентная модель
· Обучение ранжированию
· Компьютерное зрение
· Предсказательное моделирование
Закончите следующее предложение: "С точки зрения машины, информация становится структурированной, если...
· Машина проинструктирована, каким образом её обрабатывать
· Информация разделена на части и озаглавлена
· Информация имеет логическую взаимосвязь внутри себя
· Машина знает из каких частей состоит информация
Изначально Big Data применяли лишь в…
· геологии
· академической среде
· спутниковой связи
· криптовалютах
Интеллектуальный анализ данных или Data Mining…
· Информация, которая организована и проанализирована с целью сделать ее понятной и применимой для решения задачи или принятия решений.
· Оперативная обработка транзакций
· Термин, используемый для описания открытия знаний в базах данных, выделения знаний, изыскания данных, исследования данных, обработки образцов данных, очистки и сбора данных; здесь же подразумевается сопутствующее ПО
· Оперативная обработка транзакций
Искусственные нейронные сети (ИНС) — модели машинного обучения, использующие комбинации распределенных простых операций, зависящих от обучаемых параметров, для обработки входных данных. Какого вида ИНС не существует?
· Наивные
· Рекуррентные
· Импульсные
· Противоборствующие
Искусственный интеллект научился разбираться в музыке. Насколько хорошо работает программа по определению музыкальных стилей? Сможет ли такая программа справиться с заданием типа «Угадай мелодию» в режиме реального времени?
· да, лучше, чем программа, написанная вручную
· да, но программа написанная вручную будет точнее
· нет, в режиме реального времени программа не справится
· справится, но не в режиме реального времени
Итак, вы решили работать с большими данными. Какой из этих инструментов вам вряд ли пригодится?
· SQL
· Texmaker
· Python
· R
Как происходит обучение нейронной сети?
· эксперты настраивают нейронную сеть
· сеть запускается на обучающем множестве, и незадействованные нейроны выкидываются
· сеть запускается на обучающем множестве, и подстраиваются весовые значения
· сеть запускается на обучающем множестве, и добавляются или убираются соединения между нейронами
Какая информация о пациентах, находящаяся в распоряжении медицинской организации, относится к персональным данным?
· Диагнозы конкретных пациентов
· Количество пациентов медицинской организации
· Данные из электронной медицинской карты без Ф.И.О.: дата рождения, адрес регистрации и пр.
· Динамика роста случаев конкретного заболевания
Какая компания создала технологию MapReduce?
· Yahoo
· EMC
· Oracle
Какие задачи решают графовые БД?
· хранение информации о других БД
· хранение информации о других БД
· распределенное хранение с учетом минимизации передачи информации
· использование графа серверов для распределенного хранения больших данных
· встроенная обработка данных сетевыми методами
Какие из задач решаются Big Data?
· Мониторинг оборудования
· Анализ социальных сетей
· Оптимизация автомобильного движения
· Все вышеперечисленное
Какие из следующих технологий СУБД не используют принцип MapReduce?
· Hadoop
· Cassandra
· HDInsight
· Redis
Какие модули по умолчанию yt входят в состав проекта Apache Hadoop?
· HDFS
· Spark
· MapReduce
· YARN
Какое API было добавлено в Hadoop v2.0?
· YAWN
· YARN
· SARN
· DARN
Какое из нижеперечисленных понятий не относится к перечню необходимых критериев для создания проекта, связанного с Большими данными?
· Географическое положение
· Производительность
· Гибкость анализа
· Скорость принятия решения
Какой тип NoSQL решения наиболее эффективен для потоковой обработки логов кластера серверов и быстрого сохранения без требования оперативной аналитики?
· документоориентированные
· колоночно-ориентированные
· колоночно-ориентированные
· ключ-значение
· графовая
Какой язык программирования из перечисленных является наиболее важным для аналитика?
· C++
· PHP
· F#
· R
Краудсорсинг – модель привлечения…
· ограниченного числа участников и их потенциала
· лишь большого бизнеса
· лишь малого бизнеса
· неограниченного числа и потенциала участников
Краудсорсинг большого проекта невозможен без…
· соединения его с другими проектами, композиции
· выделения его частей, декомпозиции
· экспертной оценки
· финансирования крупным банком
Кто ввел термин Большие данные?
· Клиффорд Линч
· Алан Тьюринг
· Бьерн Страуструп
· Дональд Кнут
Кто и в каком году впервые ввел термин «Big Data»?
· Разработчик компании Google в 2009 году
· Инженер компании Amazon в 2006 году
· Клиффорд Линч, редактор журнала Nature, в 2008 году
· Профессор Стэнфордского университета в 2007 году
Локальность данных Big Data – это…
· расширение механизма обработки данных при росте объема данных
· информация на одном компьютере сети обрабатывается на другом
· время коммуникации не может быть выше времени обработки
· данные не стоит обрабатывать на сервере их хранения
На каком языке программирования можно разрабатывать приложения Hadoop MapReduce?
· Практически на любом: Java, C++ и другие компилируемые языки
· C#
· Только Java
· Python
На основе какого языка был создан R?
· C
· S
· Java
· Python
Недостатком краудсорсинга является…
· неограниченная эффективность
· большие затраты
· ограниченная мотивация
· простота управления
Нейросети хорошо проявляют себя не только в распознавании, но и в генерации изображений. Но кое с чем у них все-таки возникают проблемы. С чем именно?
· Форма
· Текстуры
· Глубина, количество пикселей
· Цвет
Обрабатывать большие данные (Big Data) лет десять назад мешали…
· слабые токи в интернет-сетях
· базы данных табличного типа
· неграмотные в области ИКТ пользователи
· недостаточные вычислительные мощности
Одна из главных целей Big Data – это…
· привлечение все больше пользователей
· рост числа обработок данных
· нижение издержек операций
· таргетирование пользователей
Одна из главных целей Data Mining – это получение…
· связей малых выборок данных, распространение их на большие массивы
· скриншотов всех обработок данных
· аудита сайтов, веб-ресурсов
· гарантированной сетевой безопасности
Основными достоинствами краудсорсинга не являются…
· масштабируемость
· отсутствие рисков
· бесплатная рабочая сила
· символическая оплата
Основными достоинствами краудсорсинга являются…
· масштабируемость и отсутствие рисков
· оперативность реализации проекта и распределения прибыли
· необязательность веб-поддержки
· разделение рисков по исполнителям
Особых успехов нейросети достигли в работе с изображениями. Но что из этого нейросети не могут сделать?
· Стилизовать вашу фотографию под работу импрессиониста
· Догадаться, что вы нарисовали
· Омолаживать и состаривать лица на фотографиях
· Пластическую коррекцию лица
Отказоустойчивость Big Data – это, когда…
· активируются до 1000 компьютеров
· сбой в одном звене системы не ведет к сбоям в других звеньях
· недостоверные данные удаляются из системы
· данные обрабатываются на других серверах
Отметьте верное понимание Variety в контексте характеристик Big Data…
· высокая скорость генерирования данных
· разные типы данных в колонках таблиц реляционных СУБД
· разнообразие отраслей, являющихся источниками данных
· разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные
Отметьте причину создания NoSQL баз данных…
· высокая стоимость горизонтальной масштабируемости RDBMS при сохранении требования высокой доступности
· недостаточная гибкость языка запросов SQL
· невозможность хранить большие объёмы данных
· дороговизна лицензий RDBMS
Отметьте те из вариантов, в которых данные структурированы…
· данные о продажах компании, представленные в виде помесячных отчётов в формате MS Word
· таблица с ежедневными показаниями температуры помещения за год в файле формата csv
· текст педагогической поэмы А.С. Макаренко, представленный в формате PDF
· библиотека фильмов, представленных в формате mpeg4 на одном жестком диске
Перечислите четыре основных характеристики Big Data…
· Virtualization, Volume, Variability, Vehicle
· Variety, Velocity, Volume, Value
· Verification, Volume, Velocity, Visualization
· Video, Value, Variety, Volume
Подходы к построению моделей Data Mining
· статистический и на основании машинного обучения
· на основании машинного обучения и вычислительный
· вычислительный и статистический
Пример благоразумного использования Hadoop…
· анализ 10 Гб данных
· ежедневное сохранение данных температуры, поступающих со всех городов России (по одному показанию на город, всего городов 1100 шт)
· посекундное сохранение данных температуры, поступающих со всех городов России (по одному показанию на город, всего городов 1100 шт)
· построение графика пульса пациента в реальном времени
Примером применения Big Data не может быть…
· зондирование Земли из космоса
· родительский контроль
· хранение данных клиентов в соцсетях
· доступ к крупнейшим библиотекам
Принцип 3Vs расшифровывается как...
· Value, Variety, Velocity
· Volume, Veracity, Velocity
· Volume, Variety, Velocity
· Value, Veracity, Velocity
Принципом Big Data не является…
· горизонтальная масштабируемость
· локализация данных
· отказоустойчивость обработки
· мобильность приложений
Программа от Google научилась рисовать на основе эскизов, сделанных людьми. Что при этом учитывала программа?
· стиль типичный для похожих изображений
· только конечный результат
· концепцию (идею) рисунка
· цветовую гамму типичную для похожих изображений
Расписание движения поездов может рассматриваться как пример…
· Табличной модели
· Натурной модели
· Математической модели
· Графической модели
Распределенная архитектура Big Data позволяет всегда…
· защищать каждому пользователю данные страницы другого пользователя
· распределять по соцсети фото, сообщения
· распределять справедливо доход от рекламы в сетях
· распределять зарплату таргетологов
С помощью Big Data клиентский компьютер может обрабатывать до…
· терабайтов данных
· мегабайтов данных
· гугол данных
· петабайтов данных
Сколько Петабайт в Зеттабайте?
· 1024
· 128
· 32
· 4
Специалист по работе с данными знает и умеет многое, но нельзя знать всего. Чего не преподают на курсах по Data Science?
· Выявление аномалий
· Кластерный анализ
· Масс-спектрометрия
· Регрессионный анализ
Теперь вам нужно обучить нейросеть распознавать на фото воздушные шары. Коллега предлагает перевести все изображения для обучения нейросети в черно-белые. Что вы ответите?
· Нет, потому что это невозможно
· Нет, потому что это ухудшит результат
· Да, потому что значение имеет только форма
· Да, потому что цвета можно добавить потом
Традиционные методы визуализации могут находить следующее применение…
· Представлять пользователю информацию в наглядном виде
· Компактно описывать закономерности, присущие исходному набору данных
· Снижение размерности или сжатие информации
У машинного обучения есть ряд задач. Как называется та, что направлена на предсказание значения той или иной непрерывной числовой величины для входных данных?
· Кластеризация
· Классификация
· Переобучение
· Регрессия
Укажите фактор, способствовавший появлению тренда больших данных...
· маркетинговые кампании крупных корпораций
· повышение издержек на хранение данных
· появление новых технологий обработки потоковых данных
· выпуск баз данных с обработкой данных в памяти
Чего не могут стандартные реляционные базы (MySQL, Oracle, MS SQL)?
· хранить данные с изменяющейся структурой
· хранить данные на нескольких физических серверах
· хранить большие объемы (терабайты+)
· обрабатывать запросы большого количества клиентов (миллионы)
Чем глубокое обучение отличается от машинного?
· Машинное обучение — это обучение нейронной сети без применения невычислимых алгоритмов, а глубокое обучение — это обучение сети с использованием таких алгоритмов
· Машинное обучение изучает алгоритмы, обучающиеся без использования специального свода правил, а глубокое обучение — это машинное обучение нейронных сетей с более чем тремя скрытыми слоями нейронов
· Машинное обучение и глубокое обучение по сути одно и то же
· Машинное обучение — это обучение компьютерных алгоритмов без специального свода правил, а глубокое обучение использует все возможные известные виды обучения
Чем искусственная нейронная сеть похожа на естественные нейронные сети в мозге?
· Искусственная нейронная полностью повторяет строение и функции сетей в мозге
· В искусственной нейронной сети повторяется микроструктура связей сетей в мозге
· Их объединяет лишь общий принцип построения: это последовательность связанных друг с другом нейронов
· Так сложилось исторически: эти сети ничего не объединяет, кроме общего слова в названии
Что будет объектом в задаче поиска уходящих от компании клиентов?
· Уход клиента
· Количество дней, через которые клиент уйдет
· Клиент
· Услуга, от которой отказывается клиент
Что из перечисленного помогает следить за эволюцией документа, над созданием которого работает одновременно большое количество авторов?
· Пространственный поток
· Исторический поток
· Визуальный поток
· Интерактивный поток
Что из этого не является типом визуализации?
· График
· Текст
· Круговая диаграмма
· Гистограмма
Что не является целью процесса Business Intelligence?
· Интерпретация большого количества данных
· Моделирование исходов различных вариантов действий
· Модификация существующего программного обеспечения
· Отслеживание результатов решений
Что необходимо выполнить, чтобы нейросеть могла помочь в формировании решения…
· Указать правила вывода
· Указать формулы для расчетов
· Обучить на примерах
· Ввести информацию о ситуации
Что означает термин «Big Data» в информационных технологиях?
· Комплексный набор методов обработки структурированных и неструктурированных данных колоссальных объемов
· Представление времени, дня, месяца и года в качестве значения количества миллисекунд, прошедших с начала нашей эры
· Файлы с большим количеством данных
· Комплексный набор методов для создания файлов большого объёма
Что означает термин «Business Intelligence» в информационных технологиях?
· Комплексный набор методов для создания бизнес планов.
· Методы и инструменты для перевода необработанной информации в осмысленную, удобную для восприятия форму
· Файлы, содержащие информацию о бизнес плане
· Технологии, направленные на развитие бизнеса
Что означает термин NoSQL?
· Не SQL
· Не только SQL
· Без SQL
· SQL – плохо
Что такое EDA?
· Исследовательский анализ данных
· Прогностическая аналитика данных
· Эпизодический анализ данных
· Интеллектуальный кластер
Что такое Spark?
· Инструмент для кластерных вычислений
· Графический движок
· Библиотека для работы с графами
· Технология распределенных вычислений
Что такое SQL?
· Реляционная база данных
· Язык неструктурированных запросов
· Язык структурированных запросов
· Средство для создания пайплайнов
Что такое БУСТИНГ?
· Резкое увеличение объёма поступающих данных
· Метод анализа эффективности прогноза
· Встроенная кросс-валидация данных
· Построение ансамбля моделей машинного обучения
Чтобы работать с большими данными, их сначала нужно собрать. А с этого года действует GDPR — общеевропейский регламент о защите персональных данных. В каких случаях по регламенту не требуется согласие человека на обработку его данных?
· Таких случаев не предусмотрено
· Если данные остаются внутри компании
· Когда данные используются для защиты общественной безопасности
· При условии, что данные «видят» только алгоритмы, но не люди
Эффективно применять Data Mining с целью защиты от…
· мошенников
· инфицирующих ботов
· инфицированных клиентов
· инсайдеров