СИНЕРГИЯ Проектирование систем обработки больших данных (Big Data) (Темы 1-5 Итоговый тест)
МТИ МосТех МосАП МФПУ Синергия Тест оценка ОТЛИЧНО
2024 год
Ответы на 47 вопросов
Результат – 100 баллов
С вопросами вы можете ознакомиться до покупки
ВОПРОСЫ:
УЧЕБНЫЕ МАТЕРИАЛЫ
Введение в курс
Тема 1. Большие данные: термины, проблемы
Тема 2. Обработка структурированной информации
Тема 3. Обработка слабоструктурированной информации
Тема 4. Обработка визуальной информации
Тема 5. Неструктурированная информация на примере корпуса текстов
Заключение
Итоговая аттестация
Итоговый тест
1. … – английское сокращенное обозначение специализированных комплектов разработчика позволяющих при необходимости создавать собственное программное обеспечение, адаптированное к задачам, решаемым той или иной организацией
2. … – проект фонда Apache Software Foundation, платформа с открытым исходным кодом для обработки больших данных; благодаря распределенной файловой системе и распределенным вычислениям эта разработка позволяет обрабатывать и анализировать очень большие объемы данных.
3. … – это полный набор объектов, связанных с поставленной перед изучением проблемой
4. … – это сокращенное английское обозначение одного из основных процессов в управлении хранилищами данных, которое можно перевести как «извлечение, преобразование, загрузка / извлечение, загрузка, преобразование»
5. … – это утверждение о том, что представляют собой законы, лежащие в основе изучаемой генеральной совокупности
6. … включает данные, которые относятся к нескольким однородным объектам, при этом каждый объект описан в виде набора характеристик; обычно его можно представить в виде таблицы в несколько строк и столбцов
7. … впервые использовал термин «большие данные» в журнале Nature по аналогии с терминами «большая нефть», «большая руда»
8. … данные – это данные текстовых файлов с определенными паттернами для их обработки
9. … данные обычно существуют в таблицах, подобных файлам Excel и электронным таблицам Google Docs
10. … данные представляют собой высокоорганизованную, фактическую и точную информацию и обычно представлены в форме букв и цифр, которые хорошо вписываются в строки и столбцы таблиц
11. … данных – это процесс, посредством которого извлекается необходимая для обработки информация, впоследствии предоставляющая решение поставленной перед ним задачи/проблемы
12. … данных являются соцсети, приложения, веб-визоры, камеры наблюдения, видеорегистраторы, датчики и другие системы, где генерируются разнородные данные
13. … таблица – это специальный тип таблицы, суммирующий информацию из конкретных полей списка или базы данных; допускает после построения настройку на различные разрезы данных
14. Английское название хранилищ данных масштаба предприятия, где данные хранятся в неструктурированном / необработанном виде, – Data …
15. В числе наиболее доступных источников информации на сегодня – … (укажите 2 варианта ответа)
16. Данные, у которых нет строго зафиксированного формата, называются …
17. Для работы с реляционными базами данных и хранилищами используется специальный язык программирования – язык структурированных запросов …, который был разработан IBM в 1970-х гг.
18. Карта с нанесенной на нее информацией в виде цвета или с помощью других способов – это …
19. Комплексный набор методов, подходов и инструментов обработки структурированных и неструктурированных данных колоссальных объемов –это …
20. Компонентом системы машинного зрения является датчик для … частей обнаружения (часто оптический или магнитный датчик), который служит для захвата и обработки изображений
21. Макрокоманда, содержащая последовательность действий, записанных пользователем, – это …
22. Одной из задач машинного зрения является …, например: определение трехмерного движения камеры; слежение, то есть следование за перемещениями объекта (машины, человека)
23. Операция над данными, с помощью которой можно переупорядочить строки в списке в соответствии с содержанием конкретных столбцов, – это …
24. Подборка тематически связанных данных, расположенных на одном рабочем листе, – это …
25. После того как первая версия поискового словаря создана, дальнейшие операции …
26. Программный продукт TextAnalyst научно-производственного инновационного центра …, использует для решения задач распознавания слов нейросетевые технологии и, в основном, предназначен для решения задачи автоматического реферирования документов
27. Совокупность методов и средств извлечения их организованных данных для принятия решений – это … данных
28. Согласно принципу трех V английским словом «…» обозначают разнообразие, способность обработки множества типов, источников и форматов данных
29. Создание большого количества различных визуальных представлений одних и тех же данных – это …
30. Среди разработчиков программного обеспечения, реализующих передовые поисковые лингвистические технологии, следует выделить ЗАО «…» – такие разработки этой фирмы, как «Следопыт», «Классификатор» и «Аннотатор», позволяют осуществлять оперативный поиск документов, их индексирование, классификацию и автоматическое аннотирование
31. Структурированные данные часто называют …, что означает, что их объективный и заранее определенный характер позволяет нам легко подсчитывать, измерять и выражать данные в числах
32. Такой метод обработки изображений, как …, используется для поиска и (или) подсчета деталей, его цель заключается в упрощении и/или изменении представления изображения, чтобы его было проще и легче анализировать
33. Такой метод обработки изображения, как …, заключается в преобразовании изображения в серых тонах в белые и черные пиксели; значения каждого пикселя условно кодируются как 0 и 1
34. Текстовые данные с неустойчивым форматом, которые для обработки инструментами требуют больших временных затрат на преобразование, – это … данные
35. Услуга эвристического поиска, основанного на использовании систем искусственного интеллекта, формирующих расширенный запрос на основе применения специализированных отраслевых тезаурусов и семантических сетей, в Интернете на сегодня …
36. Установите правильную последовательность действий, если необходимо создать собственный формат данных (лс) и применить его для поля электронной таблицы «Мощность двигателя» (см. рисунок ниже):
37. Установите правильную последовательность этапов анализа данных:
38. Установите правильный порядок процедуры анализа текстовой информации, осуществляемой аналитиком:
39. Установите соответствие английского обозначения признака больших данных и характеристики данного признака:
40. Установите соответствие дат и описаний исторических прорывов в машинном зрении:
41. Установите соответствие компонентов распознавания текста и их характеристик:
42. Установите соответствие основания классификации и соответствующих примеров корпусов текстов:
43. Установите соответствие понятий и их определений:
44. Установите соответствие примеров и характеристик систем управления реляционными базами данных (СУДБ), инструментов и технологий для обработки данных:
45. Установите соответствие элементов специфики работы со неструктурированными данными и их содержания:
46. Установите хронологическую последовательность исторических прорывов в машинном зрении:
47. Чтобы переименовать рабочий лист электронной таблицы, сначала нужно … кнопки мыши вызвать контекстное меню на ярлыке листа и выбрать в нем команду «Переименовать»