- Введение в курс
- Тема 1. Большие данные: термины, проблемы
- Тема 2. Обработка структурированной информации
- Тема 3. Обработка слабоструктурированной информации
- Тема 4. Обработка визуальной информации
- Тема 5. Неструктурированная информация на примере корпуса текстов
- Заключение
- Итоговая аттестация
… – английское сокращенное обозначение специализированных комплектов разработчика позволяющих при необходимости создавать собственное программное обеспечение, адаптированное к задачам, решаемым той или иной организацией
Тип ответа: Текcтовый ответ
… – проект фонда Apache Software Foundation, платформа с открытым исходным кодом для обработки больших данных; благодаря распределенной файловой системе и распределенным вычислениям эта разработка позволяет обрабатывать и анализировать очень большие объемы данных.
Тип ответа: Текcтовый ответ
… – это полный набор объектов, связанных с поставленной перед изучением проблемой
Тип ответа: Текcтовый ответ
… включает данные, которые относятся к нескольким однородным объектам, при этом каждый объект описан в виде набора характеристик; обычно его можно представить в виде таблицы в несколько строк и столбцов
Тип ответа: Текcтовый ответ
… впервые использовал термин «большие данные» в журнале Nature по аналогии с терминами «большая нефть», «большая руда»
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Клиффорд Линч
- Ян Лекун
- Юрген Шмидхубер
- Йошуа Бенжио
… данные обычно существуют в таблицах, подобных файлам Excel и электронным таблицам Google Docs
Тип ответа: Текcтовый ответ
… данные представляют собой высокоорганизованную, фактическую и точную информацию и обычно представлены в форме букв и цифр, которые хорошо вписываются в строки и столбцы таблиц
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Структурированные
- Неструктурированные
- Любые
… данных являются соцсети, приложения, веб-визоры, камеры наблюдения, видеорегистраторы, датчики и другие системы, где генерируются разнородные данные
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Методами обработки
- Наборами
- Источниками
… таблица – это специальный тип таблицы, суммирующий информацию из конкретных полей списка или базы данных; допускает после построения настройку на различные разрезы данных
Тип ответа: Текcтовый ответ
Данные, у которых нет строго зафиксированного формата, называются …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- квазиструктурированными
- неструктурированными
- полуструктурированными
Карта с нанесенной на нее информацией в виде цвета или с помощью других способов – это …
Тип ответа: Текcтовый ответ
Комплексный набор методов, подходов и инструментов обработки структурированных и неструктурированных данных колоссальных объемов –это …
Тип ответа: Текcтовый ответ
Компонентом системы машинного зрения является датчик для … частей обнаружения (часто оптический или магнитный датчик), который служит для захвата и обработки изображений
Тип ответа: Текcтовый ответ
Макрокоманда, содержащая последовательность действий, записанных пользователем, – это …
Тип ответа: Текcтовый ответ
Одной из задач машинного зрения является …, например: определение трехмерного движения камеры; слежение, то есть следование за перемещениями объекта (машины, человека)
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- обнаружение
- идентификация
- распознавание
- оценка движения
Операция над данными, с помощью которой можно переупорядочить строки в списке в соответствии с содержанием конкретных столбцов, – это …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- создание данных с заданной структурой
- копирование и переименование рабочего листа
- создание собственного формата данных
- сортировка
Подборка тематически связанных данных, расположенных на одном рабочем листе, – это …
Тип ответа: Текcтовый ответ
После того как первая версия поискового словаря создана, дальнейшие операции …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- всегда совершаются только экспертом
- производятся на основе справочников и словарей вручную
- могут быть возложены на электронно-вычислительную машину
Программный продукт TextAnalyst научно-производственного инновационного центра …, использует для решения задач распознавания слов нейросетевые технологии и, в основном, предназначен для решения задачи автоматического реферирования документов
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- «Микросистемы»
- «МедиаЛингва»
- «Юпитер»
Совокупность методов и средств извлечения их организованных данных для принятия решений – это … данных
Тип ответа: Текcтовый ответ
Согласно принципу трех V английским словом «…» обозначают разнообразие, способность обработки множества типов, источников и форматов данных
Тип ответа: Текcтовый ответ
Создание большого количества различных визуальных представлений одних и тех же данных – это …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- интерпретация
- систематизация
- прототипирование
- визуализация
Среди разработчиков программного обеспечения, реализующих передовые поисковые лингвистические технологии, следует выделить ЗАО «…» – такие разработки этой фирмы, как «Следопыт», «Классификатор» и «Аннотатор», позволяют осуществлять оперативный поиск документов, их индексирование, классификацию и автоматическое аннотирование
Тип ответа: Текcтовый ответ
Структурированные данные часто называют …, что означает, что их объективный и заранее определенный характер позволяет нам легко подсчитывать, измерять и выражать данные в числах
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- формулами
- теоремами
- закономерностями
- количественными данными
Такой метод обработки изображений, как …, используется для поиска и (или) подсчета деталей, его цель заключается в упрощении и/или изменении представления изображения, чтобы его было проще и легче анализировать
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- сегментация
- бинаризация
- измерение
- сопоставление шаблонов
Такой метод обработки изображения, как …, заключается в преобразовании изображения в серых тонах в белые и черные пиксели; значения каждого пикселя условно кодируются как 0 и 1
Тип ответа: Текcтовый ответ
Текстовые данные с неустойчивым форматом, которые для обработки инструментами требуют больших временных затрат на преобразование, – это … данные
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- квазиструктурированные
- неструктурированные
- полуструктурированные
Услуга эвристического поиска, основанного на использовании систем искусственного интеллекта, формирующих расширенный запрос на основе применения специализированных отраслевых тезаурусов и семантических сетей, в Интернете на сегодня …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- практически не представлена
- получает все большее распространение
- представлена очень широко
Установите правильную последовательность действий, если необходимо создать собственный формат данных (лс) и применить его для поля электронной таблицы «Мощность двигателя» (см. рисунок ниже): @02_02_01.jpg
Тип ответа: Сортировка
- 1 сделать активной ячейку в столбце «Мощность двигателя»
- 2 щелчком правой кнопки мыши вызвать контекстное меню и выбрать в нем команду «Формат ячейки»
- 3 в появившемся окне на вкладке «Число» выбрать все форматы
- 4 в поле «Тип» ввести: #0" л. с"
Установите правильную последовательность шагов по созданию макроса, с помощью которого в поле «Цвет» определяются неповторяющиеся значения (эти значения выводятся в ячейке перечислением через запятую):
Тип ответа: Сортировка
- 1 перейти на лист «Исходные данные»
- 2 в ячейку F40 ввести: «Неповторяющиеся значения по полю "Цвет":»
- 3 на вкладке «Вид» в разделе «Макросы» выбрать команду «Запись макроса» (так же на вкладке «Разработчик»)
- 4 в появившемся диалоговом окне ввести название макроса «Цвет» и нажать клавишу ОК
- 5 выполнить все необходимые действия по созданию макроса
- 6 остановить запись макроса
Установите правильную последовательность этапов анализа данных:
Тип ответа: Сортировка
- 1 гипотеза
- 2 сбор и систематизация данных
- 3 подбор модели
- 4 тестирование и интерпретация результатов
- 5 использование
Установите соответствие английского обозначения признака больших данных и характеристики данного признака:
Тип ответа: Сопоставление
- A. Volume
- B. Velocity
- C. Variety
- D. накопленная база данных представляет собой гигантский объем информации, который нуждается в новых подходах и в более усовершенствованных инструментах
- E. увеличивается как скорость накопления данных, так и скорость их обработки
- F. возможна одновременная обработка структурированной и неструктурированной информации различных форматов; главным отличием структурированной информации является возможность классификации
Установите соответствие дат и описаний исторических прорывов в машинном зрении:
Тип ответа: Сопоставление
- A. 1955 г.
- B. 1958 г.
- C. 1960-е гг.
- D. статья О. Селфриджа «Глаза и уши компьютера»
- E. Ф. Розенблатт, компьютерная реализация персептрона
- F. первые системы обработки изображений
Установите соответствие компонентов распознавания текста и их характеристик:
Тип ответа: Сопоставление
- A. Поиск изображений по содержанию
- B. Оценка положения
- C. Оптическое распознавание знаков
- D. нахождение всех изображений в большом наборе изображений, которые имеют определенное различными путями содержание
- E. определение ориентации определенного объекта относительно камеры
- F. символы на изображениях печатного или рукописного текста распознаются обычно для перевода в текстовый формат, наиболее удобный для редактирования или индексации
Установите соответствие основания классификации и соответствующих примеров корпусов текстов:
Тип ответа: Сопоставление
- A. По способу построения
- B. По способу распространения
- C. По назначению
- D. статические и динамические
- E. свободно или частично доступные, закрытые
- F. исследовательские и иллюстративные
Установите соответствие признаков больших данных и их характеристик:
Тип ответа: Сопоставление
- A. Достоверность данных
- B. Ценность накопленной информации
- C. Многообразие
- D. в настоящее время это важнейший критерий для пользователей, поскольку недостоверная информация приводит к затруднению анализа данных
- E. большие данные должны быть полезны в усовершенствовании бизнес-процессов, составлении отчетности или оптимизации расходов компаний
- F. данная характеристика означает возможность одновременной обработки структурированной и неструктурированной информации различных форматов
Установите соответствие примеров и характеристик систем управления реляционными базами данных (СУДБ), инструментов и технологий для обработки данных:
Тип ответа: Сопоставление
- A. MySQL
- B. База данных Oracle
- C. Microsoft SQL Server
- D. одна из самых популярных СУБД с открытым исходным кодом, быстрая и надежная; работает на сервере и позволяет создавать как небольшие, так и большие приложения
- E. продвинутая СУБД с многомодельной структурой; ее можно использовать для хранения данных, обработки онлайн-транзакций и смешанных рабочих нагрузок баз данных
- F. надежная и функциональная система управления реляционными базами данных, которая позволяет хранить и извлекать данные в соответствии с запросами других программных приложений
Установите соответствие элементов специфики работы со неструктурированными данными и их содержания:
Тип ответа: Сопоставление
- A. Преимущества использования неструктурированных данных
- B. У неструктурированных данных все-таки есть структура
- C. Для работы с неструктурированными данными нужны особые методы
- D. запуск очередного проекта по анализу неструктурированных данных может привести к созданию новых технологий, совершению открытий или к экономии денег
- E. порядок организации неструктурированных данных может быть совсем не предназначен для обработки машинными средствами, т.к. структура таких данных слишком сложна и неочевидна
- F. классические компьютерные алгоритмы бесполезны при работе с неструктурированными данными – для этого существуют особые типы инструментов
Установите хронологическую последовательность исторических прорывов в машинном зрении:
Тип ответа: Сортировка
- 1 первые системы обработки изображений
- 2 первые беспилотные системы управления автотранспортом
- 3 корпоративные системы распознавания лиц
Чтобы переименовать рабочий лист электронной таблицы, сначала нужно … кнопки мыши вызвать контекстное меню на ярлыке листа и выбрать в нем команду «Переименовать»
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- щелчком правой
- щелчком левой
- двойным щелчком левой