- Введение
- Тема 1. Большие данные: термины, проблемы
- Тема 2. Понятие алгоритма и вычислимости
- Тема 3. Технологии обработки больших объемов информации
- Тема 4. Структурированная информация: визуализация и выявление связей
- Тема 5. Слабоструктурированная информация на примере звука и изображения. Понятие шума и сигнала
- Тема 6. Разделение звуковых образов на примере отделения голосов людей от эмбиента
- Тема 7. Улучшение видимости изображений: представление цвета в разных координатах, эквализация гистограммы яркости
- Тема 8. Сегментация изображений
- Тема 9. Неструктурированная информация на примере корпуса текстов. Лемматизация, стоп-слова, семантические группы
- Тема 10. Аналитика реального времени и основы теории управления на примере системы стабилизации беспилотных летательных аппаратов
- Заключение
… – это графическое представление распределения тонов в изображении, где по горизонтальной оси отложены уровни яркости, а по вертикальной – количество пикселей для каждого уровня
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Томограмма
- Гистограмма
- График
- Диаграмма рассеяния
… – это комплексные программные решения, которые предоставляют разработчикам удобный интерфейс для написания, тестирования и отладки кода
Тип ответа: Текcтовый ответ
… – это подраздел искусственного интеллекта, связанный с разработкой алгоритмов, которые могут обучаться и делать прогнозы на основе данных
Тип ответа: Текcтовый ответ
… – это примеры использования временных рядов в области экономики и финансов
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Ежедневные цены акций, курс валют, экономические индикаторы, (например, индексы потребительских цен)
- Ежечасные или ежедневные данные о температуре, осадках, влажности
- Ежемесячные или годовые данные о продажах, показатели трафика веб-сайтов, статистика клиентских обращений
… – это процесс преобразования входных данных в выходные в контексте алгоритмов
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Компиляция
- Итерация
- Отображение
- Энкодинг
… – это раздел компьютерных наук, посвященный созданию машин, способных выполнять задачи, требующие человеческого интеллекта
Тип ответа: Текcтовый ответ
… – это разделение звуковых образов, которое применяется для восстановления записей с мест преступлений или инцидентов, где важно изолировать речь или другие звуки из фонового шума для дальнейшего анализа
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Преобразование Фурье
- Форензика
- Временные окна фильтров
- Развертка временных рядов
… – это распределенная база данных, разработанная для обработки больших объемов данных на множестве серверов без единой точки отказа; обеспечивает высокую доступность и масштабируемость
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
… – это статистическая мера, отражающая степень взаимосвязи между двумя или более переменными
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Детерминация
- Корреляция
- Визуализация
- Отображение
… в контексте текстовой информации – это процесс группировки слов или предложений таким на основе их семантической близости или других схожих характеристик
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Сегментация
- Кластеризация
- Дилатация
- Лемматизация
… информация – это данные, организованные в четком и упорядоченном формате, часто хранящиеся в таблицах или базах данных, где каждая запись имеет одинаковую структуру
Тип ответа: Текcтовый ответ
… обучение – это подраздел машинного обучения, в котором используются нейронные сети с множеством уровней (слоев) для извлечения высокоуровневых признаков из данных
Тип ответа: Текcтовый ответ
… операции (эрозия, дилатация, открытие и закрытие) – это набор инструментов для обработки изображений, основанных на форме или структуре объектов
Тип ответа: Текcтовый ответ
… подход – это метод, сочетающий несколько различных техник или технологий для достижения оптимального результата, например, сочетание масштабируемости и распараллеливания для повышения производительности системы
Тип ответа: Текcтовый ответ
…, или элемент изображения, является базовой единицей, определяющей визуальное представление изображения на экране или в цифровом файле. Каждый пиксель содержит информацию о цвете и яркости, что позволяет создавать сложные и многоцветные изображения
Тип ответа: Текcтовый ответ
Аналитика реального времени – это …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- исследование исторических данных
- процесс сбора и анализа данных немедленно после их поступления
- моделирование будущих событий
- создание отчетов по данным за предыдущий год
В информатике основой для программного кода, управляющего обработкой данных, являются …
Тип ответа: Текcтовый ответ
В широком смысле алгоритм можно определить как …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- процесс шифрования данных
- набор инструкций или правил для выполнения определенной задачи
- устройство для обработки информации
- программа для обучения искусственного интеллекта
Говоря о кластеризации, можно утверждать, что она … (укажите 2 варианта ответа)
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- представляет собой процесс установления личности автора анонимного текста
- позволяет структурировать большие объемы текстовых данных, выявляя в них скрытые паттерны и темы
- может использоваться для идентификации синонимов или тематически связанных терминов в больших текстовых корпусах
Говоря о том, как временные окна фильтров влияют на аудиосигнал, можно утверждать, что они …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- повышают его частоту дискретизации
- изменяют амплитуду аудиосигнала во временной области
- позволяют анализировать и модифицировать сигнал в различные моменты времени
Данные, не имеющие заранее определенной структуры или формата, включая тексты, изображения, аудио и видео, – это …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- неструктурированная информация
- сведения
- факты
- приблизительные данные
Диаграмма разброса – это …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- визуализация для отображения изменений данных со временем
- график, показывающий взаимосвязь между двумя переменными
- визуализация для представления иерархии данных
- диаграмма, отображающая частоту в заданном наборе данных
Звук представляется в цифровой форме …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- в виде последовательности цветов
- как серия амплитуд, записанных в дискретные моменты времени
- через текстурные масштабы
- как двумерный массив пикселей
Наборы данных, которые из-за своего объема, скорости генерации и разнообразия не могут быть обработаны традиционными методами баз данных, – это …
Тип ответа: Текcтовый ответ
Область искусственного интеллекта, занимающаяся разработкой алгоритмов, способных обучаться и делать предсказания или решения на основе данных, – это …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- машинное обучение
- глубокое обучение
- экспертные системы
- компьютерное зрение
Основной принцип распараллеливания в вычислениях – …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- увеличение объема оперативной памяти
- разделение задачи на подзадачи для одновременного выполнения
- ускорение процессора
- увеличение пропускной способности сети
Преобразование … – это математический инструмент, позволяющий переходить между временным и частотным представлениями звукового сигнала, выявляя составляющие его частоты.
Тип ответа: Текcтовый ответ
Проклятием размерности в анализе данных называют …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- увеличение времени обработки данных с увеличением их объема
- сложности, возникающие при работе с данными большого объема
- возрастание сложности и уменьшение точности анализа данных при увеличении их размерности
- проблемы с хранением больших объемов данных
Процесс определения эмоционального оттенка текста, например, определение того, является ли отзыв положительным, негативным или нейтральным, – это …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- информативный анализ текста
- анализ настроений
- стилистический анализ текста
- лингвистический анализ текста
Расположите события в хронологическом порядке:
Тип ответа: Сортировка
- 1 опубликована теорема Гёделя о неполноте
- 2 Алан Тьюринг сформулировал проблему остановки
- 3 разработана первая машина Тьюринга
Расположите шаги оптимизации системы в логическом порядке:
Тип ответа: Сортировка
- 1 анализ текущей производительности
- 2 оценка потенциальных улучшений
- 3 реализация изменений
- 4 мониторинг эффективности внесенных изменений
Расстояние … – это мера различия между двумя строками одинаковой длины, определяемая количеством позиций, на которых соответствующие символы этих строк различны
Тип ответа: Текcтовый ответ
Расстояние … – это метрика, измеряющая разницу между двумя строками текста как минимальное количество односимвольных изменений (вставки, удаления, замены), необходимых для преобразования одной строки в другую
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Хэмминга
- Левенштейна
- Махаланобиса
Сокращение «ПИД-регуляторы» расшифровывается как «пропорционально-…-дифференциальные регуляторы»
Тип ответа: Текcтовый ответ
Существуют различные программы для обработки звука, в частности, … – это бесплатная и открытая программа для записи и редактирования аудиофайлов, которая поддерживает множество форматов файлов, имеет инструменты для обрезки, наложения эффектов, изменения скорости воспроизведения и многое другое
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Audacity
- Logic Pro
- Adobe Audition
- Pro Tools
Теория … – это раздел прикладной математики, изучающий поведение динамических систем и способы их управления для достижения желаемых результатов
Тип ответа: Текcтовый ответ
Упорядочьте шаги создания HDR-изображения:
Тип ответа: Сортировка
- 1 съемка с разной экспозицией
- 2 комбинирование снимков
- 3 тоновая коррекция
Установите правильную последовательность шагов разработки системы стабилизации беспилотных летательных аппаратов (БПЛА):
Тип ответа: Сортировка
- 1 моделирование поведения системы
- 2 применение алгоритмов управления
- 3 аналитика реального времени
- 4 тестирование прототипа
Установите соответствие алгоритмов сортировки и их характеристик:
Тип ответа: Сопоставление
- A. Сортировка пузырьком
- B. Быстрая сортировка
- C. Сортировка слиянием
- D. алгоритм повторно проходит через список, сравнивает соседние элементы и меняет их местами, если они находятся в неправильном порядке (процесс повторяется, пока список не будет отсортирован)
- E. алгоритм использует стратегию «разделяй и властвуй», выбирая опорный элемент и переставляя другие, чтобы элементы меньше опорного оказались перед ним, а больше – после
- F. алгоритм применяет принцип «разделяй и властвуй», он разделяет массив на две части, рекурсивно сортирует их и затем сливает в отсортированном порядке
Установите соответствие алгоритмов, работающих с битовыми последовательностями, и их примеров:
Тип ответа: Сопоставление
- A. Алгоритмы шифрования
- B. Алгоритмы сжатия данных
- C. Алгоритмы хеширования
- D. AES
- E. ZIP, JPEG
- F. SHA-256
Установите соответствие видов нейронных сетей и их сокращенных английских обозначений:
Тип ответа: Сопоставление
- A. Свёрточные нейронные сети
- B. Рекуррентные нейронные сети
- C. Глубокие нейронные сети
- D. CNN
- E. RNN
- F. DNN
Установите соответствие методов визуализации и их характеристик:
Тип ответа: Сопоставление
- A. Тепловые карты
- B. Парные диаграммы
- C. Трехмерные графики
- D. особенно полезны для визуализации матриц корреляций или взаимодействий между множеством переменных
- E. позволяют одновременно визуализировать распределения каждой переменной и корреляции между всеми парами переменных
- F. используются для визуализации взаимосвязей между тремя переменными одновременно
Установите соответствие методов и их характеристик:
Тип ответа: Сопоставление
- A. Развертка временных рядов
- B. Метод главных компонент (PCA)
- C. Метод «гусеницы»
- D. метод обработки данных, при котором одномерный временной ряд преобразуется в многомерное пространство для детального анализа
- E. статистическая процедура, используемая для уменьшения размерности набора данных, с сохранением максимального количества вариативности
- F. метод анализа временных рядов, при котором данные представляются в виде последовательно перекрывающихся сегментов для выявления повторяющихся паттернов
Установите соответствие морфологических операций и их характеристик:
Тип ответа: Сопоставление
- A. Эрозия
- B. Дилатация
- C. Открытие
- D. Закрытие
- E. морфологическая операция, уменьшающая объекты на изображении путем удаления пикселей с их границ
- F. морфологическая операция, которая расширяет объекты на изображении, добавляя пиксели к их границам
- G. комбинация морфологических операций, которая используется для удаления мелких объектов и разъединения объектов, находящихся близко друг к другу
- H. комбинация морфологических операций, которая применяется для заполнения мелких дыр и промежутков в объектах, а также для сглаживания их границ
Установите соответствие областей и примеров использования морфологической операции открытия для улучшения сегментации:
Тип ответа: Сопоставление
- A. Медицинская визуализация
- B. Наблюдение за Землей
- C. Автоматическая обработка видео
- D. операция открытия используется для устранения шума и артефактов на изображениях, полученных с помощью магнитно-резонансной томографии (МРТ) и компьютерной томографии (КТ)
- E. операция открытия применяется для выделения и разделения географических объектов: рек, дорог и населенных пунктов
- F. операция открытия может быть использована для удаления мелких движущихся объектов, таких как птицы или листья, или при мониторинге более значимых событий или объектов
Установите соответствие областей, в которых находят применение сверточные нейросети (CNN), и соответствующих примеров применения CNN:
Тип ответа: Сопоставление
- A. Автоматическое распознавание лиц
- B. Анализ медицинских изображений
- C. Системы автономного вождения
- D. системы безопасности и идентификации личности
- E. диагностика на основе анализа рентгеновских снимков и магнитно-резонансной томографии
- F. обработка визуальной информации для навигации и обнаружения препятствий
Установите соответствие основных применений преобразования Фурье и их характеристик:
Тип ответа: Сопоставление
- A. Аудиоанализ
- B. Обработка речи
- C. Синтез звука
- D. определение частотного состава музыкальных произведений, звуков природы или шумов
- E. улучшение понимания и распознавания речи путем анализа частотных компонентов речевого сигнала
- F. создание звуков с использованием музыкальных инструментов и эффектов путем манипулирования частотными характеристиками
Установите соответствие основных сфер применения больших данных и их характеристик:
Тип ответа: Сопоставление
- A. Маркетинг и реклама
- B. Финансы
- C. Производство
- D. Транспорт
- E. в данной сфере большие данные используются для глубокого понимания потребностей и предпочтений клиентов
- F. в данной сфере большие данные играют решающую роль в управлении рисками и принятии обоснованных решений; аналитика данных помогает оценивать кредитные риски и предсказывать рыночные тенденции
- G. в данной сфере большие данные используются для оптимизации производственных процессов, управления качеством продукции и предсказания спроса
- H. в данной отрасли анализ больших данных помогает улучшить управление трафиком и планирование транспортных потоков
Установите соответствие основных сфер применения больших данных и их характеристик:
Тип ответа: Сопоставление
- A. Социальные сети и медиа
- B. Научные исследования
- C. Образование
- D. большие данные используются для анализа пользовательского поведения и предпочтений
- E. большие данные открывают новые горизонты для анализа сложных явлений; анализ огромных наборов данных приводит к новым научным открытиям
- F. большие данные применяются для улучшения учебных методик и персонализации обучения
Установите соответствие особенностей цветового пространства RGB и того, в чем заключаются эти особенности:
Тип ответа: Сопоставление
- A. Аддитивная модель
- B. Широкий gamut (цветовая гамма)
- C. Универсальность
- D. свет разных цветов смешивается для создания новых оттенков
- E. RGB позволяет воспроизводить большое количество цветов, что делает его подходящим для электронных дисплеев
- F. RGB широко используется в цифровых камерах, мониторах, телевизорах и прочей технике
Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
- A. Моделирование
- B. Прогнозирование
- C. Аналитика реального времени
- D. процесс создания математической или компьютерной модели для имитации реальных процессов или систем
- E. анализ текущих данных для предсказания будущих событий или состояний системы
- F. процесс анализа данных и получение результатов немедленно после их сбора
Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
- A. Распознавание образов
- B. Классификация изображений
- C. Детекция объектов
- D. задача идентификации объектов, узоров или других элементов в данных, часто с использованием сверточных нейросетей для анализа изображений
- E. процесс определения категории или класса, к которому принадлежит изображение, на основе его визуальных характеристик
- F. задача обнаружения и локализации объектов на изображении, включая определение их границ
Установите соответствие понятий и их содержания:
Тип ответа: Сопоставление
- A. Теория множеств
- B. Лямбда-исчисление
- C. Конечный автомат
- D. область математики, занимающаяся изучением множеств или коллекций объектов, которые могут быть числами, символами или другими множествами
- E. форма символьной логики, используемая для описания функций и их применений; является фундаментом для понимания функционального программирования и теории вычислимости
- F. модель вычислений, представляющая систему с ограниченным числом состояний и правилами перехода между этими состояниями; используется в теории алгоритмов и для разработки программного обеспечения
Установите соответствие понятия и его определения:
Тип ответа: Сопоставление
- A. Вычислительная сложность
- B. Временная сложность
- C. Пространственная сложность
- D. мера количества ресурсов, необходимых для выполнения алгоритма, включая время выполнения и объем занимаемой памяти
- E. мера количества времени, необходимого для выполнения алгоритма, часто выражаемая в виде функции от размера входных данных
- F. мера количества памяти, необходимой для обработки алгоритма, в зависимости от размера входных данных
Установите соответствие терминов и их значений:
Тип ответа: Сопоставление
- A. Токенизация
- B. Деанонимизация
- C. Стемминг
- D. разделение текста на слова; является фундаментальным этапом в обработке естественного языка
- E. процесс установления личности автора анонимного текста
- F. процесс сведения слов к их основной (корневой) форме путем удаления окончаний и суффиксов
Установите соответствие техник для коррекции контраста и их характеристик:
Тип ответа: Сопоставление
- A. Линейная коррекция контраста
- B. Кривые уровней
- C. Адаптивные методы
- D. увеличение разницы между светлыми и темными участками изображения путем масштабирования гистограммы яркости
- E. более тонкая настройка контраста путем изменения формы гистограммы яркости для различных участков изображения, что обеспечивает больший контроль над светлыми, средними и темными тонами
- F. автоматический анализ изображения для оптимизации контраста в зависимости от содержания изображения, что особенно полезно в случаях с неоднородным освещением
Установите соответствие характеристик больших данных и их описаний:
Тип ответа: Сопоставление
- A. Объем (Volume)
- B. Скорость (Velocity)
- C. Разнообразие (Variety)
- D. характеристика больших данных, относящаяся к количеству генерируемых и хранимых данных
- E. характеристика больших данных, относящаяся к темпу, с которым данные генерируются, обрабатываются и анализируются
- F. аспект больших данных, относящийся к различным типам и форматам данных, с которыми необходимо работать
Установите соответствие цветовых пространств и их особенностей:
Тип ответа: Сопоставление
- A. CMYK
- B. HSV
- C. LAB
- D. идеально подходит для печатных изделий, где цвета создаются путем поглощения света
- E. соответствует человеческому восприятию (описанию) цветов, упрощая их коррекцию и настройку
- F. охватывает весь спектр цветов, воспринимаемых человеком, используется для точных цветокоррекций и цветового анализа
Установите элементы применения лемматизации в анализе текстов и их характеристики:
Тип ответа: Сопоставление
- A. Поиск по ключевым словам
- B. Классификация текста и кластеризация
- C. Извлечение информации
- D. улучшает точность и полноту поиска, позволяя находить документы, содержащие разные формы слова
- E. помогает группировать тексты по смыслу, уменьшая влияние грамматических вариаций слов на процесс классификации
- F. облегчает процесс извлечения специфических данных из текста, таких как имена, даты, местоположения, уменьшая количество вариаций каждого извлекаемого элемента