- Введение в курс
- Тема 1. Понятие анализа данных. Описательная статистика
- Тема 2. Генеральная и выборочная совокупности
- Тема 3. Корреляционный анализ
- Тема 4. Дисперсионный анализ
- Тема 5. Снижение размерности признакового пространства
- Тема 6. Классификация многомерных наблюдений
- Тема 7. Робастное оценивание параметров и непараметрические модели генеральной совокупности
- Заключение
- Итоговая аттестация
… – это метод ортогонального вращения, при котором минимизируется число факторов, необходимых для объяснения исходных переменных
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Варимакс
- Квартимакс
- Прямой облимин
… – это многомерная статистическая процедура, которая выполняет сбор данных, содержащих информацию о выборке, и затем упорядочивает объекты в однородные группы
Тип ответа: Текcтовый ответ
… – это статистические методы, которые позволяют получать надежные оценки параметров с учетом неизвестного закона распределения генеральной совокупности и наличия существенных отклонений в значениях данных
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Непараметрические методы
- Параметрические методы
- Методы робастного оценивания
… (средняя точка) – это средние значения для дискриминантных показателей конкретной группы
Тип ответа: Текcтовый ответ
… зависимость – это связь, при которой каждому фиксированному значению переменой х соответствует не одно, а множество значений зависимой переменной у, причем заранее нельзя сказать, какое именно значение примет у
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Функциональной
- Статистическая
- Прямая
- Обратная
… используют в иерархических алгоритмах классификаций, принцип работы которых – последовательно объединять наблюдения, а затем и целые группы, сначала самых близкие, а затем все более и более отдаленные друг от друга
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Расстояние между группами элементов
- Взвешенное евклидово расстояние
- Евклидово расстояние
… корреляция измеряет степень связи между дискриминантными показателями и группами, т.е. определяет принадлежность к данной группе
Тип ответа: Текcтовый ответ
… коэффициенты корреляции – это линейные коэффициенты корреляции между каждым из предикторов и дискриминантной функцией
Тип ответа: Текcтовый ответ
… критерия – это величина 1 – β, где β – вероятность ошибки второго рода
Тип ответа: Текcтовый ответ
… методы – это методы, подчиненные некоторым частным целевым установкам, но не формулируемые в терминах вероятностно-статистической теории
Тип ответа: Текcтовый ответ
… модели регрессии – это соответствие теоретических данных, полученных на основе уравнения регрессии, фактическим статистическим данным
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Адекватность
- Надежность
- Линейность
- Простота
… регрессия представляет собой регрессию между двумя переменными
Тип ответа: Текcтовый ответ
… регрессия представляет собой регрессию между одной эндогенной и несколькими экзогенными переменными
Тип ответа: Текcтовый ответ
… эффект – это смещение среднего значения и увеличение меры разброса значений признака при наличии нескольких выбросов
Тип ответа: Текcтовый ответ
Тип ответа: Текcтовый ответ
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Интервальные временные данные
- Моментные временные данные
- Пространственно-временные данные
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Коэффициент ассоциации
- Коэффициент контингенции
- Коэффициент взаимной сопряженности Пирсона
- Коэффициент Фехнера
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Коэффициент ассоциации
- Коэффициент взаимной сопряженности Пирсона
- Коэффициент Фехнера
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Координата у равна -2
- Координата у равна -1
- Координата у равна 3
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Собственное значение λ2 равно 3
- Собственное значение λ2 равно 2
- Собственное значение λ2 равно 1
В кластерном анализе используют различные виды расстояний. Один из этих видов применяют в тех случаях, когда каждой компоненте xt вектора наблюдений X удается приписать некоторый «вес» wp, пропорционально степени важности признака в задаче классификации. Принимают вес больше 0 и меньше 1. Чтобы определить «вес», нужно провести с дополнительные исследования, например, организовать опрос экспертов и обработать их мнения. О каком виде расстояний говорится в описании?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Евклидово расстояние
- «Взвешенное» евклидово расстояние
- Расстояние по принципу «ближайшего соседа»
В отличие от дисперсионного и регрессионного анализов … анализ ANCOVA оперирует с набором предикторов, который включает как качественные группообразующие переменные, так и количественные переменные, измеренные в непрерывных шкалах
Тип ответа: Текcтовый ответ
Вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности характеризует … дисперсия
Тип ответа: Текcтовый ответ
Вероятность γ, с которой осуществляется событие |ΘГ-Θв |<δ, – это … оценки Θв
Тип ответа: Текcтовый ответ
Данные, при составлении которых у каждого наблюдения регистрируется несколько признаков, – это … данные
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- первичные
- пространственно-временные
- непрерывные
- многомерные
Имеется следующая выборка: 4, 6, 8, 9, 9, 12, 12, 14, 15, 18. Рассчитайте 10-процентное винзорированное среднее для этой выборки.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
Критерий … выборки показывает степень применимости факторного анализа к данной выборке
Тип ответа: Текcтовый ответ
Любое предположение относительно закона распределения исследуемой случайной величины X называется …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- статистической гипотезой
- простой гипотезой
- сложной гипотезой
- теорией
Нечувствительность к малым отклонениям от предположений – это …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- робастность
- усечение выборки
- бутстрепирование
При определении влияния квалификации рабочего на его производительность были получены следующие значения общей и средней внутригрупповой дисперсии: - общая дисперсия – 900; - средняя внутригрупповая дисперсия – 300. Чему равна межгрупповая дисперсия?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Межгрупповая дисперсия равна 1200
- Межгрупповая дисперсия равна 600
- Межгрупповая дисперсия равна 300
Расположите в правильной последовательности этапы проведения факторного анализа:
Тип ответа: Сортировка
- 1 вычисление корреляционной матрицы для всех переменных
- 2 выбор факторов
- 3 создание упрощенной структуры
- 4 проверка значимости модели
- 5 интерпретация результатов
Установите правильную последовательность шагов алгоритма проверки статистической гипотезы:
Тип ответа: Сортировка
- 1 задать уровень значимости α, выбрать статистический критерий К, вычислить по таблицам для закона распределения К значение Ккр; определить вид критической области
- 2 по выборке вычислить наблюдаемое значение критерия Кнабл
- 3 если Кнабл попадает в критическую область, гипотеза Н0 отвергается; при попадании Кнабл в область принятия гипотезы гипотеза Н0 принимается
Установите правильную последовательность шагов проведения расчета однофакторного дисперсионного анализа в MS Excel:
Тип ответа: Сортировка
- 1 сформировать таблицу с исходными данными
- 2 выбрать «Пакет анализа» в появившемся диалоговом окне метод «Однофакторный дисперсионный анализ» и нажать кнопку OK
- 3 в окне «Однофакторный дисперсионный анализ» установить для входных данных следующие параметры: входной интервал $R$2:$W$3, группирование – по строкам метки – выбранный нами входной диапазон не содержит метки, то есть названий строк и столбцов, альфа уровень значимости = 0,05
- 4 для параметров вывода установить переключатель в положение «Выходной интервал» и указать клетку с координатой P27
- 5 после завершения настройки параметров нажать «OK» (результаты дисперсионного анализа будут состоять из двух таблиц)
Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
- A. Интегральный показатель кластеризации
- B. Коэффициент результативности
- C. Коэффициент Уилкса (U-статистика)
- D. функция, зависящая от исходных признаков, используемая для многомерной кластеризации в случае невозможности упорядочить классификационные признаки
- E. сумма элементов, лежащих на диагонали классификационной матрицы, деленная на общее количество случаев
- F. отношение внутригрупповой суммы квадратов к общей сумме квадратов
Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
- A. Ковариация
- B. Корреляция
- C. Регрессия
- D. среднее произведение отклонений признаков от их средних квадратических отклонений
- E. величина, отражающая наличие связи между явлениями, процессами и характеризующими их показателями
- F. величина, выражающая зависимость среднего значения случайной величины у от значений случайной величины х
Установите соответствие понятий и их характеристик:
Тип ответа: Сопоставление
- A. Внутригрупповая дисперсия
- B. Межгрупповая дисперсия
- C. Эмпирический коэффициент детерминации
- D. Эмпирическое корреляционное отношение
- E. показывает ту часть вариации признака, которая обусловлена действием всех факторов, кроме группировочного
- F. показывает ту часть общей дисперсии, которая обусловлена действием группировочного фактора
- G. показывает долю общей дисперсии изучаемого признака, обусловленную фактором, положенным в основание группировки
- H. показывает количественную оценку влияния факторного признака на вариацию результативного признака
Установите соответствие понятия и его математического выражения:
Тип ответа: Сопоставление
Установите соответствие шкалы и ее характеристики:
Тип ответа: Сопоставление
- A. Номинальная шкала
- B. Порядковая шкала
- C. Интервальная шкала
- D. используется для описания принадлежности элементов к определенным классам
- E. используется для упорядочения элементов по одному или нескольким признакам
- F. показывает, насколько одно значение больше другого в принятых единицах измерения
Эта величина является мерой разброса чисел в ряду. Она определяется как среднее арифметическое квадратов отклонений чисел от их среднего арифметического. О каком понятии идет речь?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
Этот способ визуализации данных используют, чтобы графически отобразить и анализировать категориальные номинальные данные. Это гистограмма, которая изображает частоты встречаемости признака в убывающем порядке, на которую накладывают точечно-линейный график из накопленных частот или процентов, долей. График отражает накопленную частоту значений признака. Назовите данный способ визуализации данных.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Диаграмма Парето
- Тепловая карта
- Диаграмма рассеяния