- Введение в курс
- Тема 1. Понятие анализа данных. Описательная статистика
- Тема 2. Генеральная и выборочная совокупности
- Тема 3. Корреляционный анализ
- Тема 4. Дисперсионный анализ
- Тема 5. Снижение размерности признакового пространства
- Тема 6. Классификация многомерных наблюдений
- Тема 7. Робастное оценивание параметров и непараметрические модели генеральной совокупности
- Заключение
- Итоговая аттестация
… – это метод ортогонального вращения, при котором минимизируется число факторов, необходимых для объяснения исходных переменных
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Варимакс
- Квартимакс
- Прямой облимин
… – это многомерная статистическая процедура, которая выполняет сбор данных, содержащих информацию о выборке, и затем упорядочивает объекты в однородные группы
Тип ответа: Текcтовый ответ
… – это способ нахождения промежуточных значений функции в области ее определения
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Корреляция
- Дисперсия
- Интерполяция
- Детерминация
… – это статистические методы, которые позволяют получать надежные оценки параметров с учетом неизвестного закона распределения генеральной совокупности и наличия существенных отклонений в значениях данных
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Непараметрические методы
- Параметрические методы
- Методы робастного оценивания
… (средняя точка) – это средние значения для дискриминантных показателей конкретной группы
Тип ответа: Текcтовый ответ
… выборки – это отбрасывание определенной части минимальных и/или максимальных наблюдений
Тип ответа: Текcтовый ответ
… зависимость – это связь, при которой каждому фиксированному значению переменой х соответствует не одно, а множество значений зависимой переменной у, причем заранее нельзя сказать, какое именно значение примет у
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Функциональной
- Статистическая
- Прямая
- Обратная
… используют в иерархических алгоритмах классификаций, принцип работы которых – последовательно объединять наблюдения, а затем и целые группы, сначала самых близкие, а затем все более и более отдаленные друг от друга
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Расстояние между группами элементов
- Взвешенное евклидово расстояние
- Евклидово расстояние
… корреляционная матрица – это матрица корреляции, при вычислении которой наблюдения обрабатывают так, как будто они взяты из одной выборки
Тип ответа: Текcтовый ответ
… корреляция измеряет степень связи между дискриминантными показателями и группами, т.е. определяет принадлежность к данной группе
Тип ответа: Текcтовый ответ
… коэффициент детерминации характеризует долю межгрупповой дисперсии в общей дисперсии
Тип ответа: Текcтовый ответ
… коэффициенты корреляции – это линейные коэффициенты корреляции между каждым из предикторов и дискриминантной функцией
Тип ответа: Текcтовый ответ
… критерия – это величина 1 – β, где β – вероятность ошибки второго рода
Тип ответа: Текcтовый ответ
… методы – это методы, подчиненные некоторым частным целевым установкам, но не формулируемые в терминах вероятностно-статистической теории
Тип ответа: Текcтовый ответ
… модели регрессии – это соответствие теоретических данных, полученных на основе уравнения регрессии, фактическим статистическим данным
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Адекватность
- Надежность
- Линейность
- Простота
… обследование предполагает измерение каждого из объектов генеральной совокупности
Тип ответа: Текcтовый ответ
… регрессия представляет собой регрессию между двумя переменными
Тип ответа: Текcтовый ответ
… регрессия представляет собой регрессию между одной эндогенной и несколькими экзогенными переменными
Тип ответа: Текcтовый ответ
… эффект – это смещение среднего значения и увеличение меры разброса значений признака при наличии нескольких выбросов
Тип ответа: Текcтовый ответ
Тип ответа: Текcтовый ответ
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Интервальные временные данные
- Моментные временные данные
- Пространственно-временные данные
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Коэффициент ассоциации
- Коэффициент контингенции
- Коэффициент взаимной сопряженности Пирсона
- Коэффициент Фехнера
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Коэффициент ассоциации
- Коэффициент взаимной сопряженности Пирсона
- Коэффициент Фехнера
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Координата у равна -2
- Координата у равна -1
- Координата у равна 3
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Собственное значение λ2 равно 3
- Собственное значение λ2 равно 2
- Собственное значение λ2 равно 1
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Евклидово расстояние d13 равно 3
- Евклидово расстояние d13 равно 5
- Евклидово расстояние d13 равно 9
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Алгоритм Роббинса–Монро
- Алгоритм Литвакова
- Алгоритм Кестена
В кластерном анализе используют различные виды расстояний. Один из этих видов – расстояние в городских кварталах, когда от А до Б мы можем передвигаться по улицам под прямым углом и никогда по диагонали. Такое расстояние зависит от вращения системы координат, но не зависит от отражения относительно оси координат или переноса. О каком виде расстояний говорится в описании?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Евклидово расстояние
- Расстояние по принципу «ближайшего соседа»
- Манхэттенское расстояние
В кластерном анализе используют различные виды расстояний. Один из этих видов применяют в тех случаях, когда каждой компоненте xt вектора наблюдений X удается приписать некоторый «вес» wp, пропорционально степени важности признака в задаче классификации. Принимают вес больше 0 и меньше 1. Чтобы определить «вес», нужно провести с дополнительные исследования, например, организовать опрос экспертов и обработать их мнения. О каком виде расстояний говорится в описании?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Евклидово расстояние
- «Взвешенное» евклидово расстояние
- Расстояние по принципу «ближайшего соседа»
В отличие от дисперсионного и регрессионного анализов … анализ ANCOVA оперирует с набором предикторов, который включает как качественные группообразующие переменные, так и количественные переменные, измеренные в непрерывных шкалах
Тип ответа: Текcтовый ответ
Вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности характеризует … дисперсия
Тип ответа: Текcтовый ответ
Вероятность γ, с которой осуществляется событие |ΘГ-Θв |<δ, – это … оценки Θв
Тип ответа: Текcтовый ответ
Данные, при составлении которых у каждого наблюдения регистрируется несколько признаков, – это … данные
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- первичные
- пространственно-временные
- непрерывные
- многомерные
Данные, при составлении которых у каждого наблюдения регистрируется только один признак, – это … данные
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- одномерные
- первичные
- числовые
Диаграмма в виде столбцов, по оси абсцисс которой отображаются все возможные значения переменной, а по оси ординат – частоты или относительные частоты каждого значения, – это …
Тип ответа: Текcтовый ответ
Если при построении статистических моделей функциональный вид распределения наблюдений задается, то такие модели называются …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- параметрическими
- непараметрическими
- статистическими
- независимыми
Имеется следующая выборка: 4, 6, 8, 9, 9, 12, 12, 14, 15, 18. Рассчитайте 10-процентное винзорированное среднее для этой выборки.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
Имеется следующая выборка: 4, 6, 8, 9, 9, 12, 12, 14, 15, 18. Рассчитайте 10-процентное усеченное среднее для этой выборки.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
К непараметрическим робастным методам относят … (укажите 2 варианта ответа)
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- метод последовательного перехода к новой системе координат
- ядерные оценки
- метод максимального правдоподобия
- процедуру Роббинса–Монро
- алгоритм Литвакова
К робастным методам построения регрессии относят … (укажите 2 варианта ответа)
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- метод наименьших квадратов
- метод максимального правдоподобия
- стохастическую аппроксимацию
- факторный анализ
- дисперсионный анализ
Критерий … выборки показывает степень применимости факторного анализа к данной выборке
Тип ответа: Текcтовый ответ
Любое предположение относительно закона распределения исследуемой случайной величины X называется …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- статистической гипотезой
- простой гипотезой
- сложной гипотезой
- теорией
Метод максимального правдоподобия основывается на формуле …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
Метод, направленный на выявление выбросов, снижение их влияния или исключение их из выборки, называется …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- робастным
- независимым
- факторным
- кластерным
Нечувствительность к малым отклонениям от предположений – это …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- робастность
- усечение выборки
- бутстрепирование
По выборке Х1, …, Х100 из распределения F(x,θ) требуется проверить гипотезу о том, что неизвестный параметр θ равен 5 против альтернативы, что значение параметра θ больше 5. Для проверки этой гипотезы применяется некоторый состоятельный критерий. Уровень значимости этого критерия равен 0,05. Какое значение может принимать функция мощности этого критерия в точке 6?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- 0,05
- Меньше, чем 0,05
- Больше, чем 0,05
- В окрестности 0,05
Предварительный способ анализа выборки, заключающийся в присваивании одинаковых значений крайним наблюдениям выборки, называется методом …
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Пуанкаре
- Винзора
- цензурирования
- максимального правдоподобия
При наличии аномальных наблюдений предварительным способом анализа выборки может являться … выборки (укажите 3 варианта ответа)
Тип ответа: Множественный выбор • с выбором нескольких правильных ответов из предложенных вариантов
- усечение
- винзорирование
- цензурирование
- интегрирование
- группировка
При определении влияния квалификации рабочего на его производительность были получены следующие значения общей и межгрупповой дисперсии: - общая дисперсия – 900; - межгрупповая дисперсия – 370. Чему равна средняя внутригрупповая дисперсия?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Средняя внутригрупповая дисперсия равна 530
- Средняя внутригрупповая дисперсия равна 1070
- Средняя внутригрупповая дисперсия равна 243
При определении влияния квалификации рабочего на его производительность были получены следующие значения общей и средней внутригрупповой дисперсии: - общая дисперсия – 900; - средняя внутригрупповая дисперсия – 300. Чему равна межгрупповая дисперсия?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Межгрупповая дисперсия равна 1200
- Межгрупповая дисперсия равна 600
- Межгрупповая дисперсия равна 300
Процент цензурированных наблюдений относительно полного объема выборки – это …
Тип ответа: Текcтовый ответ
Расположите в правильной последовательности этапы проведения факторного анализа:
Тип ответа: Сортировка
- 1 вычисление корреляционной матрицы для всех переменных
- 2 выбор факторов
- 3 создание упрощенной структуры
- 4 проверка значимости модели
- 5 интерпретация результатов
Статистическая оценка генерального параметра Θ_Г, которая определяется одним числом, называется … оценкой
Тип ответа: Текcтовый ответ
Уравнение … математически выражает среднюю величину одного признака как функцию другого
Тип ответа: Текcтовый ответ
Установите правильную последовательность шагов алгоритма проверки статистической гипотезы:
Тип ответа: Сортировка
- 1 задать уровень значимости α, выбрать статистический критерий К, вычислить по таблицам для закона распределения К значение Ккр; определить вид критической области
- 2 по выборке вычислить наблюдаемое значение критерия Кнабл
- 3 если Кнабл попадает в критическую область, гипотеза Н0 отвергается; при попадании Кнабл в область принятия гипотезы гипотеза Н0 принимается
Установите правильную последовательность шагов алгоритма, который используется, чтобы найти кластеры по методу k-средних:
Тип ответа: Сортировка
- 1 инициализировать (пользователь выбирает число К кластеров и назначает К гипотетических центров)
- 2 обновить кластеры (при заданных К центрах ck (k = 1, 2, ..., K) каждый объект i приписывать одному из центров по правилу минимального расстояния)
- 3 обновить центры (вычислить арифметический центр каждого кластера Sk, который и назначают новым центром ck (k = 1, 2, ..., K))
- 4 применить правило остановки (новые центры ck сравнить со старыми; если ck=ck для каждого k = 1, 2, ..., K – остановить вычисления и выдать результаты)
Установите правильную последовательность шагов проведения расчета однофакторного дисперсионного анализа в MS Excel:
Тип ответа: Сортировка
- 1 сформировать таблицу с исходными данными
- 2 выбрать «Пакет анализа» в появившемся диалоговом окне метод «Однофакторный дисперсионный анализ» и нажать кнопку OK
- 3 в окне «Однофакторный дисперсионный анализ» установить для входных данных следующие параметры: входной интервал $R$2:$W$3, группирование – по строкам метки – выбранный нами входной диапазон не содержит метки, то есть названий строк и столбцов, альфа уровень значимости = 0,05
- 4 для параметров вывода установить переключатель в положение «Выходной интервал» и указать клетку с координатой P27
- 5 после завершения настройки параметров нажать «OK» (результаты дисперсионного анализа будут состоять из двух таблиц)
Установите соответствие видов расстояний в кластерном анализе и соответствующих им математических выражений:
Тип ответа: Сопоставление
Установите соответствие между коэффициентом (индексом) и его формулой:
Тип ответа: Сопоставление
Установите соответствие метода и его описания:
Тип ответа: Сопоставление
- A. Метод Пуанкаре
- B. Метод Винзора
- C. Метод цензурирования
- D. Метод максимального правдоподобия
- E. предварительный способ анализа выборки, заключающийся в отбрасывании части максимальных и минимальных значений
- F. предварительный способ анализа выборки, заключающийся в присваивании одинаковых значений крайним наблюдениям выборки
- G. предварительный способ анализа выборки, заключающийся в фиксировании факта принадлежности элементов выборки некоторым крайним интервалам
- H. метод оценивания неизвестного параметра путем максимизации функции правдоподобия
Установите соответствие методов и их характеристик:
Тип ответа: Сопоставление
- A. Алгоритм Кестена
- B. Алгоритм Литвакова
- C. Бутстрепирование
- D. применяют чтобы найти точку минимума в условиях наличия помех при измерениях
- E. позволяет отыскать близкое к оптимальному значение вектора параметров λ=(λ1,…,λm) с помощью рекуррентной процедуры
- F. включает многократный случайный отбор из имеющейся выборки с возвращением, что позволяет получить множество выборок большего объема для аппроксимации истинного закона распределения генеральной совокупности
Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
- A. Интегральный показатель кластеризации
- B. Коэффициент результативности
- C. Коэффициент Уилкса (U-статистика)
- D. функция, зависящая от исходных признаков, используемая для многомерной кластеризации в случае невозможности упорядочить классификационные признаки
- E. сумма элементов, лежащих на диагонали классификационной матрицы, деленная на общее количество случаев
- F. отношение внутригрупповой суммы квадратов к общей сумме квадратов
Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
- A. Ковариация
- B. Корреляция
- C. Регрессия
- D. среднее произведение отклонений признаков от их средних квадратических отклонений
- E. величина, отражающая наличие связи между явлениями, процессами и характеризующими их показателями
- F. величина, выражающая зависимость среднего значения случайной величины у от значений случайной величины х
Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
- A. Медиана
- B. Мода
- C. Полигон
- D. значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности
- E. наиболее часто встречающееся значение переменной
- F. графическое изображение сгруппированного дискретного вариационного ряда в виде ломаной линии
Установите соответствие понятий и их характеристик:
Тип ответа: Сопоставление
- A. Внутригрупповая дисперсия
- B. Межгрупповая дисперсия
- C. Эмпирический коэффициент детерминации
- D. Эмпирическое корреляционное отношение
- E. показывает ту часть вариации признака, которая обусловлена действием всех факторов, кроме группировочного
- F. показывает ту часть общей дисперсии, которая обусловлена действием группировочного фактора
- G. показывает долю общей дисперсии изучаемого признака, обусловленную фактором, положенным в основание группировки
- H. показывает количественную оценку влияния факторного признака на вариацию результативного признака
Установите соответствие понятия и его математического выражения:
Тип ответа: Сопоставление
Установите соответствие понятия и его математического выражения:
Тип ответа: Сопоставление
Установите соответствие шкалы и ее характеристики:
Тип ответа: Сопоставление
- A. Номинальная шкала
- B. Порядковая шкала
- C. Интервальная шкала
- D. используется для описания принадлежности элементов к определенным классам
- E. используется для упорядочения элементов по одному или нескольким признакам
- F. показывает, насколько одно значение больше другого в принятых единицах измерения
Эта величина является мерой разброса чисел в ряду. Она определяется как среднее арифметическое квадратов отклонений чисел от их среднего арифметического. О каком понятии идет речь?
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
Этот способ визуализации данных используют, чтобы графически отобразить и анализировать категориальные номинальные данные. Это гистограмма, которая изображает частоты встречаемости признака в убывающем порядке, на которую накладывают точечно-линейный график из накопленных частот или процентов, долей. График отражает накопленную частоту значений признака. Назовите данный способ визуализации данных.
Тип ответа: Одиночный выбор • с выбором одного правильного ответа из нескольких предложенных вариантов
- Диаграмма Парето
- Тепловая карта
- Диаграмма рассеяния