90-100 баллов
Результат примерный, т.к. он зависит от того, какие вопросы вам попадутся в тесте. Вы приобретаете ответы на нижеперечисленные вопросы
Всего 71 ответ
1… – это доля дисперсии наблюдаемых переменных, обусловленная наличием общих факторов
2… – это многомерная статистическая процедура, которая выполняет сбор данных, содержащих информацию о выборке, и затем упорядочивает объекты в однородные группы
3… – это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для их постоянного хранения, передачи и обработки
4… – это способ нахождения промежуточных значений функции в области ее определения
Корреляция
Дисперсия
Интерполяция
Детерминация
5… – это статистические методы, которые позволяют получать надежные оценки параметров с учетом неизвестного закона распределения генеральной совокупности и наличия существенных отклонений в значениях данных
Непараметрические методы
Параметрические методы
Методы робастного оценивания
6… (средняя точка) – это средние значения для дискриминантных показателей конкретной группы
7… анализ позволяет проверить гипотезу о равенстве средних значений выборок (взяты ли выборки из одного распределения или из разных распределений)
8… анализ позволяет разложить общую вариацию зависимой переменной на две составляющие – степень случайной изменчивости отклика Y и долю изменчивости отклика за счет влияния непрерывных предикторов X
Ковариационный
Дисперсионный
Регрессионный
9… выборки – это отбрасывание определенной части минимальных и/или максимальных наблюдений
10… зависимость – это связь, при которой каждому фиксированному значению переменой х соответствует не одно, а множество значений зависимой переменной у, причем заранее нельзя сказать, какое именно значение примет у
Функциональной
Статистическая
Прямая
Обратная
11… используют в иерархических алгоритмах классификаций, принцип работы которых – последовательно объединять наблюдения, а затем и целые группы, сначала самых близкие, а затем все более и более отдаленные друг от друга
Расстояние между группами элементов
Взвешенное евклидово расстояние
Евклидово расстояние
12… корреляционная матрица – это матрица корреляции, при вычислении которой наблюдения обрабатывают так, как будто они взяты из одной выборки
13… корреляция измеряет степень связи между дискриминантными показателями и группами, т.е. определяет принадлежность к данной группе
14… коэффициент детерминации характеризует долю межгрупповой дисперсии в общей дисперсии
15… критерия – это величина 1 – , где – вероятность ошибки второго рода
16… модели регрессии – это соответствие теоретических данных, полученных на основе уравнения регрессии, фактическим статистическим данным
Адекватность
Надежность
Линейность
Простота
17… регрессия представляет собой регрессию между двумя переменными
18… случайная мера равна отношению числа точек в множестве А к числу точек во всем пространстве Х
19Вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности характеризует … дисперсия
20Вероятность , с которой осуществляется событие |Г-в |<, – это … оценки в
21Данные, при составлении которых у каждого наблюдения регистрируется только один признак, – это … данные
одномерные
первичные
числовые
22Диаграмма в виде столбцов, по оси абсцисс которой отображаются все возможные значения переменной, а по оси ординат – частоты или относительные частоты каждого значения, – это …
23Иерархические процедуры – это наиболее распространенные алгоритмы кластерного анализа, в которых начальное разбиение состоит из n одноэлементных классов, а конечное разбиение состоит из …
одного класса
двух классов
(n – 1) классов
(1 – n) классов
24Индекс … – это показатель тесноты связи для нелинейной регрессии
25Класс методов для представления восприятий и предпочтений респондентов в пространстве с помощью наглядного изображения – это …
многомерное шкалирование
прямой облимин
эвристические методы
26Критерий … выборки показывает степень применимости факторного анализа к данной выборке
27Любое предположение относительно закона распределения исследуемой случайной величины X называется …
статистической гипотезой
простой гипотезой
сложной гипотезой
теорией
28Нечувствительность к малым отклонениям от предположений – это …
робастность
усечение выборки
бутстрепирование
29Последовательность значений количественного признака, расположенных в порядке возрастания (неубывания), – это … ряд
30Процедура, с помощью которой большое число переменных, относящихся к имеющимся наблюдениям, сводят к меньшему количеству независимых влияющих величин, называется … анализом
кластерным
факторным
дисперсионным
корреляционным
31Расположите в правильной последовательности этапы построения вариационного ряда:
Тип ответа: Сортировка
1 определение среди имеющихся наблюдений xmin и хmах значений признака
2 определение размаха варьирования признака R
3 определение ширины интервала h
4 определение граничных значений интервалов (аi; bi)
5 группировка результатов наблюдения по интервалам
32Расположите в правильной последовательности этапы проведения корреляционно-регрессионного анализа:
Тип ответа: Сортировка
1 разделение признаков на факторные и результативные; выбор наиболее существенных признаков для их дальнейшего исследования и включения в корреляционную модель
2 предварительная оценка формы уравнения регрессии
3 вычисление коэффициентов регрессии и их смысловая интерпретация
4 расчет теоретически ожидаемых (рассчитанных по уравнению регрессии) значений результативного признака
5 определение и сравнительный анализ дисперсий: общей, факторной и остаточной; оценка тесноты связи между признаками, включенными в регрессионную модель
6 общая оценка качества модели, отсев несущественных (или включение дополнительных факторов)
33Расположите в правильной последовательности этапы проведения факторного анализа:
Тип ответа: Сортировка
1 вычисление корреляционной матрицы для всех переменных
2 выбор факторов
3 создание упрощенной структуры
4 проверка значимости модели
5 интерпретация результатов
34
35Уравнение … математически выражает среднюю величину одного признака как функцию другого
36Установите правильную последовательность шагов алгоритма проверки статистической гипотезы:
Тип ответа: Сортировка
1 задать уровень значимости , выбрать статистический критерий К, вычислить по таблицам для закона распределения К значение Ккр; определить вид критической области
2 по выборке вычислить наблюдаемое значение критерия Кнабл
3 если Кнабл попадает в критическую область, гипотеза Н0 отвергается; при попадании Кнабл в область принятия гипотезы гипотеза Н0 принимается
37Установите правильную последовательность шагов алгоритма, который используется, чтобы найти кластеры по методу k-средних:
Тип ответа: Сортировка
1 инициализировать (пользователь выбирает число К кластеров и назначает К гипотетических центров)
2 обновить кластеры (при заданных К центрах ck (k = 1, 2, ..., K) каждый объект i приписывать одному из центров по правилу минимального расстояния)
3 обновить центры (вычислить арифметический центр каждого кластера Sk, который и назначают новым центром ck (k = 1, 2, ..., K))
4 применить правило остановки (новые центры ck сравнить со старыми; если ck=ck для каждого k = 1, 2, ..., K – остановить вычисления и выдать результаты)
38Установите правильную последовательность шагов применения правила «ящик с усами»:
Тип ответа: Сортировка
1 определить выборочные значения межквартильного размаха R и медианы
2 определить выборочные значения, меньшие (-1,5R) и большие (+1,5R), – подозрительные выбросы
3 определить выборочные значения, меньшие (-3R) и большие (+3R), – экстремальные выбросы; исключить их
39Установите правильную последовательность шагов проведения расчета однофакторного дисперсионного анализа в MS Excel:
Тип ответа: Сортировка
1 сформировать таблицу с исходными данными
2 выбрать «Пакет анализа» в появившемся диалоговом окне метод «Однофакторный дисперсионный анализ» и нажать кнопку OK
3 в окне «Однофакторный дисперсионный анализ» установить для входных данных следующие параметры: входной интервал $R$2:$W$3, группирование – по строкам метки – выбранный нами входной диапазон не содержит метки, то есть названий строк и столбцов, альфа уровень значимости = 0,05
4 для параметров вывода установить переключатель в положение «Выходной интервал» и указать клетку с координатой P27
5 после завершения настройки параметров нажать «OK» (результаты дисперсионного анализа будут состоять из двух таблиц)
40Установите соответствие видов факторного анализа и их характеристик:
Тип ответа: Сопоставление
A. Стохастический факторный анализ
B. Детерминированный факторный анализ
C. Прямой факторный анализ
D. Обратный факторный анализ
E. методика исследования факторов, связь которых с результативным показателем является вероятностной
F. методика исследования факторов, связь которых с результативным показателем носит функциональный характер
G. методика, основанная на дедуктивном способе
H. методика, основанная на логической индукции
41Установите соответствие метода и его описания:
Тип ответа: Сопоставление
A. Метод Пуанкаре
B. Метод Винзора
C. Метод цензурирования
D. Метод максимального правдоподобия
E. предварительный способ анализа выборки, заключающийся в отбрасывании части максимальных и минимальных значений
F. предварительный способ анализа выборки, заключающийся в присваивании одинаковых значений крайним наблюдениям выборки
G. предварительный способ анализа выборки, заключающийся в фиксировании факта принадлежности элементов выборки некоторым крайним интервалам
H. метод оценивания неизвестного параметра путем максимизации функции правдоподобия
42Установите соответствие методов и их характеристик:
Тип ответа: Сопоставление
A. Алгоритм Кестена
B. Алгоритм Литвакова
C. Бутстрепирование
D. применяют чтобы найти точку минимума в условиях наличия помех при измерениях
E. позволяет отыскать близкое к оптимальному значение вектора параметров =(1,…,m) с помощью рекуррентной процедуры
F. включает многократный случайный отбор из имеющейся выборки с возвращением, что позволяет получить множество выборок большего объема для аппроксимации истинного закона распределения генеральной совокупности
43Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
A. Ковариация
B. Корреляция
C. Регрессия
D. среднее произведение отклонений признаков от их средних квадратических отклонений
E. величина, отражающая наличие связи между явлениями, процессами и характеризующими их показателями
F. величина, выражающая зависимость среднего значения случайной величины у от значений случайной величины х
44Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
A. Количественные данные
B. Вторичные данные
C. Дискретные данные
D. показатели, принимающие числовые значения, которые получаются путем некоторых измерений или подсчетов
E. данные, уже собранные специализированными фирмами или другими исследователями
F. данные, образующие счетное множество и принимающие только некоторые изолированные значения на числовой оси, между которыми значений быть не может
45Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
A. Интегральный показатель кластеризации
B. Коэффициент результативности
C. Коэффициент Уилкса (U-статистика)
D. функция, зависящая от исходных признаков, используемая для многомерной кластеризации в случае невозможности упорядочить классификационные признаки
E. сумма элементов, лежащих на диагонали классификационной матрицы, деленная на общее количество случаев
F. отношение внутригрупповой суммы квадратов к общей сумме квадратов
46Установите соответствие понятий и их определений:
Тип ответа: Сопоставление
A. Медиана
B. Мода
C. Полигон
D. значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности
E. наиболее часто встречающееся значение переменной
F. графическое изображение сгруппированного дискретного вариационного ряда в виде ломаной линии
47Установите соответствие понятий и их содержания:
Тип ответа: Сопоставление
A. Критерий
B. Альтернативная гипотеза
C. Уровень значимости
D. некоторое правило, позволяющее принять или отвергнуть статистическую гипотезу
E. утверждение, которое будет верно в случае отклонения нулевой гипотезы
F. вероятность ошибки первого рода
48Установите соответствие понятий и их характеристик:
Тип ответа: Сопоставление
A. Внутригрупповая дисперсия
B. Межгрупповая дисперсия
C. Эмпирический коэффициент детерминации
D. Эмпирическое корреляционное отношение
E. показывает ту часть вариации признака, которая обусловлена действием всех факторов, кроме группировочного
F. показывает ту часть общей дисперсии, которая обусловлена действием группировочного фактора
G. показывает долю общей дисперсии изучаемого признака, обусловленную фактором, положенным в основание группировки
H. показывает количественную оценку влияния факторного признака на вариацию результативного признака
49Установите соответствие понятия и его математического выражения:
Тип ответа: Сопоставление
A. Средняя Пуанкаре
B. Средняя арифметическая
C. Средняя гармоническая
D. Средняя геометрическая
E.
F.
G.
H.
50Установите соответствие понятия и его содержания:
Тип ответа: Сопоставление
A. Статистическая оценка
B. Несмещенная оценка
C. Состоятельная оценка
D. Эффективная оценка
E. оценка, построенная на основе выборочной совокупности
F. оценка, математическое ожидание которой равно оцениваемому параметру
G. оценка, сходящаяся по вероятности к оцениваемому параметру
H. оценка, обладающая наименьшей дисперсией
51Установите соответствие шкалы и ее характеристики:
Тип ответа: Сопоставление
A. Номинальная шкала
B. Порядковая шкала
C. Интервальная шкала
D. используется для описания принадлежности элементов к определенным классам
E. используется для упорядочения элементов по одному или нескольким признакам
F. показывает, насколько одно значение больше другого в принятых единицах измерения
52Число объектов совокупности называется …
плотностью совокупности
объемом совокупности
дисперсией
модой
В кластерном анализе используют различные виды расстояний.
Один из этих видов применяют в тех случаях, когда каждой компоненте xt вектора наблюдений X удается приписать некоторый «вес» wp, пропорционально степени важности признака в задаче классификации. Принимают вес больше 0 и меньше 1. Чтобы определить «вес», нужно провести с дополнительные исследования, например, организовать опрос экспертов и обработать их мнения.
О каком виде расстояний говорится в описании?
Евклидово расстояние
«Взвешенное» евклидово расстояние
Расстояние по принципу «ближайшего соседа»
В кластерном анализе используют различные виды расстояний.
Один из этих видов – расстояние в городских кварталах, когда от А до Б мы можем передвигаться по улицам под прямым углом и никогда по диагонали. Такое расстояние зависит от вращения системы координат, но не зависит от отражения относительно оси координат или переноса.
О каком виде расстояний говорится в описании?
Евклидово расстояние
Расстояние по принципу «ближайшего соседа»
Манхэттенское расстояние
Имеется следующая выборка: 4, 6, 8, 9, 9, 12, 12, 14, 15, 18.
Рассчитайте 10-процентное винзорированное среднее для этой выборки.
10
10,6
10,7
11
Имеется следующая выборка: 4, 6, 8, 9, 9, 12, 12, 14, 15, 18.
Рассчитайте 10-процентное усеченное среднее для этой выборки.
10,625
10,7
10,75
Коэффициент ассоциации
Коэффициент взаимной сопряженности Пирсона
Коэффициент Фехнера
Необходимое условие анализа данных – отсутствие пропусков в данных. Если в совокупности присутствуют пропуски, то дальнейший анализ нужно предварить процедурой заполнения этих пропусков. Интерполяция – это нахождение промежуточных значений функции в области ее определения.
Существуют разные методы интерполяции. Один из них – простой, но действенный способ заполнить пробелы в данных. При таком подходе все недостающие данные заполняют средними арифметическими значениями либо по всем наблюдениям, либо только по N ближайшим точкам с обеих сторон пропущенного значения.
О каком методе интерполяции идет речь?
Метод среднего значения
Метод медианы
Метод расчета процента от знаковой величины
Алгоритм Роббинса–Монро
Алгоритм Литвакова
Алгоритм Кестена
По выборке Х1, …, Х100 из распределения F(x,) требуется проверить гипотезу о том, что неизвестный параметр равен 5 против альтернативы, что значение параметра больше 5.
Для проверки этой гипотезы применяется некоторый состоятельный критерий. Уровень значимости этого критерия равен 0,05.
Какое значение может принимать функция мощности этого критерия в точке 6?
0,05
Меньше, чем 0,05
Больше, чем 0,05
В окрестности 0,05
По способу отбора, которые определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности, выделяют пять выборок. В частности, используется выборка, которая заключается в собственно-случайном либо механическом отборе групп единиц, внутри которых проводят сплошное обследование. Единица отбора при этой выборке – группа или серия, а не отдельная единица. Этот способ отбора удобен в тех случаях, когда единицы генеральной совокупности изначально объединены в небольшие более или менее равновеликие группы.
О какой выборке говорится в описании?
Типическая выборка.
Серийная выборка.
Комбинированная выборка.
При определении влияния квалификации рабочего на его производительность были получены следующие значения общей и средней внутригрупповой дисперсии:
- общая дисперсия – 900;
- средняя внутригрупповая дисперсия – 300.
Чему равна межгрупповая дисперсия?
Межгрупповая дисперсия равна 1200
Межгрупповая дисперсия равна 600
Межгрупповая дисперсия равна 300
При определении влияния квалификации рабочего на его производительность были получены следующие значения общей и межгрупповой дисперсии:
- общая дисперсия – 900;
- межгрупповая дисперсия – 370.
Чему равна средняя внутригрупповая дисперсия?
Средняя внутригрупповая дисперсия равна 530
Средняя внутригрупповая дисперсия равна 1070
Средняя внутригрупповая дисперсия равна 243
Цель вращения факторов– получить простую структуру, которой соответствует большое значение нагрузки каждой переменной только по одному фактору и малое по всем остальным факторам.
Существует несколько методов вращения. Один из них – метод вращения, при котором сохраняется ортогональность факторов минимизируется число переменных с высокой факторной нагрузкой. Этот метод используют на практике чаще всего, так как он облегчает интерпретацию факторов.
Назовите описанный метод вращения.
варимакс
квартимакс
эквимакс
Эта величина является мерой разброса чисел в ряду. Она определяется как среднее арифметическое квадратов отклонений чисел от их среднего арифметического.
О каком понятии идет речь?
кумулята
мода
дисперсия
Этот способ визуализации данных используют, чтобы графически отобразить и анализировать категориальные номинальные данные. Это гистограмма, которая изображает частоты встречаемости признака в убывающем порядке, на которую накладывают точечно-линейный график из накопленных частот или процентов, долей. График отражает накопленную частоту значений признака.
Назовите данный способ визуализации данных.
Диаграмма Парето
Тепловая карта
Диаграмма рассеяния