Установите соответствие видов расстояний в кластерном анализе и соответствующих им математических выражений:

Раздел
Гуманитарные дисциплины
Тип
Просмотров
36
Покупок
0
Антиплагиат
Не указан
Размещена
12 Окт в 20:39
ВУЗ
МФПУ Синергия / Московский открытый институт (МОИ) / Московский технологический институт (МТИ) / МОСАП
Курс
Не указан
Стоимость
290 ₽
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
pdf
Современные методы сбора, обработки и анализа экономических и социальных данных
611.7 Кбайт 290 ₽
Описание

Сборник всех ответов по предмету "Современные методы сбора, обработки и анализа экономических и социальных данных" на отлично! Оплачивая тесты на этой страничке Вы приобретаете все ответы по итоговому тесту!

Учебные материалы

Введение в курс

Тема 1. Понятие анализа данных. Описательная статистика

Тема 2. Генеральная и выборочная совокупности

Тема 3. Корреляционный анализ

Тема 4. Дисперсионный анализ

Тема 5. Снижение размерности признакового пространства

Тема 6. Классификация многомерных наблюдений

Тема 7. Робастное оценивание параметров и непараметрические модели генеральной совокупности

Заключение

Итоговый тест

Оглавление

Предварительный способ анализа выборки, заключающийся в присваивании одинаковых значений крайним наблюдениям выборки, называется методом …

Пуанкаре

Винзора

цензурирования

максимального правдоподобия

В кластерном анализе используют различные виды расстояний.

Один из этих видов – расстояние в городских кварталах, когда от А до Б мы можем передвигаться по улицам под прямым углом и никогда по диагонали. Такое расстояние зависит от вращения системы координат, но не зависит от отражения относительно оси координат или переноса.

О каком виде расстояний говорится в описании?

Евклидово расстояние

Расстояние по принципу «ближайшего соседа»

Манхэттенское расстояние

Непараметрические показатели связи позволяют судить о степени и тесноте связи для количественных и для атрибутивных признаков.

Один из этих показателей определяется по формуле:

K= ((ad-bc)/ корень из ((a+b)(c+d)(d+b(a+c))

 

Коэффициент ассоциации

Коэффициент контингенции

Коэффициент взаимной сопряженности Пирсона

Коэффициент Фехнера

… корреляционная матрица – это матрица корреляции, при вычислении которой наблюдения обрабатывают так, как будто они взяты из одной выборки

Необходимое условие анализа данных – отсутствие пропусков в данных. Если в совокупности присутствуют пропуски, то дальнейший анализ нужно предварить процедурой заполнения этих пропусков. Интерполяция – это нахождение промежуточных значений функции в области ее определения.

Существуют разные методы интерполяции. Один из них – простой, но действенный способ заполнить пробелы в данных. При таком подходе все недостающие данные заполняют средними арифметическими значениями либо по всем наблюдениям, либо только по N ближайшим точкам с обеих сторон пропущенного значения.

О каком методе интерполяции идет речь?

Метод среднего значения

Метод медианы

Метод расчета процента от знаковой величины

Ниже приведена динамика числа родившихся в России в период 2014-2023 гг. в виде таблицы и столбчатой диаграммы.

Какие данные представлены в данном примере?

Интервальные временные данные

Моментные временные данные

Пространственно-временные данные

По выборке Х1, …, Х100 из распределения F(x,θ) требуется проверить гипотезу о том, что неизвестный параметр θ равен 5 против альтернативы, что значение параметра θ больше 5.

Для проверки этой гипотезы применяется некоторый состоятельный критерий. Уровень значимости этого критерия равен 0,05.

Какое значение может принимать функция мощности этого критерия в точке 6?

0,05

Меньше, чем 0,05

Больше, чем 0,05

В окрестности 0,05

Имеется следующая выборка: 4, 6, 8, 9, 9, 12, 12, 14, 15, 18. Рассчитайте 10-процентное винзорированное среднее для этой выборки.

10

10,6

10,7

11

Сущность данного алгоритма состоит в следующем.

О каком алгоритме говорится в описании?

Алгоритм Роббинса–Монро

Алгоритм Литвакова

Алгоритм Кестена

Эта величина является мерой разброса чисел в ряду. Она определяется как среднее арифметическое квадратов отклонений чисел от их среднего арифметического. О каком понятии идет речь?

кумулята

мода

дисперсия

Непараметрические показатели связи позволяют судить о степени и тесноте связи для количественных и атрибутивных признаков. Один их этих показателей определяется по формуле: K=(C-h)/(C+H

Назовите этот непараметрический показатель связи.

Коэффициент ассоциации

Коэффициент взаимной сопряженности Пирсона

Коэффициент Фехнера

Дискриминантный анализ – это …

анализ различий заранее заданных групп объектов исследования

снижение размерности факторного пространства

последовательное объединение групп элементов

анализ связи между качественными и количественными признаками

В кластерном анализе используют различные виды расстояний.

Один из этих видов применяют в тех случаях, когда каждой компоненте xt вектора наблюдений X удается приписать некоторый «вес» wp, пропорционально степени важности признака в задаче классификации. Принимают вес больше 0 и меньше 1. Чтобы определить

«вес», нужно провести с дополнительные исследования, например, организовать опрос экспертов и обработать их мнения.

О каком виде расстояний говорится в описании?

Евклидово расстояние

«Взвешенное» евклидово расстояние

Расстояние по принципу «ближайшего соседа»

Для характеристического уравнения. Чему равно собственное значение

Собственное значение λ2 равно 3 

Собственное значение λ2 равно 2

Собственное значение λ2 равно 1

Этот способ визуализации данных используют, чтобы графически отобразить и анализировать категориальные номинальные данные. Это гистограмма, которая изображает частоты встречаемости признака в убывающем порядке, на которую накладывают точечно- линейный график из накопленных частот или процентов, долей. График отражает накопленную частоту значений признака.

Назовите данный способ визуализации данных.

Диаграмма Парето

Тепловая карта

Диаграмма рассеяния

Даны 6 объектов, которые характеризуются двумя признаками X1 и X2:

Чему равно евклидово расстояние d13?

Евклидово расстояние d13 равно 3

Евклидово расстояние d13 равно 5

Евклидово расстояние d13 равно 9

При определении влияния квалификации рабочего на его производительность были получены следующие значения общей и средней внутригрупповой дисперсии:

-         общая дисперсия – 900;

-         средняя внутригрупповая дисперсия – 300. Чему равна межгрупповая дисперсия?

Межгрупповая дисперсия равна 1200

Межгрупповая дисперсия равна 600

Межгрупповая дисперсия равна 300

Расположите в правильной последовательности этапы построения вариационного ряда:

1 определение среди имеющихся наблюдений xmin и хmах значений признака

2 определение размаха варьирования признака R

3 определение ширины интервала h

4 определение граничных значений интервалов (аi; bi)

5 группировка результатов наблюдения по интервалам

Когда при проверке гипотезы Н0:μ=μ0 против Н1:μ=μ1, следует выбирать правостороннюю критическую область …

μ1<μ0

μ1>μ0

μ1≠μ0

μ1=μ0

Статистический … – это правило, устанавливающее условия, при которых нулевую гипотезу следует либо принять, либо отвергнуть

Установите соответствие между классификациями и соответствующими типами данных:

A. По числу переменных, характеризующих объект исследования

B. По наличию упорядочивания во времени

C. По типу шкалы измерения

D. По способу получения

E. одномерные и многомерные массивы данных

F. пространственные и временные данные

G. количественные и качественные данные

H. первичные и вторичные данные

Пусть α – вероятность отвергнуть верную гипотезу, γ – доверительная вероятность, то есть вероятность принять верную гипотезу; тогда если α = 0,05, то …

γ=0,45

γ=0,95

γ=0,85

γ=0,955

Установите соответствие понятия и его содержания:

A. Статистическая оценка

B. Несмещенная оценка

C. Состоятельная оценка

D. Эффективная оценка

E. оценка, построенная на основе выборочной совокупности

F. оценка, математическое ожидание которой равно оцениваемому параметру

G. оценка, сходящаяся по вероятности к оцениваемому параметру

H. оценка, обладающая наименьшей дисперсией

Если нулевая гипотеза имеет вид Н0: р = 0,6, тогда конкурирующей гипотезой может являться … (укажите 3 варианта ответа)

р≤0,6

р≠0,6

р<0,6

р>0,6

Если нулевая гипотеза состоит в предположении, что параметр показательного распределения λ = 5, то конкурирующая гипотеза состоит в предложении, что …

λ≤5

λ≥5

λ≠5

λ≈5

Для того чтобы по выборке можно было судить о случайной величине, выборка должна быть …

бесповторной

повторной

безвозвратной

репрезентативной

Логарифмическое преобразование позволяет осуществить переход от нелинейной модели y = 5x2u к модели …

ln y = ln 5 + 2ln x + ln u

y = ln y + 5 +2ln x

y = ln 5 + 2In x + ln u

ln y = 5 + 2x + u

По типу шкалы измерения данные делятся на …

одномерные и многомерные

количественные и качественные

первичные и вторичные

пространственные и временные

Какое значение не может принимать Неверно, что парный коэффициент корреляции может принимать значение …

0,902

0,004

1,111

0,721

Установите соответствие между коэффициентом (индексом) и его формулой:

A. Коэффициент корреляции

B. Индекс корреляции

C. Коэффициент регрессии

D. Коэффициент детерминации

E.

F.

G.

H.

Неверно, что парный коэффициент корреляции может принимать значение …

-0,973

0,005

1,123

0,746

Значение коэффициента детерминации рассчитывается как отношение дисперсии результативного признака, объясненной регрессией, к … дисперсии результативного признака

общей

Расположите в правильной последовательности этапы проведения однофакторного дисперсионного анализа:

1 найти внутригрупповые и общую средние

2 найти внутригрупповые дисперсии

3 рассчитать среднюю из внутригрупповых дисперсий

4 найти межгрупповую дисперсию

5 рассчитать общую дисперсию

6 проверить расчет по правилу сложения дисперсий

Дисперсионный анализ используется для …

оценки тесноты связи между количественным и качественным признаками

снижения размерности факторного пространства

многомерной группировки данных

оценки связи между количественными признаками

Установите соответствие понятия и соответствующей ему формулы:

A. Внутригрупповая дисперсия

B. Межгрупповая дисперсия

C. Эмпирическое корреляционное отношение

D.

E.

F.

Установите соответствие вида дисперсии и ее характеристики:

A. Общая дисперсия (σ2)

B. Внутригрупповая дисперсия (σ 2)

C. Межгрупповая дисперсия (δx2)

D. характеризует вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности

E. отражает случайную вариацию, т.е. ту часть вариации признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка

F. характеризует вариацию, обусловленную влиянием признака-фактора, положенного в основание группировки, на значения исследуемого признака

Расположите в правильной последовательности этапы проведения однофакторного дисперсионного анализа:

1 найти внутригрупповые и общую средние

2 найти внутригрупповые дисперсии

3 рассчитать среднюю из внутригрупповых дисперсий

4 найти межгрупповую дисперсию

5 рассчитать общую дисперсию

6 проверить расчет по правилу сложения дисперсий

Эмпирический коэффициент детерминации определяется формулой …

1

2

3

4

Эмпирический коэффициент … характеризует долю межгрупповой дисперсии в общей дисперсии

Дисперсия отклонений значений признака от произвольного числа А, неравного средней величине, …

уменьшает дисперсию отклонений от средней на число, равное возведенной в квадрат разнице между средним и этим числом

не влияет на величину дисперсии отклонений

увеличивает дисперсию отклонений от средней на число, равное возведенной в квадрат разнице между средним и этим числом

… анализ – это процедура, с помощью которой большое число переменных, относящихся к имеющимся наблюдениям, сводят к меньшему количеству независимых влияющих величин, называется …

К методам снижения размерности следует отнести … анализ (укажите 2 варианта ответа)

факторный

регрессионный

корреляционный

кластерный

дифференциальный

Установите соответствие видов факторного анализа и их характеристик:

A. Стохастический факторный анализ

B. Детерминированный факторный анализ

C. Прямой факторный анализ

D. Обратный факторный анализ

E. методика исследования факторов, связь которых с результативным показателем является вероятностной

F. методика исследования факторов, связь которых с результативным показателем носит функциональный характер

G. методика, основанная на дедуктивном способе

H. методика, основанная на логической индукции

Непараметрические показатели связи позволяют судить о степени и тесноте связи для количественных и для атрибутивных признаков.

Один из этих показателей определяется по формуле:

K=(ad-bc)/(ad+bc)

 

Коэффициент ассоциации

Коэффициент контингенции

Коэффициент взаимной сопряженности Пирсона

Коэффициент Фехнера

Иерархическая … – это последовательное объединение групп элементов (сначала самых близких, а затем все более удаленных) в соответствии с матрицей расстояний

Исходные данные для кластерного анализа могут быть …

только качественными

только количественными

любыми

Пусть даны две точки трехмерного пространства – А(2; -3; 5) и В(4; 4; -4), тогда евклидово расстояние между ними равно квадратному корню из …

В результате разбиения объектов на группы по сходству признаков образуются …

системы

кластеры

совокупности

общности

блоки

Главная задача кластерного анализа – …

сегментация

объединение

пересечение

Метод максимального правдоподобия основывается на формуле …

1

2

3

4

Установите соответствие метода и его описания:

A. Метод Пуанкаре

B. Метод Винзора

C. Метод цензурирования

D. Метод максимального правдоподобия

E. предварительный способ анализа выборки, заключающийся в отбрасывании части максимальных и минимальных значений

F. предварительный способ анализа выборки, заключающийся в присваивании одинаковых значений крайним наблюдениям выборки

G. предварительный способ анализа выборки, заключающийся в фиксировании факта принадлежности элементов выборки некоторым крайним интервалам

H. метод оценивания неизвестного параметра путем максимизации функции правдоподобия

Если при построении статистических моделей функциональный вид распределения наблюдений задается, то такие модели называются …

параметрическими

непараметрическими

статистическими

независимыми

Метод, направленный на выявление выбросов, снижение их влияния или исключение их из выборки, называется …

робастным

независимым

факторным

кластерным

… эффект – это смещение среднего значения и увеличение меры разброса значений признака при наличии нескольких выбросов

Установите соответствие понятия и его математического выражения:

A. Средняя Пуанкаре

B. Средняя арифметическая

C. Средняя гармоническая

D. Средняя геометрическая

E.

F.

G.

H.

… выборки – это отбрасывание определенной части минимальных и/или максимальных наблюдений

Установите соответствие понятий и их характеристик:

A. Внутригрупповая дисперсия

B. Межгрупповая дисперсия

C. Эмпирический коэффициент детерминации

D. Эмпирическое корреляционное отношение

E. показывает ту часть вариации признака, которая обусловлена действием всех факторов, кроме группировочного

F. показывает ту часть общей дисперсии, которая обусловлена действием группировочного фактора

G. показывает долю общей дисперсии изучаемого признака, обусловленную фактором, положенным в основание группировки

H. показывает количественную оценку влияния факторного признака на вариацию результативного признака

… корреляция измеряет степень связи между дискриминантными показателями и группами, т.е. определяет принадлежность к данной группе

Данные, при составлении которых у каждого наблюдения регистрируется несколько признаков, – это … данные

первичные

пространственно-временные

непрерывные

многомерные

… коэффициент детерминации характеризует долю межгрупповой дисперсии в общей дисперсии

Уравнение … математически выражает среднюю величину одного признака как функцию другого

Процент цензурированных наблюдений относительно полного объема выборки – это …

Иерархические процедуры – это наиболее распространенные алгоритмы кластерного анализа, в которых начальное разбиение состоит из n одноэлементных классов, а конечное разбиение состоит из …

одного класса

двух классов

(n – 1) классов

(1 – n) классов

Данные, при составлении которых у каждого наблюдения регистрируется только один признак, – это … данные

одномерные

первичные

числовые

Установите соответствие понятий и их определений:

A. Интегральный показатель кластеризации

B. Коэффициент результативности

C. Коэффициент Уилкса (U- статистика)

D. функция, зависящая от исходных признаков, используемая для многомерной кластеризации в случае невозможности упорядочить классификационные признаки

E. сумма элементов, лежащих на диагонали классификационной матрицы, деленная на общее количество случаев

F. отношение внутригрупповой суммы квадратов к общей сумме квадратов

Метод корреляционных … предназначен для нахождения таких групп признаков, что корреляционная связь между параметрами одной группы достаточно велика, а связь между параметрами из разных групп – мала

Бинарные (дихотомические) переменные, которые имеют две категории или два значения, которые обычно кодируют …

числами 1 и -1

цифрами 0 и 1

знаками «+» и «-»

буквами x и y

… регрессия представляет собой регрессию между двумя переменными

… – это статистические методы, которые позволяют получать надежные оценки параметров с учетом неизвестного закона распределения генеральной совокупности и наличия существенных отклонений в значениях данных

Непараметрические методы

Параметрические методы

Методы робастного оценивания

Число объектов совокупности называется …

плотностью совокупности

объемом совокупности

дисперсией

модой

Класс методов для представления восприятий и предпочтений респондентов в пространстве с помощью наглядного изображения – это …

многомерное шкалирование

прямой облимин

эвристические методы

Установите соответствие понятий и их определений:

A. Медиана

B. Мода

C. Полигон

D. значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности

E. наиболее часто встречающееся значение переменной

F. графическое изображение сгруппированного дискретного вариационного ряда в виде ломаной линии

… модели регрессии – это соответствие теоретических данных, полученных на основе уравнения регрессии, фактическим статистическим данным

Адекватность

Надежность

Линейность

Простота

Установите соответствие понятий и их определений:

A. Ковариация

B. Корреляция

C. Регрессия

D. среднее произведение отклонений признаков от их средних квадратических отклонений

E. величина, отражающая наличие связи между явлениями, процессами и характеризующими их показателями

F. величина, выражающая зависимость среднего значения случайной величины у от значений случайной величины х

Процедура, с помощью которой большое число переменных, относящихся к имеющимся наблюдениям, сводят к меньшему количеству независимых влияющих величин, называется … анализом

кластерным

факторным

дисперсионным

корреляционным

Индекс … – это показатель тесноты связи для нелинейной регрессии

По способу отбора, которые определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности, выделяют пять выборок. В частности, используется выборка, которая заключается в собственно-случайном либо механическом отборе групп единиц, внутри которых проводят сплошное обследование. Единица отбора при этой выборке – группа или серия, а не отдельная единица. Этот способ отбора удобен в тех случаях, когда единицы генеральной совокупности изначально объединены в небольшие более или менее равновеликие группы.

О какой выборке говорится в описании?

Типическая выборка.

Серийная выборка.

Комбинированная выборка.

… анализ позволяет разложить общую вариацию зависимой переменной на две составляющие – степень случайной изменчивости отклика Y и долю изменчивости отклика за счет влияния непрерывных предикторов X

Ковариационный

Дисперсионный

Регрессионный

… – это способ нахождения промежуточных значений функции в области ее определения

Корреляция

Дисперсия

Интерполяция

Детерминация

Диаграмма в виде столбцов, по оси абсцисс которой отображаются все

возможные значения переменной, а по оси ординат – частоты или относительные частоты каждого значения, – это …

… – это метод ортогонального вращения, при котором минимизируется число факторов, необходимых для объяснения исходных переменных

Варимакс

Квартимакс

Прямой облимин

Корреляционные методы — методы оценки тесноты связи, основанные на использовании, как правило, оценок нормального распределения

Расположите в правильной последовательности этапы проведения корреляционно-регрессионного анализа:

1 разделение признаков на факторные и результативные; выбор наиболее существенных признаков для их дальнейшего исследования и включения в корреляционную модель

2 предварительная оценка формы уравнения регрессии

3 вычисление коэффициентов регрессии и их смысловая интерпретация

4 расчет теоретически ожидаемых (рассчитанных по уравнению регрессии) значений результативного признака

5 определение и сравнительный анализ дисперсий: общей, факторной и остаточной; оценка тесноты связи между признаками, включенными в регрессионную модель

6 общая оценка качества модели, отсев несущественных (или включение дополнительных факторов)

…– это величина, характеризующая степень применимости факторного анализа к данной выборке

Критерий сферичности Бартлетта

Критерий адекватности выборки Кайзера–Мейера–Олкина

Коэффициент соответствия

Коэффициент стресса

Критерий … выборки показывает степень применимости факторного анализа к данной выборке

Установите правильную последовательность шагов применения правила «ящик с усами»:

1 определить выборочные значения межквартильного размаха Rμ и медианы µ

2 определить выборочные значения, меньшие (µ-1,5Rµ) и большие (µ+1,5Rµ), – подозрительные выбросы

3 определить выборочные значения, меньшие (µ-3Rµ) и большие (µ+3Rµ), – экстремальные выбросы; исключить их

… регрессия представляет собой регрессию между одной эндогенной и несколькими экзогенными переменными

Установите соответствие основных способов формирования выборочной совокупности и соответствующих вариантов отбора (выборки):

A. По виду отбора

B. По методу отбора

C. По способу отбора

D. индивидуальный, групповой и комбинированный отборы

E. повторный и бесповторный отбор

F. собственно-случайная выборка, механическая выборка, типическая выборка, серийная выборка, комбинированная выборка

… зависимость – это связь, при которой каждому фиксированному значению переменой х соответствует не одно, а множество значений зависимой переменной у, причем заранее нельзя сказать, какое именно значение примет у

Функциональной

Статистическая

Прямая

Обратная

… – это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для их постоянного хранения, передачи и обработки

… методы – это методы, подчиненные некоторым частным целевым установкам, но не формулируемые в терминах вероятностно-статистической теории

… коэффициенты корреляции – это линейные коэффициенты корреляции между каждым из предикторов и дискриминантной функцией

… случайная мера равна отношению числа точек в множестве А к числу точек во всем пространстве Х

Вероятность γ, с которой осуществляется событие |ΘГ-Θв |<δ, – это … оценки Θв

В отличие от дисперсионного и регрессионного анализов … анализ ANCOVA оперирует с набором предикторов, который включает как качественные группообразующие переменные, так и количественные переменные, измеренные в непрерывных шкалах

По способу отбора, которые определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности, выделяют пять выборок. В частности, используется выборка, которую применяют, когда генеральная совокупность каким-либо образом упорядочена или ранжирована, то есть существует определенная последовательность в расположении единиц. Сначала определяют, какое число единиц необходимо отобрать в выборочную совокупность. Затем разбивают генеральную совокупность на полученное число групп и из каждой группы выбирают по одной единице, которая стоит в середине группы. Это позволяет избежать систематической ошибки выборки. О какой выборке говорится в описании?

Типическая выборка.

Собственно-случайная выборка.

Механическая выборка.

Для характеристического уравнения... Собственный вектор, соответствующий этому собственному значению имеет вид (3 Y).

Чему равна координата y?

Координата у равна -2

Координата у равна -1

Координата у равна 3

По числу переменных, характеризующих объект исследования, данные делятся на …

одномерные и многомерные

количественные и качественные

первичные и вторичные

пространственные и временные

Компонентный анализ используется для …

оценки тесноты связи между количественным и качественным признаками

снижения размерности факторного пространства

многомерной группировки данных

оценки связи между количественными признаками

Установите соответствие понятия и его содержания:

A. Репродуцированная корреляция

B. Воспроизведенные корреляции

C. Матрица остатков корреляций

D. сумма произведений факторных нагрузок на сами факторы

E. корреляционная матрица оригинальных пунктов, которая бы получилась, если предположить, что рассчитанные факторы являются правильными и единственными факторами

F. матрица разностей между воспроизведенными и реальными корреляциями

… обследование предполагает измерение каждого из объектов генеральной совокупности

Установите соответствие видов расстояний в кластерном анализе и соответствующих им математических выражений:

A. Евклидово расстояние

B. Взвешенное евклидово расстояние

C. Расстояние по принципу «ближайшего соседа»

D. Манхэттенское расстояние

E.

F.

G.

H.

Последовательность значений количественного признака, расположенных в порядке возрастания (неубывания), – это … ряд

Установите правильную последовательность шагов проведения расчета однофакторного дисперсионного анализа в MS Excel:

1 сформировать таблицу с исходными данными

2 выбрать «Пакет анализа» в появившемся диалоговом окне метод «Однофакторный дисперсионный анализ» и нажать кнопку OK

3 в окне «Однофакторный дисперсионный анализ» установить для входных данных следующие параметры: входной интервал $R$2:$W$3, группирование – по строкам метки – выбранный нами входной диапазон не содержит метки, то есть названий строк и столбцов, альфа уровень значимости = 0,05

4 для параметров вывода установить переключатель в положение «Выходной интервал» и указать клетку с координатой P27

5 после завершения настройки параметров нажать «OK» (результаты дисперсионного анализа будут состоять из двух таблиц)

При определении влияния квалификации рабочего на его производительность были получены следующие значения общей и межгрупповой дисперсии:

-         общая дисперсия – 900;

-         межгрупповая дисперсия – 370.

Чему равна средняя внутригрупповая дисперсия?

Средняя внутригрупповая дисперсия равна 530

Средняя внутригрупповая дисперсия равна 1070

Средняя внутригрупповая дисперсия равна 243

По способу получения данные делятся на …

одномерные и многомерные

количественные и качественные

первичные и вторичные

пространственные и временные

… (средняя точка) – это средние значения для дискриминантных показателей конкретной группы

Установите правильную последовательность шагов алгоритма, который используется, чтобы найти кластеры по методу k-средних:

1 инициализировать (пользователь выбирает число К кластеров и назначает К гипотетических центров)

2 обновить кластеры (при заданных К центрах ck (k = 1, 2, ..., K) каждый объект i приписывать одному из центров по правилу минимального расстояния)

3 обновить центры (вычислить арифметический центр каждого кластера Sk, который и назначают новым центром ck (k = 1, 2, ..., K))

4 применить правило остановки (новые центры ck сравнить со старыми; если ck=ck для каждого k = 1, 2, ..., K – остановить вычисления и выдать результаты)

Установите соответствие методов и их характеристик:

A. Алгоритм Кестена

B. Алгоритм Литвакова

C. Бутстрепирование

D. применяют чтобы найти точку минимума в условиях наличия помех при измерениях

E. позволяет отыскать близкое к оптимальному значение вектора параметров λ=(λ1,…,λm) с помощью рекуррентной процедуры

F. включает многократный случайный отбор из имеющейся выборки с возвращением, что позволяет получить множество выборок большего объема для аппроксимации истинного закона распределения генеральной совокупности

Установите соответствие понятий и их определений:

A. Количественные данные

B. Вторичные данные

C. Дискретные данные

D. показатели, принимающие числовые значения, которые получаются путем некоторых измерений или подсчетов

E. данные, уже собранные специализированными фирмами или другими исследователями

F. данные, образующие счетное множество и принимающие только некоторые изолированные значения на числовой оси, между которыми значений быть не может

Расположите в правильной последовательности этапы метода многомерного шкалирования:

1 определение цели, задач и объектов исследования

2 сбор исходных данных

3 выбор метода и решение о конечной размерности пространства

4 построение пространственной карты

5 оценка надежности

Оценка качества модели факторного анализа может осуществляться на основе критерия …

Бартлетта

Спирмена

Фишера

Стьюдента

Многомерная статистическая процедура, которая выполняет сбор данных, содержащих информацию о выборке объектов, и затем упорядочивает объекты в сравнительно однородные группы, – это … анализ

корреляционный

факторный

кластерный

дисперсионный

Расположите в правильной последовательности этапы проведения факторного анализа:

1 вычисление корреляционной матрицы для всех переменных

2 выбор факторов

3 создание упрощенной структуры

4 проверка значимости модели

5 интерпретация результатов

Установите соответствие между коэффициентом и задачей, для которой он может использоваться:

A. Коэффициент детерминации

B. Коэффициент регрессии

C. Коэффициент корреляции Спирмена

D. оценка степени влияния неучтенных в модели факторов

E. оценка изменения результативной переменной под влиянием изменения факторных переменных

F. оценка связи качественных переменных модели

… предполагают взаимодействие между уровнями исследуемых факторов, причем эффект влияния одного фактора зависит от значения другого фактора

В двухфакторном дисперсионном анализе с повторениями

В двухфакторном дисперсионном анализе без повторений

Как в двухфакторном дисперсионном анализе с повторениями, так и в двухфакторном дисперсионном анализе без повторений

Имеется следующая выборка: 4, 6, 8, 9, 9, 12, 12, 14, 15, 18. Рассчитайте 10-процентное усеченное среднее для этой выборки.

10,625

10,7

10,75

Графическое представление результатов кластерного анализа реализуется в …

дендрограмме

гистограмме

полигоне

кумуляте

… используют в иерархических алгоритмах классификаций, принцип работы которых – последовательно объединять наблюдения, а затем и целые группы, сначала самых близкие, а затем все более и более отдаленные друг от друга

Расстояние между группами элементов

Взвешенное евклидово расстояние

Евклидово расстояние

Если дан вариационный ряд выборки объема n = 8: -2, 0, 1, 3, 4, 4, 5, 8, то выборочная мода для этого ряда равна …

… анализ позволяет проверить гипотезу о равенстве средних значений выборок (взяты ли выборки из одного распределения или из разных распределений)

Установите правильную последовательность шагов алгоритма проверки статистической гипотезы:

1 задать уровень значимости α, выбрать статистический критерий К, вычислить по таблицам для закона распределения К значение Ккр; определить вид критической области

2 по выборке вычислить наблюдаемое значение критерия Кнабл

3 если Кнабл попадает в критическую область, гипотеза Н0 отвергается; при попадании Кнабл в область принятия гипотезы гипотеза Н0 принимается

Диаграмма … – это гистограмма, изображающая частоты встречаемости признака в убывающем порядке, с наложенным точечно-линейным графиком накопленных частот

Установите соответствие между видом переменной и набором описательных статистик:

A. Номинальные качественные переменные

B. Порядковые качественные переменные

C. Дискретные количественные переменные

D. Непрерывные количественные переменные

E. частота, мода, гистограмма

F. ранг, мода, столбиковая диаграмма

G. вариационный ряд, полигон

H. плотность распределения

Выдвинутая гипотеза, которую нужно проверить, – это … гипотеза

Установите соответствие шкалы и ее характеристики:

A. Номинальная шкала

B. Порядковая шкала

C. Интервальная шкала

D. используется для описания принадлежности элементов к определенным классам

E. используется для упорядочения элементов по одному или нескольким признакам

F. показывает, насколько одно значение больше другого в принятых единицах измерения

Вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности характеризует … дисперсия

Статистическая оценка генерального параметра Θ_Г, которая определяется

одним числом, называется … оценкой

… критерия – это величина 1 – β, где β – вероятность ошибки второго рода

… – это доля дисперсии наблюдаемых переменных, обусловленная наличием общих факторов

Список литературы

Предварительный способ анализа выборки, заключающийся в присваивании одинаковых значений крайним наблюдениям выборки, называется методом …

Пуанкаре

Винзора

цензурирования

максимального правдоподобия

В кластерном анализе используют различные виды расстояний.

Один из этих видов – расстояние в городских кварталах, когда от А до Б мы можем передвигаться по улицам под прямым углом и никогда по диагонали. Такое расстояние зависит от вращения системы координат, но не зависит от отражения относительно оси координат или переноса.

О каком виде расстояний говорится в описании?

Евклидово расстояние

Расстояние по принципу «ближайшего соседа»

Манхэттенское расстояние

Непараметрические показатели связи позволяют судить о степени и тесноте связи для количественных и для атрибутивных признаков.

Один из этих показателей определяется по формуле:

K= ((ad-bc)/ корень из ((a+b)(c+d)(d+b(a+c))

 

Коэффициент ассоциации

Коэффициент контингенции

Коэффициент взаимной сопряженности Пирсона

Коэффициент Фехнера

… корреляционная матрица – это матрица корреляции, при вычислении которой наблюдения обрабатывают так, как будто они взяты из одной выборки

Необходимое условие анализа данных – отсутствие пропусков в данных. Если в совокупности присутствуют пропуски, то дальнейший анализ нужно предварить процедурой заполнения этих пропусков. Интерполяция – это нахождение промежуточных значений функции в области ее определения.

Существуют разные методы интерполяции. Один из них – простой, но действенный способ заполнить пробелы в данных. При таком подходе все недостающие данные заполняют средними арифметическими значениями либо по всем наблюдениям, либо только по N ближайшим точкам с обеих сторон пропущенного значения.

О каком методе интерполяции идет речь?

Метод среднего значения

Метод медианы

Метод расчета процента от знаковой величины

Ниже приведена динамика числа родившихся в России в период 2014-2023 гг. в виде таблицы и столбчатой диаграммы.

Какие данные представлены в данном примере?

Интервальные временные данные

Моментные временные данные

Пространственно-временные данные

По выборке Х1, …, Х100 из распределения F(x,θ) требуется проверить гипотезу о том, что неизвестный параметр θ равен 5 против альтернативы, что значение параметра θ больше 5.

Для проверки этой гипотезы применяется некоторый состоятельный критерий. Уровень значимости этого критерия равен 0,05.

Какое значение может принимать функция мощности этого критерия в точке 6?

0,05

Меньше, чем 0,05

Больше, чем 0,05

В окрестности 0,05

Имеется следующая выборка: 4, 6, 8, 9, 9, 12, 12, 14, 15, 18. Рассчитайте 10-процентное винзорированное среднее для этой выборки.

10

10,6

10,7

11

Сущность данного алгоритма состоит в следующем.

О каком алгоритме говорится в описании?

Алгоритм Роббинса–Монро

Алгоритм Литвакова

Алгоритм Кестена

Эта величина является мерой разброса чисел в ряду. Она определяется как среднее арифметическое квадратов отклонений чисел от их среднего арифметического. О каком понятии идет речь?

кумулята

мода

дисперсия

Непараметрические показатели связи позволяют судить о степени и тесноте связи для количественных и атрибутивных признаков. Один их этих показателей определяется по формуле: K=(C-h)/(C+H

Назовите этот непараметрический показатель связи.

Коэффициент ассоциации

Коэффициент взаимной сопряженности Пирсона

Коэффициент Фехнера

Дискриминантный анализ – это …

анализ различий заранее заданных групп объектов исследования

снижение размерности факторного пространства

последовательное объединение групп элементов

анализ связи между качественными и количественными признаками

В кластерном анализе используют различные виды расстояний.

Один из этих видов применяют в тех случаях, когда каждой компоненте xt вектора наблюдений X удается приписать некоторый «вес» wp, пропорционально степени важности признака в задаче классификации. Принимают вес больше 0 и меньше 1. Чтобы определить

«вес», нужно провести с дополнительные исследования, например, организовать опрос экспертов и обработать их мнения.

О каком виде расстояний говорится в описании?

Евклидово расстояние

«Взвешенное» евклидово расстояние

Расстояние по принципу «ближайшего соседа»

Для характеристического уравнения. Чему равно собственное значение

Собственное значение λ2 равно 3 

Собственное значение λ2 равно 2

Собственное значение λ2 равно 1

Этот способ визуализации данных используют, чтобы графически отобразить и анализировать категориальные номинальные данные. Это гистограмма, которая изображает частоты встречаемости признака в убывающем порядке, на которую накладывают точечно- линейный график из накопленных частот или процентов, долей. График отражает накопленную частоту значений признака.

Назовите данный способ визуализации данных.

Диаграмма Парето

Тепловая карта

Диаграмма рассеяния

Даны 6 объектов, которые характеризуются двумя признаками X1 и X2:

Чему равно евклидово расстояние d13?

Евклидово расстояние d13 равно 3

Евклидово расстояние d13 равно 5

Евклидово расстояние d13 равно 9

При определении влияния квалификации рабочего на его производительность были получены следующие значения общей и средней внутригрупповой дисперсии:

-         общая дисперсия – 900;

-         средняя внутригрупповая дисперсия – 300. Чему равна межгрупповая дисперсия?

Межгрупповая дисперсия равна 1200

Межгрупповая дисперсия равна 600

Межгрупповая дисперсия равна 300

Расположите в правильной последовательности этапы построения вариационного ряда:

1 определение среди имеющихся наблюдений xmin и хmах значений признака

2 определение размаха варьирования признака R

3 определение ширины интервала h

4 определение граничных значений интервалов (аi; bi)

5 группировка результатов наблюдения по интервалам

Когда при проверке гипотезы Н0:μ=μ0 против Н1:μ=μ1, следует выбирать правостороннюю критическую область …

μ1<μ0

μ1>μ0

μ1≠μ0

μ1=μ0

Статистический … – это правило, устанавливающее условия, при которых нулевую гипотезу следует либо принять, либо отвергнуть

Установите соответствие между классификациями и соответствующими типами данных:

A. По числу переменных, характеризующих объект исследования

B. По наличию упорядочивания во времени

C. По типу шкалы измерения

D. По способу получения

E. одномерные и многомерные массивы данных

F. пространственные и временные данные

G. количественные и качественные данные

H. первичные и вторичные данные

Пусть α – вероятность отвергнуть верную гипотезу, γ – доверительная вероятность, то есть вероятность принять верную гипотезу; тогда если α = 0,05, то …

γ=0,45

γ=0,95

γ=0,85

γ=0,955

Установите соответствие понятия и его содержания:

A. Статистическая оценка

B. Несмещенная оценка

C. Состоятельная оценка

D. Эффективная оценка

E. оценка, построенная на основе выборочной совокупности

F. оценка, математическое ожидание которой равно оцениваемому параметру

G. оценка, сходящаяся по вероятности к оцениваемому параметру

H. оценка, обладающая наименьшей дисперсией

Если нулевая гипотеза имеет вид Н0: р = 0,6, тогда конкурирующей гипотезой может являться … (укажите 3 варианта ответа)

р≤0,6

р≠0,6

р<0,6

р>0,6

Если нулевая гипотеза состоит в предположении, что параметр показательного распределения λ = 5, то конкурирующая гипотеза состоит в предложении, что …

λ≤5

λ≥5

λ≠5

λ≈5

Для того чтобы по выборке можно было судить о случайной величине, выборка должна быть …

бесповторной

повторной

безвозвратной

репрезентативной

Логарифмическое преобразование позволяет осуществить переход от нелинейной модели y = 5x2u к модели …

ln y = ln 5 + 2ln x + ln u

y = ln y + 5 +2ln x

y = ln 5 + 2In x + ln u

ln y = 5 + 2x + u

По типу шкалы измерения данные делятся на …

одномерные и многомерные

количественные и качественные

первичные и вторичные

пространственные и временные

Какое значение не может принимать Неверно, что парный коэффициент корреляции может принимать значение …

0,902

0,004

1,111

0,721

Установите соответствие между коэффициентом (индексом) и его формулой:

A. Коэффициент корреляции

B. Индекс корреляции

C. Коэффициент регрессии

D. Коэффициент детерминации

E.

F.

G.

H.

Неверно, что парный коэффициент корреляции может принимать значение …

-0,973

0,005

1,123

0,746

Значение коэффициента детерминации рассчитывается как отношение дисперсии результативного признака, объясненной регрессией, к … дисперсии результативного признака

общей

Расположите в правильной последовательности этапы проведения однофакторного дисперсионного анализа:

1 найти внутригрупповые и общую средние

2 найти внутригрупповые дисперсии

3 рассчитать среднюю из внутригрупповых дисперсий

4 найти межгрупповую дисперсию

5 рассчитать общую дисперсию

6 проверить расчет по правилу сложения дисперсий

Дисперсионный анализ используется для …

оценки тесноты связи между количественным и качественным признаками

снижения размерности факторного пространства

многомерной группировки данных

оценки связи между количественными признаками

Установите соответствие понятия и соответствующей ему формулы:

A. Внутригрупповая дисперсия

B. Межгрупповая дисперсия

C. Эмпирическое корреляционное отношение

D.

E.

F.

Установите соответствие вида дисперсии и ее характеристики:

A. Общая дисперсия (σ2)

B. Внутригрупповая дисперсия (σ 2)

C. Межгрупповая дисперсия (δx2)

D. характеризует вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности

E. отражает случайную вариацию, т.е. ту часть вариации признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка

F. характеризует вариацию, обусловленную влиянием признака-фактора, положенного в основание группировки, на значения исследуемого признака

Расположите в правильной последовательности этапы проведения однофакторного дисперсионного анализа:

1 найти внутригрупповые и общую средние

2 найти внутригрупповые дисперсии

3 рассчитать среднюю из внутригрупповых дисперсий

4 найти межгрупповую дисперсию

5 рассчитать общую дисперсию

6 проверить расчет по правилу сложения дисперсий

Эмпирический коэффициент детерминации определяется формулой …

1

2

3

4

Эмпирический коэффициент … характеризует долю межгрупповой дисперсии в общей дисперсии

Дисперсия отклонений значений признака от произвольного числа А, неравного средней величине, …

уменьшает дисперсию отклонений от средней на число, равное возведенной в квадрат разнице между средним и этим числом

не влияет на величину дисперсии отклонений

увеличивает дисперсию отклонений от средней на число, равное возведенной в квадрат разнице между средним и этим числом

… анализ – это процедура, с помощью которой большое число переменных, относящихся к имеющимся наблюдениям, сводят к меньшему количеству независимых влияющих величин, называется …

К методам снижения размерности следует отнести … анализ (укажите 2 варианта ответа)

факторный

регрессионный

корреляционный

кластерный

дифференциальный

Установите соответствие видов факторного анализа и их характеристик:

A. Стохастический факторный анализ

B. Детерминированный факторный анализ

C. Прямой факторный анализ

D. Обратный факторный анализ

E. методика исследования факторов, связь которых с результативным показателем является вероятностной

F. методика исследования факторов, связь которых с результативным показателем носит функциональный характер

G. методика, основанная на дедуктивном способе

H. методика, основанная на логической индукции

Непараметрические показатели связи позволяют судить о степени и тесноте связи для количественных и для атрибутивных признаков.

Один из этих показателей определяется по формуле:

K=(ad-bc)/(ad+bc)

 

Коэффициент ассоциации

Коэффициент контингенции

Коэффициент взаимной сопряженности Пирсона

Коэффициент Фехнера

Иерархическая … – это последовательное объединение групп элементов (сначала самых близких, а затем все более удаленных) в соответствии с матрицей расстояний

Исходные данные для кластерного анализа могут быть …

только качественными

только количественными

любыми

Пусть даны две точки трехмерного пространства – А(2; -3; 5) и В(4; 4; -4), тогда евклидово расстояние между ними равно квадратному корню из …

В результате разбиения объектов на группы по сходству признаков образуются …

системы

кластеры

совокупности

общности

блоки

Главная задача кластерного анализа – …

сегментация

объединение

пересечение

Метод максимального правдоподобия основывается на формуле …

1

2

3

4

Установите соответствие метода и его описания:

A. Метод Пуанкаре

B. Метод Винзора

C. Метод цензурирования

D. Метод максимального правдоподобия

E. предварительный способ анализа выборки, заключающийся в отбрасывании части максимальных и минимальных значений

F. предварительный способ анализа выборки, заключающийся в присваивании одинаковых значений крайним наблюдениям выборки

G. предварительный способ анализа выборки, заключающийся в фиксировании факта принадлежности элементов выборки некоторым крайним интервалам

H. метод оценивания неизвестного параметра путем максимизации функции правдоподобия

Если при построении статистических моделей функциональный вид распределения наблюдений задается, то такие модели называются …

параметрическими

непараметрическими

статистическими

независимыми

Метод, направленный на выявление выбросов, снижение их влияния или исключение их из выборки, называется …

робастным

независимым

факторным

кластерным

… эффект – это смещение среднего значения и увеличение меры разброса значений признака при наличии нескольких выбросов

Установите соответствие понятия и его математического выражения:

A. Средняя Пуанкаре

B. Средняя арифметическая

C. Средняя гармоническая

D. Средняя геометрическая

E.

F.

G.

H.

… выборки – это отбрасывание определенной части минимальных и/или максимальных наблюдений

Установите соответствие понятий и их характеристик:

A. Внутригрупповая дисперсия

B. Межгрупповая дисперсия

C. Эмпирический коэффициент детерминации

D. Эмпирическое корреляционное отношение

E. показывает ту часть вариации признака, которая обусловлена действием всех факторов, кроме группировочного

F. показывает ту часть общей дисперсии, которая обусловлена действием группировочного фактора

G. показывает долю общей дисперсии изучаемого признака, обусловленную фактором, положенным в основание группировки

H. показывает количественную оценку влияния факторного признака на вариацию результативного признака

… корреляция измеряет степень связи между дискриминантными показателями и группами, т.е. определяет принадлежность к данной группе

Данные, при составлении которых у каждого наблюдения регистрируется несколько признаков, – это … данные

первичные

пространственно-временные

непрерывные

многомерные

… коэффициент детерминации характеризует долю межгрупповой дисперсии в общей дисперсии

Уравнение … математически выражает среднюю величину одного признака как функцию другого

Процент цензурированных наблюдений относительно полного объема выборки – это …

Иерархические процедуры – это наиболее распространенные алгоритмы кластерного анализа, в которых начальное разбиение состоит из n одноэлементных классов, а конечное разбиение состоит из …

одного класса

двух классов

(n – 1) классов

(1 – n) классов

Данные, при составлении которых у каждого наблюдения регистрируется только один признак, – это … данные

одномерные

первичные

числовые

Установите соответствие понятий и их определений:

A. Интегральный показатель кластеризации

B. Коэффициент результативности

C. Коэффициент Уилкса (U- статистика)

D. функция, зависящая от исходных признаков, используемая для многомерной кластеризации в случае невозможности упорядочить классификационные признаки

E. сумма элементов, лежащих на диагонали классификационной матрицы, деленная на общее количество случаев

F. отношение внутригрупповой суммы квадратов к общей сумме квадратов

Метод корреляционных … предназначен для нахождения таких групп признаков, что корреляционная связь между параметрами одной группы достаточно велика, а связь между параметрами из разных групп – мала

Бинарные (дихотомические) переменные, которые имеют две категории или два значения, которые обычно кодируют …

числами 1 и -1

цифрами 0 и 1

знаками «+» и «-»

буквами x и y

… регрессия представляет собой регрессию между двумя переменными

… – это статистические методы, которые позволяют получать надежные оценки параметров с учетом неизвестного закона распределения генеральной совокупности и наличия существенных отклонений в значениях данных

Непараметрические методы

Параметрические методы

Методы робастного оценивания

Число объектов совокупности называется …

плотностью совокупности

объемом совокупности

дисперсией

модой

Класс методов для представления восприятий и предпочтений респондентов в пространстве с помощью наглядного изображения – это …

многомерное шкалирование

прямой облимин

эвристические методы

Установите соответствие понятий и их определений:

A. Медиана

B. Мода

C. Полигон

D. значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности

E. наиболее часто встречающееся значение переменной

F. графическое изображение сгруппированного дискретного вариационного ряда в виде ломаной линии

… модели регрессии – это соответствие теоретических данных, полученных на основе уравнения регрессии, фактическим статистическим данным

Адекватность

Надежность

Линейность

Простота

Установите соответствие понятий и их определений:

A. Ковариация

B. Корреляция

C. Регрессия

D. среднее произведение отклонений признаков от их средних квадратических отклонений

E. величина, отражающая наличие связи между явлениями, процессами и характеризующими их показателями

F. величина, выражающая зависимость среднего значения случайной величины у от значений случайной величины х

Процедура, с помощью которой большое число переменных, относящихся к имеющимся наблюдениям, сводят к меньшему количеству независимых влияющих величин, называется … анализом

кластерным

факторным

дисперсионным

корреляционным

Индекс … – это показатель тесноты связи для нелинейной регрессии

По способу отбора, которые определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности, выделяют пять выборок. В частности, используется выборка, которая заключается в собственно-случайном либо механическом отборе групп единиц, внутри которых проводят сплошное обследование. Единица отбора при этой выборке – группа или серия, а не отдельная единица. Этот способ отбора удобен в тех случаях, когда единицы генеральной совокупности изначально объединены в небольшие более или менее равновеликие группы.

О какой выборке говорится в описании?

Типическая выборка.

Серийная выборка.

Комбинированная выборка.

… анализ позволяет разложить общую вариацию зависимой переменной на две составляющие – степень случайной изменчивости отклика Y и долю изменчивости отклика за счет влияния непрерывных предикторов X

Ковариационный

Дисперсионный

Регрессионный

… – это способ нахождения промежуточных значений функции в области ее определения

Корреляция

Дисперсия

Интерполяция

Детерминация

Диаграмма в виде столбцов, по оси абсцисс которой отображаются все

возможные значения переменной, а по оси ординат – частоты или относительные частоты каждого значения, – это …

… – это метод ортогонального вращения, при котором минимизируется число факторов, необходимых для объяснения исходных переменных

Варимакс

Квартимакс

Прямой облимин

Корреляционные методы — методы оценки тесноты связи, основанные на использовании, как правило, оценок нормального распределения

Расположите в правильной последовательности этапы проведения корреляционно-регрессионного анализа:

1 разделение признаков на факторные и результативные; выбор наиболее существенных признаков для их дальнейшего исследования и включения в корреляционную модель

2 предварительная оценка формы уравнения регрессии

3 вычисление коэффициентов регрессии и их смысловая интерпретация

4 расчет теоретически ожидаемых (рассчитанных по уравнению регрессии) значений результативного признака

5 определение и сравнительный анализ дисперсий: общей, факторной и остаточной; оценка тесноты связи между признаками, включенными в регрессионную модель

6 общая оценка качества модели, отсев несущественных (или включение дополнительных факторов)

…– это величина, характеризующая степень применимости факторного анализа к данной выборке

Критерий сферичности Бартлетта

Критерий адекватности выборки Кайзера–Мейера–Олкина

Коэффициент соответствия

Коэффициент стресса

Критерий … выборки показывает степень применимости факторного анализа к данной выборке

Установите правильную последовательность шагов применения правила «ящик с усами»:

1 определить выборочные значения межквартильного размаха Rμ и медианы µ

2 определить выборочные значения, меньшие (µ-1,5Rµ) и большие (µ+1,5Rµ), – подозрительные выбросы

3 определить выборочные значения, меньшие (µ-3Rµ) и большие (µ+3Rµ), – экстремальные выбросы; исключить их

… регрессия представляет собой регрессию между одной эндогенной и несколькими экзогенными переменными

Установите соответствие основных способов формирования выборочной совокупности и соответствующих вариантов отбора (выборки):

A. По виду отбора

B. По методу отбора

C. По способу отбора

D. индивидуальный, групповой и комбинированный отборы

E. повторный и бесповторный отбор

F. собственно-случайная выборка, механическая выборка, типическая выборка, серийная выборка, комбинированная выборка

… зависимость – это связь, при которой каждому фиксированному значению переменой х соответствует не одно, а множество значений зависимой переменной у, причем заранее нельзя сказать, какое именно значение примет у

Функциональной

Статистическая

Прямая

Обратная

… – это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для их постоянного хранения, передачи и обработки

… методы – это методы, подчиненные некоторым частным целевым установкам, но не формулируемые в терминах вероятностно-статистической теории

… коэффициенты корреляции – это линейные коэффициенты корреляции между каждым из предикторов и дискриминантной функцией

… случайная мера равна отношению числа точек в множестве А к числу точек во всем пространстве Х

Вероятность γ, с которой осуществляется событие |ΘГ-Θв |<δ, – это … оценки Θв

В отличие от дисперсионного и регрессионного анализов … анализ ANCOVA оперирует с набором предикторов, который включает как качественные группообразующие переменные, так и количественные переменные, измеренные в непрерывных шкалах

По способу отбора, которые определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности, выделяют пять выборок. В частности, используется выборка, которую применяют, когда генеральная совокупность каким-либо образом упорядочена или ранжирована, то есть существует определенная последовательность в расположении единиц. Сначала определяют, какое число единиц необходимо отобрать в выборочную совокупность. Затем разбивают генеральную совокупность на полученное число групп и из каждой группы выбирают по одной единице, которая стоит в середине группы. Это позволяет избежать систематической ошибки выборки. О какой выборке говорится в описании?

Типическая выборка.

Собственно-случайная выборка.

Механическая выборка.

Для характеристического уравнения... Собственный вектор, соответствующий этому собственному значению имеет вид (3 Y).

Чему равна координата y?

Координата у равна -2

Координата у равна -1

Координата у равна 3

По числу переменных, характеризующих объект исследования, данные делятся на …

одномерные и многомерные

количественные и качественные

первичные и вторичные

пространственные и временные

Компонентный анализ используется для …

оценки тесноты связи между количественным и качественным признаками

снижения размерности факторного пространства

многомерной группировки данных

оценки связи между количественными признаками

Установите соответствие понятия и его содержания:

A. Репродуцированная корреляция

B. Воспроизведенные корреляции

C. Матрица остатков корреляций

D. сумма произведений факторных нагрузок на сами факторы

E. корреляционная матрица оригинальных пунктов, которая бы получилась, если предположить, что рассчитанные факторы являются правильными и единственными факторами

F. матрица разностей между воспроизведенными и реальными корреляциями

… обследование предполагает измерение каждого из объектов генеральной совокупности

Установите соответствие видов расстояний в кластерном анализе и соответствующих им математических выражений:

A. Евклидово расстояние

B. Взвешенное евклидово расстояние

C. Расстояние по принципу «ближайшего соседа»

D. Манхэттенское расстояние

E.

F.

G.

H.

Последовательность значений количественного признака, расположенных в порядке возрастания (неубывания), – это … ряд

Установите правильную последовательность шагов проведения расчета однофакторного дисперсионного анализа в MS Excel:

1 сформировать таблицу с исходными данными

2 выбрать «Пакет анализа» в появившемся диалоговом окне метод «Однофакторный дисперсионный анализ» и нажать кнопку OK

3 в окне «Однофакторный дисперсионный анализ» установить для входных данных следующие параметры: входной интервал $R$2:$W$3, группирование – по строкам метки – выбранный нами входной диапазон не содержит метки, то есть названий строк и столбцов, альфа уровень значимости = 0,05

4 для параметров вывода установить переключатель в положение «Выходной интервал» и указать клетку с координатой P27

5 после завершения настройки параметров нажать «OK» (результаты дисперсионного анализа будут состоять из двух таблиц)

При определении влияния квалификации рабочего на его производительность были получены следующие значения общей и межгрупповой дисперсии:

-         общая дисперсия – 900;

-         межгрупповая дисперсия – 370.

Чему равна средняя внутригрупповая дисперсия?

Средняя внутригрупповая дисперсия равна 530

Средняя внутригрупповая дисперсия равна 1070

Средняя внутригрупповая дисперсия равна 243

По способу получения данные делятся на …

одномерные и многомерные

количественные и качественные

первичные и вторичные

пространственные и временные

… (средняя точка) – это средние значения для дискриминантных показателей конкретной группы

Установите правильную последовательность шагов алгоритма, который используется, чтобы найти кластеры по методу k-средних:

1 инициализировать (пользователь выбирает число К кластеров и назначает К гипотетических центров)

2 обновить кластеры (при заданных К центрах ck (k = 1, 2, ..., K) каждый объект i приписывать одному из центров по правилу минимального расстояния)

3 обновить центры (вычислить арифметический центр каждого кластера Sk, который и назначают новым центром ck (k = 1, 2, ..., K))

4 применить правило остановки (новые центры ck сравнить со старыми; если ck=ck для каждого k = 1, 2, ..., K – остановить вычисления и выдать результаты)

Установите соответствие методов и их характеристик:

A. Алгоритм Кестена

B. Алгоритм Литвакова

C. Бутстрепирование

D. применяют чтобы найти точку минимума в условиях наличия помех при измерениях

E. позволяет отыскать близкое к оптимальному значение вектора параметров λ=(λ1,…,λm) с помощью рекуррентной процедуры

F. включает многократный случайный отбор из имеющейся выборки с возвращением, что позволяет получить множество выборок большего объема для аппроксимации истинного закона распределения генеральной совокупности

Установите соответствие понятий и их определений:

A. Количественные данные

B. Вторичные данные

C. Дискретные данные

D. показатели, принимающие числовые значения, которые получаются путем некоторых измерений или подсчетов

E. данные, уже собранные специализированными фирмами или другими исследователями

F. данные, образующие счетное множество и принимающие только некоторые изолированные значения на числовой оси, между которыми значений быть не может

Расположите в правильной последовательности этапы метода многомерного шкалирования:

1 определение цели, задач и объектов исследования

2 сбор исходных данных

3 выбор метода и решение о конечной размерности пространства

4 построение пространственной карты

5 оценка надежности

Оценка качества модели факторного анализа может осуществляться на основе критерия …

Бартлетта

Спирмена

Фишера

Стьюдента

Многомерная статистическая процедура, которая выполняет сбор данных, содержащих информацию о выборке объектов, и затем упорядочивает объекты в сравнительно однородные группы, – это … анализ

корреляционный

факторный

кластерный

дисперсионный

Расположите в правильной последовательности этапы проведения факторного анализа:

1 вычисление корреляционной матрицы для всех переменных

2 выбор факторов

3 создание упрощенной структуры

4 проверка значимости модели

5 интерпретация результатов

Установите соответствие между коэффициентом и задачей, для которой он может использоваться:

A. Коэффициент детерминации

B. Коэффициент регрессии

C. Коэффициент корреляции Спирмена

D. оценка степени влияния неучтенных в модели факторов

E. оценка изменения результативной переменной под влиянием изменения факторных переменных

F. оценка связи качественных переменных модели

… предполагают взаимодействие между уровнями исследуемых факторов, причем эффект влияния одного фактора зависит от значения другого фактора

В двухфакторном дисперсионном анализе с повторениями

В двухфакторном дисперсионном анализе без повторений

Как в двухфакторном дисперсионном анализе с повторениями, так и в двухфакторном дисперсионном анализе без повторений

Имеется следующая выборка: 4, 6, 8, 9, 9, 12, 12, 14, 15, 18. Рассчитайте 10-процентное усеченное среднее для этой выборки.

10,625

10,7

10,75

Графическое представление результатов кластерного анализа реализуется в …

дендрограмме

гистограмме

полигоне

кумуляте

… используют в иерархических алгоритмах классификаций, принцип работы которых – последовательно объединять наблюдения, а затем и целые группы, сначала самых близкие, а затем все более и более отдаленные друг от друга

Расстояние между группами элементов

Взвешенное евклидово расстояние

Евклидово расстояние

Если дан вариационный ряд выборки объема n = 8: -2, 0, 1, 3, 4, 4, 5, 8, то выборочная мода для этого ряда равна …

… анализ позволяет проверить гипотезу о равенстве средних значений выборок (взяты ли выборки из одного распределения или из разных распределений)

Установите правильную последовательность шагов алгоритма проверки статистической гипотезы:

1 задать уровень значимости α, выбрать статистический критерий К, вычислить по таблицам для закона распределения К значение Ккр; определить вид критической области

2 по выборке вычислить наблюдаемое значение критерия Кнабл

3 если Кнабл попадает в критическую область, гипотеза Н0 отвергается; при попадании Кнабл в область принятия гипотезы гипотеза Н0 принимается

Диаграмма … – это гистограмма, изображающая частоты встречаемости признака в убывающем порядке, с наложенным точечно-линейным графиком накопленных частот

Установите соответствие между видом переменной и набором описательных статистик:

A. Номинальные качественные переменные

B. Порядковые качественные переменные

C. Дискретные количественные переменные

D. Непрерывные количественные переменные

E. частота, мода, гистограмма

F. ранг, мода, столбиковая диаграмма

G. вариационный ряд, полигон

H. плотность распределения

Выдвинутая гипотеза, которую нужно проверить, – это … гипотеза

Установите соответствие шкалы и ее характеристики:

A. Номинальная шкала

B. Порядковая шкала

C. Интервальная шкала

D. используется для описания принадлежности элементов к определенным классам

E. используется для упорядочения элементов по одному или нескольким признакам

F. показывает, насколько одно значение больше другого в принятых единицах измерения

Вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности характеризует … дисперсия

Статистическая оценка генерального параметра Θ_Г, которая определяется

одним числом, называется … оценкой

… критерия – это величина 1 – β, где β – вероятность ошибки второго рода

… – это доля дисперсии наблюдаемых переменных, обусловленная наличием общих факторов

Вам подходит эта работа?
Похожие работы
Социальная статистика
Тест Тест
25 Окт в 12:46
28
1 покупка
Другие работы автора
Финансовая математика
Тест Тест
19 Ноя в 18:40
16
0 покупок
Финансовая математика
Тест Тест
19 Ноя в 18:38
14
0 покупок
Финансовая математика
Тест Тест
19 Ноя в 18:37
10
0 покупок
Финансовая математика
Тест Тест
19 Ноя в 12:15
17
0 покупок
Финансовая математика
Тест Тест
19 Ноя в 12:06
13
0 покупок
Темы журнала
Показать ещё
Прямой эфир