Задание 1. Тема: Проверка статистических гипотез
Задание 1.1.
Чтобы оценить производственную эффективность предложенной к внедрению технологии, проведена проверка качества продукции, выпущенной на старой и новой автоматических линиях, при этом получены следующие данные об удельном весе продукции высшего качества, в %:
Таблица 1
Данные об удельном весе продукции высшего качества
№ партии Старая линия № партии Новая линия
1 57 1 73
2 61 2 60
3 55 3 68
4 66 4 77
5 40 5 81
6 41 6 78
7 50 7 68
8 66 8 77
9 52 9 74
10 44 10 63
11 85
12 62
Установить, действительно ли новая линия, налаженная на передовую технологию, позволяет получать более высокий уровень качества продукции. Для этого проверить гипотезы о равенстве средних значений и дисперсий доли качественной продукции. Решить задачу при α=0,005.
Задание 1.2.
Сравните вектора средних и ковариационные матрицы показателей Вологодской области для районов с номерами 1-12 и с номерами 13-26.
Решить задачу при α=0,01.
Таблица 4
Данные по районам
№ района Название района Х1 Х2 Х3
1 Бабаевский 12,3 19,8 10,74
2 Бабушкинский 14,2 23,2 7,93
3 Белозерский 9,8 19,8 9,06
4 Вашкинский 10,4 21,5 7,77
5 Великоустюгский 11,5 18,7 8,77
6 Верховажский 15,1 16,9 7,78
7 Вожегодский 11,8 20,9 7,99
8 Вологодский 11,6 15,7 9,93
9 Вытегорский 13,8 19,5 9,88
10 Грязовецкий 13,1 16 10,1
11 Кадуйский 10,5 18,6 11,64
12 Кирилловский 10,1 20,1 9,13
13 Кич-Городецкий 11 20,6 7,63
14 Междуреченский 11,6 19,5 8,46
15 Никольский 12,8 17,8 7,87
16 Нюксенский 12,7 17,9 10,52
17 Сокольский 12,5 19 9,09
18 Сямженский 11,3 18,7 9,33
19 Тарногский 11,3 18,6 7,68
20 Тотемский 12 16,8 9,85
21 Усть-Кубинский 9,4 20,1 8,53
22 Устюженский 11,2 19,3 7,79
23 Харовский 9,7 19,7 8,66
24 Чагодощенский 12,7 23,2 10,25
25 Череповецкий 13,8 19,2 10,12
26 Шекснинский 11 14,9 10,4
Показатель Х1 - Коэффициент рождаемости (число родившихся на 1000 человек населения, промилле).
Показатель Х2 – Коэффициент смертности (число умерших на 1000 человек населения, промилле).
Показатель Х3 - Среднемесячная номинальная начисленная заработная плата работников организаций (тыс. рублей).
Задание 2. Тема: Робастное статистическое оценивание
По данным представленным в таблице 4 (Задание 1.2.) необходимо проверить выборочную совокупность из трёх показателей на наличие грубых ошибок и найти значения обычных и устойчивых средних и среднеквадратических отклонений с использованием различных подходов.
Задание 3. Тема: Корреляционный анализ
По данным о муниципальных образованиях Вологодской области методами корреляционного анализа исследуется взаимосвязь между различными статистическими показателями. Данные для выбора исходных показателей в зависимости от варианта представлены в таблице:
Таблица 13
Данные по районам
№ района Название района Х1 Х2 Х3
1 Бабаевский 12,3 10,74 14,77
2 Бабушкинский 14,2 7,93 0,59
3 Белозерский 9,8 9,06 7,29
4 Вашкинский 10,4 7,77 2,84
5 Великоустюгский 11,5 8,77 8,94
6 Верховажский 15,1 7,78 3,93
7 Вожегодский 11,8 7,99 4,97
8 Вологодский 11,6 9,93 5,52
9 Вытегорский 13,8 9,88 8,64
10 Грязовецкий 13,1 10,10 131,70
11 Кадуйский 10,5 11,64 12,03
12 Кирилловский 10,1 9,13 7,96
13 Кич-Городецкий 11,0 7,63 1,46
14 Междуреченский 11,6 8,46 0,77
15 Никольский 12,8 7,87 1,86
16 Нюксенский 12,7 10,52 7,65
17 Сокольский 12,5 9,09 175,30
18 Сямженский 11,3 9,33 2,00
19 Тарногский 11,3 7,68 0,02
20 Тотемский 12,0 9,85 6,98
21 Усть-Кубинский 9,4 8,53 2,48
22 Устюженский 11,2 7,79 2,78
23 Харовский 9,7 8,66 13,27
24 Чагодощенский 12,7 10,25 16,88
25 Череповецкий 13,8 10,12 5,68
26 Шекснинский 11,0 10,40 13,42
Показатель Х1 - Коэффициент рождаемости (число родившихся на 1000 человек населения, промилле).
Показатель Х2 - Среднемесячная номинальная начисленная заработная плата работников организаций (тыс. рублей).
Показатель Х3 – Доля работников, занятых в неблагоприятных условиях труда.
Требуется:
1. Рассчитать вектора средних и среднеквадратических отклонений, матрицу парных корреляций;
2. Проверить при α=0,05 значимость парных коэффициентов корреляции и найти их интервальную оценку с доверительной вероятностью γ=0,95;
3. По корреляционной матрице рассчитать частные коэффициенты корреляции;
4. Проверить при α=0,05 значимость частных коэффициентов корреляции и определить их интервальную оценку с доверительной вероятностью γ=0,95;
5. По корреляционной матрице вычислить оценку множественных коэффициентов корреляции и при α=0,05 проверить гипотезы о равенстве нулю множественных коэффициентов корреляции.
Сделать выводы.
Задание 4. Тема: Кластерный анализ.
Задание 4.1.
По данным табл. 13 (Задание 3) провести классификацию районов области, каждый из которых характеризуется тремя признаками X1, X2 и X3.
Результаты классификации объектов представить в виде дендрограм-мы.
Указание: Для проведения кластеризации использовать агломеративный иерархический метод. В качестве расстояния между объектами выбрать евклидово расстояние. Расстояние между кластерами находить по принципу «ближайшего соседа».
Задание 4.2.
На основании таблицы 13 (Задание 3) выполнить иерархический дивизимный кластерный анализ. Расстояние между кластерами находить по принципу “дальнего соседа”.