Работа должна быть оформлена в формате MS Word (либо PDF).
Все полученные результаты расчетов (выполненные либо в SPSS, либо в R, либо в EXCEL, либо в Python но подробно и по шагам) должны быть описаны выводами в текстовом формате.
1. 2 балла – Каждый студент формирует свою базу данных, определяя проблематику исследования. Использовать данные пространственной выборки объемом не менее 80 наблюдений (субъекты РФ, страны, компании и т.п.). В базу данных необходимо включить не менее 6 непрерывных и 2 бинарных переменных, а также бинарный ответ на задачу классификации (целевую переменную). Сформулировать задачу классификации.
2. 3 балла – По сформированной базе данных провести линейный дискриминантный анализ:
2.1. Выделить 1-3 наблюдения (резко выделяющихся, наиболее удаленных от центров кластеров), подлежащих дискриминации;
2.2. Провести дискриминантный анализ;
2.3. Записать выражение для дискриминантной функции;
2.4. Оценить значимость дискриминантной функции (по коэффициенту Уилкса);
2.5. Определить относительный вклад каждой переменной в формирование классов;
2.6. Определить, чему равны средние значения дискриминантной функции по группам;
2.7. Указать, к каким группам были отнесены классифицируемые объекты и вероятности, с которыми объекты входят в эти группы;
2.8. На основании анализа таблицы «Wilks’ Lambda» проверьте значимость различий средних значений дискриминантной функции в двух группах;
2.9. Оценить качество дискриминантного анализа (на основании результатов таблицы Eigenvalue);
2.10. Оценить целесообразность проведения дискриминантного анализа по Вашим данным.
3. 2,5 балла – Построение дерева классификации (методы CHAID или CRT на выбор):
3.1. Выбор зависимой переменной – дискретная шкала;
3.2. Построение деревьев с помощью метода CHAID (или CRT) с различными независимыми переменными;
3.3. Выбор оптимального дерева с помощью таблицы классификации;
3.4. Визуализация результатов;
3.5. Интерпретация результатов.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |