Представлены данные о посетителях магазина детских товаров, имеющих карту лояльности (ссылка на файл с данными, если не работает скопируйте в адресную строку:
https://courses.openedu.ru/asset-v1:spbu+SEGMENT+self_paced_2022+type@asset+block
@%D0%94%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5_%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82.csv).
Наличие такой карты позволило собрать следующие сведения:
Количественные данные:
• Среднемесячный доход;
• Возраст;
• Количество несовершеннолетних детей;
• Суммарный чек за месяц;
• Количество посещений магазина в течение месяца.
Качественные данные:
• Пол;
• Образование;
• Семейное положение.
Критерии проверки
1 По одному баллу за каждую найденную характеристику из задачи 1. Максимальное количество баллов за задание – 3.
2 Можно применять как иерархический кластерный анализ, так и метод k-средних. При использовании иерархического кластерного анализа необходимо стандартизировать данные, при использование метода k-средних стандартизация возможна, но не обязательна. После проведения кластеризации необходимо выбрать количество кластеров рассчитать средние значения показателей для каждого кластера и описать кластеры (проинтерпретировать результаты). Максимальное количество баллов за задание – 4.
3 Если в пункте 3. Было выбрано 2 кластера, то использовать А/В тестирование, если более двух кластеров, то одномерный дисперсионный анализ. Предварительно необходимо проверить, являются ли данные показателей для кластеров нормальными. По 1 баллу за проверку каждого показателя (средний чек, количество посещений и возраст). Максимальное количество баллов за задание – 3.
4 Выбрать статистический критерий и написать, почему был выбран такой. Провести необходимые процедуры для проведения тестов. По 1 баллу за каждый тест проверки значимости в различие показателей для кластеров. Максимальное количество баллов за задание – 3.
Задание 1
Выбрать целевую группу по следующему правилу – самая многочисленная группа (по факторным переменным).
Задачи:
1. Предварительный анализ:
a. Найти максимальное, минимальное и среднее значение суммарного чека для клиентов разного пола, образования и семейного статуса.
2. Для сформированного в п. 1 сегмента разбить данные на кластеры с помощью автоматического сегментирования (кластерного анализа), выполненного для количественных переменных. Проинтерпретировать полученные кластеры.
3. Для полученных кластеров проверить, различаются ли существенно средние чеки, количество посещений и возраст (дисперсионный анализ или А/В тестирование).
Задание 2
Выделить самостоятельно целевую группу – сегмент по какому-то одному признаку, например, молодежь, семьи с детьми и т.п. и описать ее с экономической точки зрения.
Задачи:
1. Провести автоматическое сегментирование по количественным переменным для этой группы. Проинтерпретировать результат.
2. Для полученных кластеров проверить, различаются ли существенно используемые количественные переменные (дисперсионный анализ или А/В тестирование).
файл прикреплю лично в сообщения
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |