Язык программирования -- R

Отменен
Заказ
1064570
Раздел
Программирование
Предмет
Основы программирования
Антиплагиат
Не указан
Срок сдачи
15 Дек 2017 в 10:00
Цена
Договорная
Блокировка
10 дней
Размещен
14 Дек 2017 в 21:15
Просмотров
189
Описание работы
Необходимо сделать домашнее задание:
дисциплина -- Интеллектуальный анализ данных и основы машинного обучени
Описание задания:
В качестве домашнего задания вам предлагается проанализировать набор данных о транзакциях совершенных потребителями с использованием банковских карт. Ваша задача подготовить отчет о структуре данных и особенностях транзакций совершаемых мужчинами и женщинами. На основе такого анализа и любых других методов предложить набор фич на основе которых вы будете строить прогностическую модель. Обучить модель на предложенных обучающих данных и предсказать пол для клиентов из тестовой выборки (id в диапазоне от 3001 до 3500)
В результате выполнения вы должны подготовить отчет и файл с вашим прогнозом
Отчет должен быть выполнен в формате Rmd, компилироваться и содержать следующие разделы
1. Определение начальной даты. В данном разделе вы должны проанализировать распределения совершаемых операций. На основе этого анализа вы должны предложить дату для дня номер 0. Оценивается не точность определения даты, а обоснованность вашего предположения
2. Определение пола. На основе анализа операций вы должны предложить расшифровку пола из 0/1 в М/Ж. Вы должны привести аргументы, подтверждающие ваш выбор. Оценивается не точность, а обоснованность вашего предположения
3. Построение модели и отбор фич. Данный раздел должен содержать построение модели и отбор фич. Не забудьте разделить выборку на обучающую и тестовую. Предложите несколько моделей (как минимум, две) и сравните их по качеству работы на выделенной вами тестовой выборке. Вам предлагается построить прогноз пола и прогноз "вероятности" пола. Вы можете использовать одну и ту же модель для обоих прогнозов, а можете разные. И не забудьте об описании и обосновании действи
4. Прогноз . В этой части сопровождать код текстом не обязательно. Это служебная часть для создания итогового файла с прогнозом. Для выбранной вами модели, построенной в предыдущем разделе, постройте прогноз для заданной нами выборки transactionstest.csv (id в диапазоне от 3001 до 3500). Ваш прогноз должен быть записан в data.frame содержащий три поля: id, gender, gender_prob, где gender -- это ваш прогноз пола, а genderprob -- вероятность пола 1
Язык программирования -- R. Дедлайн -- 15 декабря.
Сколько будет стоить работа?
Если возьметесь, скину все вводные данные (датасеты), и могу скинуть пример того, как это должно выглядеть
Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу 1 год
Средний балл 4.96
Стоимость Назначаете сами
Эксперт Выбираете сами
Уникальность работы от 70%
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Темы журнала
Показать ещё
Прямой эфир