Анализ данных, 4-7 лаб работа

Выполнен
Заказ
5251248
Раздел
Программирование
Предмет
Имитационное моделирование
Антиплагиат
Не указан
Срок сдачи
6 Мар 2023 в 23:55
Цена
Договорная
Блокировка
10 дней
Размещен
27 Фев 2023 в 11:42
Просмотров
96
Описание работы

Цена договорная

4 лаба

1. Очистить данные с использованием функции is.na() [1].

2. Сгенерировать таблицу данных с числовыми и текстовые столбцами. Очистить данные с помощью функции complete.cases() [1].

3. Сгенерировать числовую таблицу данных с пропусками. С использованием функции preProcess из пакета caret заполнить пропуски предсказанными значениями (среднее,

медиана) [2].

4. Сгенерировать два числовых набора данных, добавить в них выбросы. С использованием функции boxplot обнаружить выбросы и удалить их [3, 4].

5. Сгенерируйте таблицу данных, в которой дублируются строки. Удалите строки с использованием функций unique(), duplicated(). Сравните результаты [5].

6. Обработать пропуски в данных с использованием пакета mice [6].

7. Разобрать пример с мультиколлинеарностью [7].

8. Всю представленную работу собрать в единый файл Rmarkdown. Опубликовать его на RPubs, в качестве отчета о лабораторной работе представить ссылку на полученный файл.

5-лаба

1. Установить пакет CARET, выполнить команду names(getModelInfo()), ознакомиться со списком доступных методов выбора признаков. Выполните графический разведочный анализ данных с использование функции featurePlot() для набора данных из справочного файла пакета CARET:

x <- matrix(rnorm(50*5),ncol=5)

y <- factor(rep(c("A", "B"), 25))

Сохранить полученные графики в *.jpg файлы. Сделать выводы.

2. С использование функций из пакета Fselector [2] определить важность признаков для решения задачи классификации. Использовать набор data(iris). Сделать выводы.

3. С использованием функции discretize() из пакета arules выполните преобразование непрерывной переменной в категориальную [3] различными методами: «interval» (равная ширина интервала), «frequency» (равная частота), «cluster» (кластеризация) и «fixed» (категории задают границы интервалов). Используйте набор данных iris. Сделайте выводы

3. Установите пакет Boruta и проведите выбор признаков для набора данных data("Ozone") [4, 5, 6]. Построить график boxplot, сделать выводы.

4. Всю представленную работу собрать в единый файл Rmarkdown. Опубликовать его на RPubs, в качестве отчета о лабораторной работе представить ссылку на полученный файл.

6-лаба

1. Выполните классификацию k-ближайших соседей с использованием функции knn() из пакета class на наборе данных iris [1]. Проведите нормализацию данных, разделите выборку на обучающую и тестовую. Оцените построенную модель с использованием функции CrossTable() из пакета gmodels. Постройте матрицу ошибок [2] и диагональную оценку качества прогноза (diagonal mark quality prediction).

2. Рассмотрите пример реализации метода опорных векторов с использованием функции svm() из пакета e1071. Постройте линейный классификатор для прогнозирования. Для подбора параметров модели выполните перекрестную проверку с делением исходной выборки на 10 равных частей (cross=10) [3, c.172]. 3. Выполните расчет главных компонент с использованием пакета vegan() и его функции rda(). Постройте ординационную диаграмму методом PCA [3, c. 49] и сделайте выводы.

7-лаба

1. Установить интегрированную среду разработки Rstudio

https://download1.rstudio.org/desktop/windows/RStudio-1.4.1103.exe

2. В качестве отчета необходимо представить архив содержащий следующие файлы:

  • Текстовый файл с логом выполнения интерактивной части лабораторной работы (log7_ФамилияИО.txt)
  • Программный код самостоятельного задания(lr7_ФамилияИО.R).

Могу отправить примеры

Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу 1 год
Средний балл 4.96
Стоимость Назначаете сами
Эксперт Выбираете сами
Уникальность работы от 70%
Время выполнения заказа:
7 дней 10 часов 45 минут
Выполнен в срок
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Темы журнала
Показать ещё
Прямой эфир