Цена договорная
4 лаба
1. Очистить данные с использованием функции is.na() [1].
2. Сгенерировать таблицу данных с числовыми и текстовые столбцами. Очистить данные с помощью функции complete.cases() [1].
3. Сгенерировать числовую таблицу данных с пропусками. С использованием функции preProcess из пакета caret заполнить пропуски предсказанными значениями (среднее,
медиана) [2].
4. Сгенерировать два числовых набора данных, добавить в них выбросы. С использованием функции boxplot обнаружить выбросы и удалить их [3, 4].
5. Сгенерируйте таблицу данных, в которой дублируются строки. Удалите строки с использованием функций unique(), duplicated(). Сравните результаты [5].
6. Обработать пропуски в данных с использованием пакета mice [6].
7. Разобрать пример с мультиколлинеарностью [7].
8. Всю представленную работу собрать в единый файл Rmarkdown. Опубликовать его на RPubs, в качестве отчета о лабораторной работе представить ссылку на полученный файл.
5-лаба
1. Установить пакет CARET, выполнить команду names(getModelInfo()), ознакомиться со списком доступных методов выбора признаков. Выполните графический разведочный анализ данных с использование функции featurePlot() для набора данных из справочного файла пакета CARET:
x <- matrix(rnorm(50*5),ncol=5)
y <- factor(rep(c("A", "B"), 25))
Сохранить полученные графики в *.jpg файлы. Сделать выводы.
2. С использование функций из пакета Fselector [2] определить важность признаков для решения задачи классификации. Использовать набор data(iris). Сделать выводы.
3. С использованием функции discretize() из пакета arules выполните преобразование непрерывной переменной в категориальную [3] различными методами: «interval» (равная ширина интервала), «frequency» (равная частота), «cluster» (кластеризация) и «fixed» (категории задают границы интервалов). Используйте набор данных iris. Сделайте выводы
3. Установите пакет Boruta и проведите выбор признаков для набора данных data("Ozone") [4, 5, 6]. Построить график boxplot, сделать выводы.
4. Всю представленную работу собрать в единый файл Rmarkdown. Опубликовать его на RPubs, в качестве отчета о лабораторной работе представить ссылку на полученный файл.
6-лаба
1. Выполните классификацию k-ближайших соседей с использованием функции knn() из пакета class на наборе данных iris [1]. Проведите нормализацию данных, разделите выборку на обучающую и тестовую. Оцените построенную модель с использованием функции CrossTable() из пакета gmodels. Постройте матрицу ошибок [2] и диагональную оценку качества прогноза (diagonal mark quality prediction).
2. Рассмотрите пример реализации метода опорных векторов с использованием функции svm() из пакета e1071. Постройте линейный классификатор для прогнозирования. Для подбора параметров модели выполните перекрестную проверку с делением исходной выборки на 10 равных частей (cross=10) [3, c.172]. 3. Выполните расчет главных компонент с использованием пакета vegan() и его функции rda(). Постройте ординационную диаграмму методом PCA [3, c. 49] и сделайте выводы.
7-лаба
1. Установить интегрированную среду разработки Rstudio
https://download1.rstudio.org/desktop/windows/RStudio-1.4.1103.exe
2. В качестве отчета необходимо представить архив содержащий следующие файлы:
Могу отправить примеры
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |