Анализ данных датасета

Отменен
Заказ
4710641
Раздел
Программирование
Предмет
Python
Антиплагиат
Не указан
Срок сдачи
20 Апр 2022 в 23:55
Цена
4 000 ₽
Блокировка
10 дней
Размещен
12 Апр 2022 в 17:22
Просмотров
80
Описание работы

Задание: Выполнить анализ последовательно (на одном процессоре) датасета.

Общая информация по данным: источник, кем предоставлены, когда и для каких задач могут использоваться.


Источник:  https://www.kaggle.com/vivovinco/san-francisco-library-usage 

Данные могут использоваться при сравнительном анализе возрастных групп посетителей публичных библиотек, в данных представлена вся информация о посетителях.

Описание целевой задачи анализа данных исходя из данных.

Библиографические записи и записи посетителей публичных библиотек Сан-Франциско (bibliographic and patron records of public libraries in San Francisco.);

 Задача – произвести сравнительный анализ разных возрастных групп посетителей публичных библиотек Сан-Франциско.

 

Метаинформация: формат, количество атрибутов и векторов, типы атрибутов, классы и т.п.

Формат:.CSV; 

Количество атрибутов: 15;

Типы атрибутов: String, Integer, Boolean.

Предлагаемый ML алгоритм для решения целевой задачи.

Алгоритмы:

  1.  Multivariate;
  2.  Time-Series.


Необходимые настройки данных для каждого алгоритма.

Модель должна содержать один столбец числового типа или типа date, который применяется в качестве набора вариантов, определяющего временные срезы, используемые моделью.


Модель должна содержать один или больше прогнозируемых столбцов, на основании которых алгоритм будет строить модель временных рядов. Прогнозируемый столбец должен иметь тип данных с непрерывными значениями.

Ожидаемые модели знаний, построенные алгоритмами.


Multivariate,Time-Series - алгоритмы регрессии. 

Применение: прогнозирование временных рядов, предугадывание различных тенденции на основе начальных значений.

К процессу прогнозирования можно подходить с разных сторон, смотря какого характера должен быть прогноз, на какой период мы хотим его строить.

Предлагаемые методы и критерии оценки построенных моделей.Статическое исследование, в ходе которого проводится несколько измерений, для каждой проверяемой единицы, и выстраивается взаимосвязь между многомерными измерениями. 

Предлагаемые система хранения.

Данные и алгоритмы будут храниться на облачном сервере Yandex.Cloud, а также на локальном ПК.

Предлагаемая система анализа данных.

  1. Данные будут анализироваться при помощи программного обеспечения Jupyter;
  2.  Алгоритмы будут написаны на языке Pythоn.
Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу 1 год
Средний балл 4.96
Стоимость Назначаете сами
Эксперт Выбираете сами
Уникальность работы от 70%
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Темы журнала
Показать ещё
Прямой эфир