Задание: Выполнить анализ последовательно (на одном процессоре) датасета.
Общая информация по данным: источник, кем предоставлены, когда и для каких задач могут использоваться.
Источник: https://www.kaggle.com/vivovinco/san-francisco-library-usage
Данные могут использоваться при сравнительном анализе возрастных групп посетителей публичных библиотек, в данных представлена вся информация о посетителях.
Описание целевой задачи анализа данных исходя из данных.
Библиографические записи и записи посетителей публичных библиотек Сан-Франциско (bibliographic and patron records of public libraries in San Francisco.);
Задача – произвести сравнительный анализ разных возрастных групп посетителей публичных библиотек Сан-Франциско.
Метаинформация: формат, количество атрибутов и векторов, типы атрибутов, классы и т.п.
Формат:.CSV;
Количество атрибутов: 15;
Типы атрибутов: String, Integer, Boolean.
Предлагаемый ML алгоритм для решения целевой задачи.
Алгоритмы:
Необходимые настройки данных для каждого алгоритма.
Модель должна содержать один столбец числового типа или типа date, который применяется в качестве набора вариантов, определяющего временные срезы, используемые моделью.
Модель должна содержать один или больше прогнозируемых столбцов, на основании которых алгоритм будет строить модель временных рядов. Прогнозируемый столбец должен иметь тип данных с непрерывными значениями.
Ожидаемые модели знаний, построенные алгоритмами.
Multivariate,Time-Series - алгоритмы регрессии.
Применение: прогнозирование временных рядов, предугадывание различных тенденции на основе начальных значений.
К процессу прогнозирования можно подходить с разных сторон, смотря какого характера должен быть прогноз, на какой период мы хотим его строить.
Предлагаемые методы и критерии оценки построенных моделей.Статическое исследование, в ходе которого проводится несколько измерений, для каждой проверяемой единицы, и выстраивается взаимосвязь между многомерными измерениями.
Предлагаемые система хранения.
Данные и алгоритмы будут храниться на облачном сервере Yandex.Cloud, а также на локальном ПК.
Предлагаемая система анализа данных.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |