1. Скачать MovieLens Dataset (
ml-latest-small.zip), поделить 60-20-20 train valid test
2. Реализовать 2 версии коллаборативной фильтрации item&user-based (не используя готовый код)
3. Реализовать алгоритм на основе латентных факторов (можно использовать сторонние реализации для вычисления градиента)
4. Реализовать алгоритм на основе k ближайших соседей (подобрать k на валидационных данных) (не используя готовый код)
5. Реализовать контентный алгоритм на основе текстовых тэгов и названий фильмов (подход nlp – на ваше усмотрение, можно использовать любые библиотеки)
6. Сравнить RMSE приведенных выше подходов
Выполнить работу в jupyter notebook