BookRecommender

Рекомендательная система по подбору книг, реализующая следующие функции с использованием набора данных (https://www.kaggle.com/zygmunt/goodbooks-10k) :

Просмотр диаграммы наиболее популярных жанров книг;
Просмотр диаграммы с книгами, которые пользователи чаще всего оставляют к прочтению;
Подбор книг с помощью алгоритма content-based, основанного на схожести в содержании книг;
Подбор книг с помощью коллаборативного алгоритма, основанного на оценках других пользователей

Алгоритм коллаборативной фильтрации (item-based)

Основная идея - предложение новых элементов для конкретного пользователя на основе предыдущих предпочтений пользователя или мнения других единомышленников. Этот подход еще называют методом ближайших соседей.

Преимущества:

Является достаточно универсальным подходом, поэтому часто дает высокие результаты.
Для работы данного метода не нужна детальная информация о продуктах. Вместо этого используется как история оценок самого пользователя, так и других пользователей.

Недостатки:

Нельзя работать с новыми пользователями, для которых еще нет истории (задача холодного старта).
Неизвестно, что делать с новыми объектами, которые еще никто не оценил.
Ресурсоемкость вычислений, которая замедляет время работы системы.
Необходим большой объем данных для высокой точности предсказаний.

Схема работы алгоритма в системе подбора:

выполнение подготовки данных, а именно: удаление повторов в наборе данных;
группировка книг по количеству их оценок;
отбор тех книг, количество оценок которых больше 60;
группировка пользователей по количеству оценок;
отбор тех пользователей, у которых количество оценок книг более 50;
cоздание сводной таблицы, которая преобразуется к разреженной матрице;
создание модели для алгоритма ближайших соседей, при подгоне которой в качестве данных обучения используется разреженная матрица оценок пользователей – книг;
поиск выбранной книги;
нахождение соседних книг с использованием созданной модели;
сортировка по расстоянию до соседних книг по убыванию;
отбор списка книг по полученным индексам;
вывод рекомендованных книг пользователю.

Алгоритм content-based

Основная идея - рекомендации основаны на схожести элементов. При данном алгоритме по истории действий пользователя формируется вектор его предпочтений, что бы в дальнейшем рекомендовались элементы близкие к этому вектору.

Преимущества:

Не требует большого количества пользователей для достижения высокой точности рекомендаций;
Новые элементы можно рекомендовать сразу, как только у них появляются заполненные характеристики.

Недостатки:

Сильная зависимость от предметной области, полезность рекомендаций ограничена;
Вектор предпочтений пользователя и вектор остальных элементов должен состоять из одинакового набора характеристик, чтобы их можно было сравнивать и составлять рекомендации.

Схема работы алгоритма в системе подбора:

выполнение подготовки данных, а именно: удаление повторов в наборе данных;
удаление пробелов в необходимых полях;
приведение полей к нижнему регистру и строчному типу;
получение парной схожести между выбранной книгой и всеми остальными;
сортировка по убыванию степеней схожести;
выборка двадцати самых похожих на указанную пользователем книгу;
получение индексов отобранных книг;
получение списка названий книг.

Технологии

Python 3.7.8
Flask 1.1.2
Bootstrap 4.1.3
Pandas 1.1.2
Scikit-learn 0.23.2
SciPy 1.4.1
FuzzyWuzzy 0.18.0
Chart JS 2.9.4
Bootstrap-select 1.14.0

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
static		static
templates		templates
.gitignore		.gitignore
README.md		README.md
app.py		app.py
book_tags.csv		book_tags.csv
books.csv		books.csv
ratings.csv		ratings.csv
recommender.py		recommender.py
tags.csv		tags.csv
to_read.csv		to_read.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

BookRecommender

Алгоритм коллаборативной фильтрации (item-based)

Преимущества:

Недостатки:

Схема работы алгоритма в системе подбора:

Алгоритм content-based

Преимущества:

Недостатки:

Схема работы алгоритма в системе подбора:

Технологии

Пример работы

About

Releases

Packages

Languages

lelsene/BookRecommender

Folders and files

Latest commit

History

Repository files navigation

BookRecommender

Алгоритм коллаборативной фильтрации (item-based)

Преимущества:

Недостатки:

Схема работы алгоритма в системе подбора:

Алгоритм content-based

Преимущества:

Недостатки:

Схема работы алгоритма в системе подбора:

Технологии

Пример работы

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages