python基于协同过滤推荐算法的电影推荐系统源码.zip_基于python的协同过滤游戏推荐系统资源-CSDN文库

共57个文件

py：9个

pyc：8个

test：7个

版权申诉

python

推荐算法

电影推荐系统

177 浏览量 2023-09-17 16:33:28 上传评论收藏 16.99MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

python基于协同过滤推荐算法的电影推荐系统源码.zip （57个子文件）

python基于协同过滤推荐算法的电影推荐系统源码

utils.py 3KB

main.py 3KB

data

ml-100k

u3.test 387KB

u.occupation 193B

u3.base 1.51MB

README 7KB

u2.base 1.51MB

u5.base 1.51MB

u.genre 202B

u1.test 383KB

u.info 36B

mku.sh 643B

u5.test 388KB

u4.base 1.51MB

u.item 231KB

ub.test 182KB

u.data 1.89MB

ub.base 1.71MB

ua.base 1.71MB

u.user 22KB

u2.test 386KB

allbut.pl 716B

u1.base 1.51MB

u4.test 388KB

ua.test 182KB

ml-1m

README 5KB

users.dat 131KB

ratings.dat 23.45MB

movies.dat 167KB

similarity.py 7KB

.idea

MovieLens-Recommender-master.iml 452B

vcs.xml 185B

misc.xml 191B

inspectionProfiles

Project_Default.xml 786B

profiles_settings.xml 212B

modules.xml 315B

deployment.xml 1KB

.gitignore 184B

ItemCF.py 6KB

random_pred.py 5KB

UserCF.py 6KB

dataloader.py 4KB

model

ml-100k-testsize0.1-user_sim_mat.pkl 10.7MB

ml-100k-testsize0.1-movie_count.pkl 6B

ml-100k-testsize0.1-testset.pkl 163KB

ml-100k-testsize0.1-trainset.pkl 1.29MB

ml-100k-testsize0.1-movie_popular.pkl 24KB

__pycache__

UserCF.cpython-36.pyc 4KB

similarity.cpython-36.pyc 4KB

ItemCF.cpython-36.pyc 5KB

LFM.cpython-36.pyc 7KB

dataloader.cpython-36.pyc 4KB

random_pred.cpython-36.pyc 4KB

most_popular.cpython-36.pyc 4KB

utils.cpython-36.pyc 4KB

LFM.py 7KB

most_popular.py 5KB

#!/usr/bin/env python # -*- coding: utf-8 -*- """ Recommend according to the user's favorite categories Description : Latent Factor Model """ import collections import random from operator import itemgetter import math from collections import defaultdict import utils from utils import LogTime class LFM: """ Latent Factor Model. Top-N recommendation. """ def __init__(self, K, epochs, alpha, lamb, n_rec_movie=10, save_model=True): """ Init LFM with K, T, alpha, lamb :param K: Latent Factor dimension :param epochs: epochs to go :param alpha: study rate :param lamb: regular params :param save_model: save model """ print("LFM start...\n") self.K = K self.epochs = epochs self.alpha = alpha self.lamb = lamb self.n_rec_movie = n_rec_movie self.save_model = save_model self.users_set, self.items_set = set(), set() self.items_list = list() self.P, self.Q = None, None self.trainset = None self.testset = None self.item_popular, self.items_count = None, None self.model_name = 'K={}-epochs={}-alpha={}-lamb={}'.format(self.K, self.epochs, self.alpha, self.lamb) def init_model(self, users_set, items_set, K): """ Init model, set P and Q with random numbers. :param users_set: Users set :param items_set: Items set :param K: Latent factor dimension. :return: None """ self.P = dict() self.Q = dict() for user in users_set: self.P[user] = [random.random()/math.sqrt(K) for _ in range(K)] for item in items_set: self.Q[item] = [random.random()/math.sqrt(K) for _ in range(K)] def init_users_items_set(self, trainset): """ Get users set and items set. :param trainset: train dataset :return: Basic users and items set, etc. """ users_set, items_set = set(), set() items_list = [] item_popular = defaultdict(int) for user, movies in trainset.items(): for item in movies: item_popular[item] += 1 users_set.add(user) items_set.add(item) items_list.append(item) items_count = len(items_set) return users_set, items_set, items_list, item_popular, items_count def gen_negative_sample(self, items: dict): """ Generate negative samples :param items: Original items, positive sample :return: Positive and negative samples """ samples = dict() for item, rate in items.items(): samples[item] = 1 for i in range(len(items) * 11): item = self.items_list[random.randint(0, len(self.items_list) - 1)] if item in samples: continue samples[item] = 0 if len(samples) >= 10 * len(items): break # print(samples) return samples def predict(self, user, item): """ Predict the rate for item given user and P and Q. :param user: Given a user :param item: Given a item to predict the rate :return: The predict rate """ rate_e = 0 for k in range(self.K): Puk = self.P[user][k] Qki = self.Q[item][k] rate_e += Puk * Qki return rate_e def train(self, trainset): """ Train model. :param trainset: Origin trainset. :return: None """ for epoch in range(self.epochs): print('epoch:', epoch) for user in trainset: samples = self.gen_negative_sample(trainset[user]) for item, rui in samples.items(): eui = rui - self.predict(user, item) for k in range(self.K): self.P[user][k] += self.alpha * (eui * self.Q[item][k] - self.lamb * self.P[user][k]) self.Q[item][k] += self.alpha * (eui * self.P[user][k] - self.lamb * self.Q[item][k]) self.alpha *= 0.9 # print(self.P) # print(self.Q) def fit(self, trainset): """ Fit the trainset by optimize the P and Q. :param trainset: train dataset :return: None """ self.trainset = trainset self.users_set, self.items_set, self.items_list, self.item_popular, self.items_count = \ self.init_users_items_set(trainset) model_manager = utils.ModelManager() try: self.P = model_manager.load_model(self.model_name + '-P') self.Q = model_manager.load_model(self.model_name + '-Q') print('User origin similarity model has saved before.\nLoad model success...\n') except OSError: print('No model saved before.\nTrain a new model...') self.init_model(self.users_set, self.items_set, self.K) self.train(self.trainset) print('Train a new model success.') if self.save_model: model_manager.save_model(self.P, self.model_name + '-P') model_manager.save_model(self.Q, self.model_name + '-Q') print('The new model has saved success.\n') return self.P, self.Q def recommend(self, user): """ Recommend N movies for the user. :param user: The user we recommend movies to. :return: the N best score movies """ rank = collections.defaultdict(float) interacted_items = self.trainset[user] for item in self.items_set: if item in interacted_items.keys(): continue for k, Qik in enumerate(self.Q[item]): rank[item] += self.P[user][k] * Qik return [movie for movie, _ in sorted(rank.items(), key=itemgetter(1), reverse=True)][:self.n_rec_movie] def test(self, testset): """ Test the recommendation system by recommending scores to all users in testset. :param testset: test dataset :return: None """ self.testset = testset print('Test recommendation system start...') # varables for precision and recall hit = 0 rec_count = 0 test_count = 0 # varables for coverage all_rec_movies = set() # varables for popularity popular_sum = 0 # record the calculate time has spent. test_time = LogTime(print_step=1000) for user in self.users_set: test_movies = self.testset.get(user, {}) rec_movies = self.recommend(user) # type:list for movie in rec_movies: if movie in test_movies.keys(): hit += 1 all_rec_movies.add(movie) popular_sum += math.log(1 + self.item_popular[movie]) # log steps and times. rec_count += self.n_rec_movie test_count += len(test_movies) # print time per 500 times. test_time.count_time() precision = hit / (1.0 * rec_count) recall = hit / (1.0 * test_count) coverage = len(all_rec_movies) / (1.0 * self.items_count) popularity = popular_sum / (1.0 * rec_count) print('Test recommendation system success.') test_time.finish() print('precision=%.4f\trecall=%.4f\tcoverage=%.4f\tpopularity=%.4f\n' % (precision, recall, coverage, popularity))

评论收藏

内容反馈

版权申诉