基于深度学习的在线选修课程推荐系统

基于深度学习的在线选修课程推荐系统

1、效果图

点我查看Demo
在这里插入图片描述

2、功能

可联系我--(1257309054)
登录注册、点赞收藏、评分评论,课程推荐,热门课程,个人中心,可视化,后台管理,课程选修

3、核心推荐代码

使用Keras框架实现一个简单的深度学习推荐算法。Keras是建立在Python之上的高级神经网络API。Keras提供了一种简单、快速的方式来构建和训练深度学习模型。

​ 根据用户对书籍的评分表,使用Emmbeding深度学习训练得到一个模型,预测用户可能评分高的书籍,并把前5本推荐给用户。

Emmbeding是从离散对象(如书籍 ID)到连续值向量的映射。
这可用于查找离散对象之间的相似性。
Emmbeding向量是低维的,并在训练网络时得到更新。
设计一个模型,将用户id作为用户向量,物品id作为物品向量。
分别Emmbeding两个向量,再Concat连接起来,最后加上3个全连接层构成模型,进行训练。
使用adam优化器,用均方差mse来衡量预测评分与真实评分之间的误差

在这里插入图片描述

4、算法流程

1、从数据库中读取评分表信息并转成二维数组
2、数据预处理,把用户id,物品id映射成顺序字典
3、统计用户数量、物品数量
4、划分训练集与测试集
5、构建Embedding模型并进行数据训练得到模型
6、调用模型预测评分高的物品并推荐给用户

5、主体核心代码

 -*- coding: utf-8 -*-"""
@contact: 微信 1257309054
@file: recommend_keras.py
@time: 2024/6/8 16:21
@author: LDC
使用Keras框架实现一个深度学习推荐算法
"""import os
import django
from django.conf import settingsos.environ["DJANGO_SETTINGS_MODULE"] = "course_manager.settings"
django.setup()import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import pymysql
from sklearn.model_selection import train_test_split
import warningswarnings.filterwarnings('ignore')from course.models import UserSelectTypes, CourseInfo, RateCourse
from keras.layers import Input, Embedding, Flatten, Dot, Dense, Concatenate, Dropout
from keras.models import Modelfrom keras.models import load_modeldef get_select_tag_course(user_id, course_id=None):# 获取用户注册时选择的课程类别各返回10门课程category_ids = []us = UserSelectTypes.objects.get(user_id=user_id)for category in us.category.all():category_ids.append(category.id)unrec = []if course_id:unrec.append(course_id)course_list = CourseInfo.objects.filter(tags__in=category_ids).exclude(id__in=unrec).distinct().order_by("-collect_num")[:10]return course_listdef get_data():'''从数据库获取数据'''conn = pymysql.connect(host=settings.DATABASE_HOST,user=settings.DATABASE_USER,password=settings.DATABASE_PASS,database=settings.DATABASE_NAME,charset='utf8mb4',use_unicode=True)# 选择评分大于等于3的课程sql_cmd = 'SELECT course_id, user_id,mark FROM rate_course where mark >=3'dataset = pd.read_sql(sql=sql_cmd, con=conn)conn.close()return datasetdef preprocessing(dataset):'''数据预处理'''course_val_counts = dataset.course_id.value_counts()course_map_dict = {}  # 课程字典for i in range(len(course_val_counts)):course_map_dict[course_val_counts.index[i]] = i# print(map_dict)dataset["course_id"] = dataset["course_id"].map(course_map_dict)user_id_val_counts = dataset.user_id.value_counts()# 映射字典user_id_map_dict = {}  # 用户字典for i in range(len(user_id_val_counts)):user_id_map_dict[user_id_val_counts.index[i]] = i# 将User_ID映射到一串字典dataset["user_id"] = dataset["user_id"].map(user_id_map_dict)return dataset, course_map_dict, user_id_map_dictdef train_model():'''训练模型'''dataset = get_data()  # 获取数据dataset, course_map_dict, user_id_map_dict = preprocessing(dataset)  # 数据预处理n_users = len(dataset.user_id.unique())  # 统计用户数量print('n_users', n_users)n_courses = len(dataset.course_id.unique())  # 统计课程数量print('n_courses', n_courses)# 划分训练集与测试集train, test = train_test_split(dataset, test_size=0.2, random_state=42)# 开始训练# creating course embedding pathcourse_input = Input(shape=[1], name="course-Input")course_embedding = Embedding(n_courses + 1, 5, name="course-Embedding")(course_input)Dropout(0.2)course_vec = Flatten(name="Flatten-courses")(course_embedding)# creating user embedding pathuser_input = Input(shape=[1], name="User-Input")user_embedding = Embedding(n_users + 1, 5, name="User-Embedding")(user_input)Dropout(0.2)user_vec = Flatten(name="Flatten-Users")(user_embedding)# concatenate featuresconc = Concatenate()([course_vec, user_vec])# add fully-connected-layersfc1 = Dense(128, activation='relu')(conc)Dropout(0.2)fc2 = Dense(32, activation='relu')(fc1)out = Dense(1)(fc2)# Create model and compile itmodel2 = Model([user_input, course_input], out)model2.compile('adam', 'mean_squared_error')history = model2.fit([train.user_id, train.course_id], train.mark, epochs=10, verbose=1)model2.save('regression_model2.h5')loss = history.history['loss']  # 训练集损失# 显示损失图像# plt.plot(loss, 'r')# plt.title('Training loss')# plt.xlabel("Epochs")# plt.ylabel("Loss")# plt.show()print('训练完成')def predict(user_id, dataset):'''将预测评分高的课程推荐给该用户user_id'''model2 = load_model('regression_model2.h5')'''先拿到所有的课程,并去重成为course_data。再添加一个和course_data长度相等的用户列表user,不过这里的user列表中的元素全是1,因为:预测第1个用户对所有课程的评分,再将预测评分高的课程推荐给该用户。'''course_data = np.array(list(set(dataset.course_id)))user = np.array([user_id for i in range(len(course_data))])predictions = model2.predict([user, course_data])# 更换列->行predictions = np.array([a[0] for a in predictions])# 根据原array,取其中数值从大到小的索引,再只取前top10recommended_course_ids = (-predictions).argsort()[:8]return recommended_course_idsdef embedding_main(user_id, course_id=None, is_rec_list=False):'''1、获取用户评分大于等于3的课程数据2、数据预处理:把数据映射成用户向量Embedding,课程向量Embedding3、划分训练集与测试集:使用二八法则随机划分,80%的数据用来训练,20%的数据用来测试4、训练模型:分别Emmbeding两个向量,再Concat连接起来,最后加上3个全连接层构成模型,进行训练5、模型评估:通过查看训练集损失函数来查看模型优劣6、预测推荐:对用户评分过的课程进行模型预测,把预测评分高的课程推荐给用户user_id: 用户idcourse_id: 用户已经评分过的课程id,需要在推荐列表中去除is_rec_list: 值为True:返回推荐[用户-评分]列表,值为False:返回推荐的课程列表'''dataset = get_data()  # 获取数据# print(dataset.head())if user_id not in dataset.user_id.unique():# 用户未进行评分则推荐注册时选择的课程类型print('用户未进行评分则推荐注册时选择的课程类型')if is_rec_list:return []# 推荐列表为空,按用户注册时选择的课程类别各返回10门return get_select_tag_course(user_id, course_id)dataset, course_map_dict, user_id_map_dict = preprocessing(dataset)# user_id需要转换为映射后的user_id传到predict函数中predict_course_ids = predict(user_id_map_dict[user_id], dataset)  # 预测的课程Idrecommend_list = []  # 最后推荐的课程id# 把映射的值转为真正的课程idfor course_id in predict_course_ids:for k, v in course_map_dict.items():if course_id == v:recommend_list.append(k)print('keras_recommended_course_ids深度学习推荐列表', recommend_list)if not recommend_list:# 推荐列表为空,且is_rec_list: 值为True:返回推荐[用户-评分]列表if is_rec_list:return []# 推荐列表为空,按用户注册时选择的课程类别return get_select_tag_course(user_id, course_id)if is_rec_list:# 推荐列表不为空,且且is_rec_list: 值为True:返回推荐[用户-评分]列表return recommend_listunres = []if course_id:unres.append(course_id)# 过滤掉用户已评分的数据already_mark_ids = [d['course_id'] for d in RateCourse.objects.filter(user_id=user_id).values('course_id')]unrecommend = list(set(unres + already_mark_ids))if course_id and course_id not in unrecommend:unrecommend.append(course_id)course_list = CourseInfo.objects.filter(id__in=recommend_list).exclude(id__in=unrecommend).distinct().order_by("-collect_num")return course_listif __name__ == '__main__':train_model()  # 训练模型embedding_main(2)  # 调用模型

6、输出效果

Epoch 1/10
1/1 [==============================] - 2s 2s/step - loss: 25.0221
Epoch 2/10
1/1 [==============================] - 0s 8ms/step - loss: 24.9007
Epoch 3/10
1/1 [==============================] - 0s 7ms/step - loss: 24.8011
Epoch 4/10
1/1 [==============================] - 0s 6ms/step - loss: 24.7061
Epoch 5/10
1/1 [==============================] - 0s 3ms/step - loss: 24.6062
Epoch 6/10
1/1 [==============================] - 0s 4ms/step - loss: 24.5012
Epoch 7/10
1/1 [==============================] - 0s 5ms/step - loss: 24.3921
Epoch 8/10
1/1 [==============================] - 0s 5ms/step - loss: 24.2739
Epoch 9/10
1/1 [==============================] - 0s 3ms/step - loss: 24.1532
Epoch 10/10
1/1 [==============================] - 0s 5ms/step - loss: 24.0253
训练完成
1/1 [==============================] - 0s 200ms/step
keras_recommended_course_ids深度学习推荐列表 [61, 98, 71, 81, 97]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/344402.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Edge浏览器十大常见问题,一次性解决!

Edge曾被称为最好用的浏览器,拳打Chrome脚踢firefox, 可如今却隐藏着像是播放卡顿、下载缓慢、广告繁多等诸多问题,不知道各位还在用吗? 今天小编收集整理了Edge浏览器十大烦人问题,并提供简单有效的解决办法,让你的E…

277 基于MATLAB GUI火灾检测系统

基于MATLAB GUI火灾检测系统,可以实现图片和视频的火苗检测。火焰识别的三个特征:1个颜色特征,2个几何特征颜色特征:HSV颜色空间下,对三个通道值进行阈值滤波,几何特征1:长宽比,几何…

实战 | YOLOv10 自定义数据集训练实现车牌检测 (数据集+训练+预测 保姆级教程)

导读 本文主要介绍如何使用YOLOv10在自定义数据集训练实现车牌检测 (数据集训练预测 保姆级教程)。 YOLOv10简介 YOLOv10是清华大学研究人员在Ultralytics Python包的基础上,引入了一种新的实时目标检测方法,解决了YOLO以前版本在后处理和模型架构方面…

mac M1下安装PySide2

在M1下装不了PySide2, 是因为PySide2没有arm架构的包 1 先在M1上装qt5 安装qt主要是为了能用里面的Desinger, uic, rcc brew install qt5 我装完的路径在/opt/homebrew/opt/qt5 其中Designer就是用来设计界面的 rcc用resource compiler, 编绎rc资源文件的, 生成对应的py文件…

电子电气架构——车载诊断DTC一文通

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 没有人关注你。也无需有人关注你。你必须承认自己的价值,你不能站在他人的角度来反对自己。人生在世,最怕的就是把别人的眼光当成自己生活的唯一标…

【模拟-BM99 顺时针旋转矩阵】

题目 BM99 顺时针旋转矩阵 描述 有一个NxN整数矩阵,请编写一个算法,将矩阵顺时针旋转90度。 给定一个NxN的矩阵,和矩阵的阶数N,请返回旋转后的NxN矩阵。 分析 模拟,写几个样例,分析一下新矩阵元素下标与原矩阵元素…

Windows系统问题

Windows系统问题 一、补丁更新提示:0x80070643问题:解决方法:1.以管理员权限运行【cmd】。2.禁用 【Windows RE】,请运行reagentc /disable。3.回收【Windows RE】恢复分区空间。4.准备新的【Windows RE】恢复分区空间。5.配置并启…

并查集进阶版

过关代码如下 #define _CRT_SECURE_NO_WARNINGS #include<bits/stdc.h> #include<unordered_set> using namespace std;int n, m; vector<int> edg[400005]; int a[400005], be[400005]; // a的作用就是存放要摧毁 int k; int fa[400005]; int daan[400005]…

【保姆级图文教程】QT下载、安装、入门、配置VS Qt环境

【保姆级图文教程】QT下载、安装、入门、配置VS Qt环境-CSDN博客 0.QT介绍 QT 是一个跨平台的应用程序开发框架&#xff0c;它提供了丰富的工具和类库&#xff0c;用于开发图形用户界面&#xff08;GUI&#xff09;程序。Qt 提供了 C 编程语言接口&#xff0c;同时也支持其他…

Xcode设置cocoapods库的最低兼容版本

目录 前言 1.使用cocoapods遇到的问题 2.解决办法 1.用法解释 1. config.build_settings: 2.IPHONEOS_DEPLOYMENT_TARGET 2.使用实例 3.注意事项 1.一致性 2.pod版本 前言 这篇文章主要是介绍如何设置cocoapods三方库如何设置最低兼容的版本。 1.使用cocoapods遇到的…

安装node

下载地址 Node.js — Run JavaScript Everywhere 按照下面的图操作即可 然后就下载完了。

【NetTopologySuite类库】生成凸包

介绍 计算几何体的凸包。凸包是最小的凸几何体&#xff0c;包含输入几何体中的所有点。使用Graham Scan算法。 API地址&#xff1a; https://nettopologysuite.github.io/NetTopologySuite/api/NetTopologySuite.Algorithm.ConvexHull.html 示意图 示例代码 需在NuGet中安装…

牛客NC32 求平方根【简单 二分 Java/Go/C++】

题目 题目链接&#xff1a; https://www.nowcoder.com/practice/09fbfb16140b40499951f55113f2166c 思路 Java代码 import java.util.*;public class Solution {/*** 代码中的类名、方法名、参数名已经指定&#xff0c;请勿修改&#xff0c;直接返回方法规定的值即可*** para…

OpenCV学习(4.8) 图像金字塔

1.目的 在这一章当中&#xff0c; 我们将了解图像金字塔。我们将使用图像金字塔创建一个新的水果&#xff0c;“Orapple”我们将看到这些功能&#xff1a; cv.pyrUp&#xff08;&#xff09; &#xff0c; cv.pyrDown&#xff08;&#xff09; 在通常情况下我们使用大小恒定…

Direct local .aar file dependencies are not supported when building an AAR.

最近升级了最新的AndroidStdio版本&#xff0c;然后导入之前的安卓工程 然后经过一番折腾后项目可以跑了&#xff0c;但是意外发现出release包的时候报错了&#xff0c; Direct local .aar file dependencies are not supported when building an AAR. 网上有很多解决方法&am…

IPv6 归属地城市级 Api 接口 - 精准定位每一个连接

随着互联网的快速发展&#xff0c;人们对于网络安全和隐私保护的要求也越来越高。在网络世界中&#xff0c;每一个连接都有其特定的地理位置&#xff0c;了解连接的归属地信息对于识别恶意行为以及网络运营具有重要意义。IPv6 归属地城市级 Api 接口就能够实现对连接的精准定位…

今年618,京东和爱奇艺为大屏品质“把关”

今年618电视大战&#xff0c;还是打响了。 根据京东618数据显示&#xff0c;618开门红阶段热卖TOP10电视均为75英寸以上的大屏&#xff0c;拥有超高画质的MiniLED电视成交量同比增长5倍。可以看到&#xff0c;大屏电视逐步成为消费主流&#xff0c;尤其是拥有出色视听体验的高…

数据库安全加固与API防护策略

在数字化时代&#xff0c;数据库作为企业核心资产的安全性至关重要。然而&#xff0c;随着网络攻击手段的不断演进&#xff0c;数据库和API接口成为了黑客的主要攻击目标。本文将探讨数据库被攻击、API接口被滥用的情况&#xff0c;并提供一系列实用的防护措施&#xff0c;旨在…

易飞销货单出货时审核库存检查

公司接到一客户因品种多而数量少&#xff0c;单一出货计划行比较多&#xff0c;而只上了生产ERP易飞&#xff0c;审核时经常会出现倒催货&#xff0c;提前做销售单&#xff0c;行数有时超30行以上&#xff0c;审核跳窗报错时也不方便查找&#xff0c;特写一外挂程序&#xff0c…

C语言中常用辅助调试信息的宏定义

宏&#xff1a; _ _ F I L E _ _ \color{red} \_\_FILE\_\_ __FILE__ 在编译时会替换成当前的源文件名称&#xff0c;字符串类型。 printf("file name:%s\r\n", __FILE__);则输出 file name:.\app\bsp.c宏&#xff1a; _ _ F U N C T I O N _ _ \color{red} \_\_F…