1、线性回归
1、数据准备: 描述如何获取和准备数据。
2、图像预处理: 包括图像读取。
3、将数据划分为训练集和测试集。
4、计算数据的相关系数矩阵。
5、模型训练: 详细说明如何使用线性回归算法训练模型,包括参数设置和训练过程。
6、模型评估: 描述如何使用测试集评估模型的性能,包括准确率的计算方法。
7、数据检测:输入数据进行判断
2、实现一元回归
# 导入pandas库用于数据处理
import pandas as pd
# 导入线性回归模型
from sklearn.linear_model import LinearRegression# 读取数据集
data = pd.read_csv("data.csv")# 计算数据的相关系数矩阵
corr = data.corr()# 创建线性回归模型实例
lr = LinearRegression()# 提取广告投入作为特征变量,并将其转换为适合模型的数组形式
x = data[["广告投入"]].values.reshape(-1, 1)
# 提取销售额作为目标变量
y = data[["销售额"]]# 使用广告投入数据训练线性回归模型
lr.fit(x, y)# 使用训练好的模型进行预测
result = lr.predict(x)# 计算模型的R^2分数,即决定系数,表示模型的拟合程度
score = lr.score(x, y)# 计算线性回归模型的截距并保留两位小数
a = round(lr.intercept_[0], 2)
# 计算线性回归模型的斜率并保留两位小数
b = round(lr.coef_[0][0], 2)# 使用模型对新的广告投入值进行预测
predict = lr.predict([[40], [50], [56]])# 打印预测结果
print(predict)
结果
3、多元线性回归
# 导入pandas库用于数据处理
import pandas as pd
# 导入线性回归模型
from sklearn.linear_model import LinearRegression# 读取Excel文件中的案例数据
data_anli = pd.read_excel("案例.xlsx")# 计算选定列之间的相关系数矩阵
# 包括不良贷款、各项贷款余额、本年累计应收贷款、贷款项目个数
corr_anli = data_anli[["不良贷款", "各项贷款余额", "本年累计应收贷款", "贷款项目个数"]].corr()# 创建线性回归模型实例
lr_anli = LinearRegression()# 提取特征变量,包括不良贷款、各项贷款余额、本年累计应收贷款、贷款项目个数
# 这些变量将用于预测本年固定资产投资额
x_anli = data_anli[["不良贷款", "各项贷款余额", "本年累计应收贷款", "贷款项目个数"]]# 提取目标变量,即本年固定资产投资额
y_anli = data_anli[["本年固定资产投资额"]]# 使用特征变量和目标变量训练线性回归模型
lr_anli.fit(x_anli, y_anli)# 计算模型的R^2分数,表示模型对数据的拟合程度
score_anli = lr_anli.score(x_anli, y_anli)# 打印模型的R^2分数
print(score_anli)# 使用训练好的模型对一组新的数据进行预测
# 这组数据包括不良贷款80、各项贷款余额60、本年累计应收贷款60、贷款项目个数20
print(lr_anli.predict([[80, 60, 60, 20]]))# 对两组新的数据进行预测,每组数据包括不良贷款、各项贷款余额、本年累计应收贷款、贷款项目个数
# 第一组数据:不良贷款60、各项贷款余额70、本年累计应收贷款50、贷款项目个数20
# 第二组数据:不良贷款70、各项贷款余额80、本年累计应收贷款40、贷款项目个数32
print(lr_anli.predict([[60, 70, 50, 20], [70, 80, 40, 32]]))