波士顿房价数据集
- 卡内基梅隆大学,StatLib库,1978年
- 涵盖了麻省波士顿的506个不同郊区的房屋数据
- 404条训练数据集,102条测试数据集
- 每条数据14个字段,包含13个属性,和1个房价的平均值
目标
将所有属性与房价之间的关系可视化
代码
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf plt.rcParams['font.sans-serif'] = ['Microsoft YaHei'] # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题boston_housing = tf.keras.datasets.boston_housing#数据集不需要测试,将所有的数据都加载到训练数据集用于显示,test_split为划分测试机的比例
(train_x,train_y),(test_x,test_y) = boston_housing.load_data(test_split = 0)title_list = ['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD','TAX','PTRATIO','B-1000','LSTAT','MEDV']plt.figure(figsize=(8,8))for i in range(13):plt.subplot(4,4,i+1)plt.scatter(train_x[:,i],train_y,s=5)plt.xlabel(title_list[i])plt.ylabel('Price')plt.title(str(i+1)+'. '+title_list[i]+' - Price')plt.tight_layout(rect=[0,0,1,0.95])
plt.suptitle('各属性与房价之间的关系')
plt.show()