波士顿房价数据集

数据集

  • Keras中常见的集成数据集
  • 波士顿房价数据集
    • 1. 加载数据集
    • 2. 访问数据集
    • 3. 数据可视化

Keras是一个高层的神经网络和深度学习库,可以快速搭建神经网络,易于调试和从扩展,是TensorFlow的官方API,内置了常用的公共数据集,可通过 keras.datasets模块来加载和访问。

Keras中常见的集成数据集

名称说明
boston_sousing波士顿房价数据集
CIFAR1010种类别的图片集
CIFAR100100种类别的图片集
MNIST手写数字图片集
Fashion-MNIST10重时尚类别的图片集
IMDB电影点评数据集
reuters路透社新闻数据集

波士顿房价数据集

1. 加载数据集

import tensorflow as tfboston_housing=tf.keras.datasets.boston_housing
#train_x和train_y分别接收训练数据集的属性和房价
#test_x和test_y分别接收测试数据集的属性和房价
#(train_x,train_y),(test_x,test_y)=boston_housing.load_data()    #默认test_split=0.2,即train数据占比0.8,test数据占比0.2
(train_x,train_y),(test_x,test_y)=boston_housing.load_data(test_split=0)#所有数据划分为训练数据print("Training set:",len(train_x))
print("Testing set:",len(test_x))
print("Dim of train_x:",train_x.ndim)#维度
print("Dim of train_x:",train_x.shape)#形状
print("Dim of train_y:",train_y.ndim)
print("Dim of train_y:",train_y.shape)

输出结果如下:

Training set: 506
Testing set: 0
Dim of train_x: 2
Dim of train_x: (506, 13)
Dim of train_y: 1
Dim of train_y: (506,)

数据集下载经常因为网络问题而下载错误,多试几次就好了,数据集下载提示如下图:
波士顿房价数据集下载也可以自己在网上找链接下载后放到文件夹中(推荐),默认路径是:
C:\Users\Administrator\.keras\datasets\boston_housing.npz
我的路径是:C:\Users\覃忠原\.keras\datasets\boston_housing.npz

2. 访问数据集

  • 输出行数据
#通过numpy数组的索引和切片来查看数据
print(train_x[0:3])    #输出train_x中的前3行数据

由输出结果可看出是二维数组,一个维度对应一条房屋信息数据,每条信息中包括13个属性,如下:

[[1.23247e+00 0.00000e+00 8.14000e+00 0.00000e+00 5.38000e-01 6.14200e+009.17000e+01 3.97690e+00 4.00000e+00 3.07000e+02 2.10000e+01 3.96900e+021.87200e+01][2.17700e-02 8.25000e+01 2.03000e+00 0.00000e+00 4.15000e-01 7.61000e+001.57000e+01 6.27000e+00 2.00000e+00 3.48000e+02 1.47000e+01 3.95380e+023.11000e+00][4.89822e+00 0.00000e+00 1.81000e+01 0.00000e+00 6.31000e-01 4.97000e+001.00000e+02 1.33250e+00 2.40000e+01 6.66000e+02 2.02000e+01 3.75520e+023.26000e+00]]
  • 输出列数据
print(train_x[:,5])  #取出train_x中第一维的全部数据,第二维取出索引为5的数据

返回一个一维数组,分别是每条数据中的平均房间数,结果如下:

[6.142 7.61  4.97  6.037 6.376 5.708 5.536 5.468 5.628 5.019 6.404 4.6285.572 6.251 5.613 5.957 7.016 6.345 6.162 6.727 6.202 6.595 7.135 6.5755.895 6.794 6.012 7.185 5.813 5.569 6.315 6.297 6.301 5.935 7.024 6.415....... #太多了这里就不一一列出来了5.885 6.375 6.968 4.88  5.981 7.52  5.593 6.485 5.705 6.172 6.229 5.9516.593 7.061 6.03  5.884 6.897 8.259 6.812 6.122 7.333 8.78  6.273 7.8026.951 6.101]
  • 输出全部数据
print(train_y)    #输出train_y的全部数据

3. 数据可视化

  • 波士顿房价属性描述
变量名说明
CRIM城镇人口犯罪率
ZN超过25000平方英尺的住宅用地所占比例
INDUS城镇非零售业务地区的比例
CHAS查尔斯河虚拟变量(如果土地在河边=1;否则是0)
NOX一氧化氮浓度(每1000万份)
RM平均每居民房数
AGE在1940年之前建成的所有者占用单位的比例
DIS与五个波士顿就业中心的加权距离
RAD辐射状公路的可达性指数
TAX每10,000美元的全额物业税率
RTRATIO城镇师生比例
B1000(Bk-0.63)^2其中Bk是城镇黑人的比例
LSTAT人口中地位较低人群的百分数
MEDV(目标变量/类别属性)以1000美元计算的自有住房的中位数
  • scatter()函数:展示平均房间数与房价之间的关系
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tfplt.rcParams['font.sans-serif']="SimHei"boston_housing=tf.keras.datasets.boston_housing
#没有用到test数据,故可用下划线_代替
(train_x,train_y),(_,_)=boston_housing.load_data(test_split=0)plt.figure(figsize=(5,5))    #设置绘图尺寸
plt.scatter(train_x[:,5],train_y)    #散点图
plt.xlabel("平均房间数")
plt.ylabel("价格/$1000")
plt.title("平均房间数和价格之间的关系")
plt.show()

输出结果如下(总体上趋于数量越多价格越高):
在这里插入图片描述- 循环语句:输出所有属性关系图

import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tfplt.rcParams['font.sans-serif']="SimHei"
plt.rcParams['axes.unicode_minus']=Falseboston_housing=tf.keras.datasets.boston_housing
(train_x,train_y),(_,_)=boston_housing.load_data(test_split=0)    #没有用到test数据,故可用下划线_代替titles=["CRIM","ZN","INDUS","CHAS","NOX","AGE","DIS","RAD","TAX","PTRATIO","B-1000","LSTAT","MEDV"]plt.figure(figsize=(12,9))for i in range(12):plt.subplot(3,4,(i+1))plt.scatter(train_x[:,i],train_y)plt.xlabel(titles[i])plt.ylabel("价格/$1000")plt.title(str(i+1)+"."+titles[i]+"-价格")plt.tight_layout()
plt.suptitle("各个属性与房价间的关系",x=0.5,y=1.02,fontsize=20)
plt.show()

输出结果如下:
波士顿房价各属性与房价之间 的关系

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14157.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGTP全景图 | 背景+技术篇

引言:人类以为的丰功伟绩,不过是开端的开端……我们在未来100年取得的技术进步,将远超我们从控制火种到发明车轮以来所取得的一切成就。——By Sam Altman 说明:ChatGPT发布后,我第一时间体验了它的对话、翻译、编程、…

考研成功上岸提前学Python,轻松拿到大厂实习offer!

23考研即将尘埃落定,首先要恭喜上岸的同学呀~ 关于上岸后到底要不要学Python、读研怎么找实习等相关问题,其实之前也聊过,但是大家可能还没有意识到Python给读研带来什么样的正面影响,蛋糕给大家看看往期Python学员的反馈&#x…

在当下互联网行情下,2023年程序员的工作真的很难找

前言 年后,听到有几位同事有离职的想法,有的已经在开始找工作了。,这个行业的工资就是靠跳槽来加速增长的,不过经过了这几个月的面试、复试的经历,几位前期提出离职的同事渐渐改变了想法,他们发现放开后的…

重磅!大湾区大学,官宣招生!

来源:大湾区大学 编辑整理 :双一流高教 3月23日,大湾区大学(筹)发布招生信息,该校将和南方科技大学联合招收30名硕士研究生。通知显示,这批学生的学籍属于南科大,第一年在南科大培养…

2022硅谷大厂的大!失!败!AiDA时尚设计师助手;2023热门IT技能预告;Uber送货机器人;GitHub今日热榜 | ShowMeAI资讯日报

👀日报合辑 | 🎡AI应用与工具大全 | 🔔公众号资料下载 | 🍩韩信子 📢 『抖音』2022抖音热点数据报告,共度温暖岁末 抖音热点联合巨量算数,发布了《2022抖音热点数据报告》,盘点了20…

Datawhale优秀作者,入选名单!

Datawhale团队 公示:Datawhale优秀作者,2023.01-03 优秀作者公示 入选奖 1. 陈敬 中国移动云能力中心 机器学习技术:多任务学习综述! 2. 滕飞 浙江大学研究生 浙大学长分享,第二次打数据挖掘赛,雪浪算力…

24考研网盘群来了…免费进…

简介 免费分享考研网课资源,考研资料、考研资讯、考研真题、分享考研英语\考研政治\考研数学\考研复试\考研调剂信息等一系列资源,助你一战成硕。 百度网盘群 2024考研 微信公众号:考研保研直通车,坚持方便、省时的原则&#xff…

考研人导航上线啦

科大学长开发的考研人导航上线啦 ,可以帮助考研学生更高效的获取最新考研复试信息和备考资料 考研人导航官网:https://kaoyan.ahy2.top

从事架构师岗位快2年了,聊一聊我对架构的一些感受和看法

从事架构师岗位快2年了,聊一聊我和ChatGPT对架构的一些感受和看法 职位不分高低,但求每天都能有新的进步,永远向着更高的目标前进。 文章目录 踏上新的征程架构是什么?架构师到底是干什么的?你的终极目标又是什么&…

ChatGPT的出现,让我们必须思考未来孩子的职业

最近这段时间,大家都在谈论ChatGPT,谈论最多的大概就是它将来会淘汰哪些行业?多少人会因此而失业? 作为父母,我们除了关心自己的发展,当然还关心孩子的未来。 尤其是现在的人工智能发展如此迅速&#xff0c…

chatgpt赋能Python-python影评分析

介绍 Python是一种流行的编程语言,它被广泛应用于各种领域,包括数据分析领域。在电影业,Python也被用于进行影评分析。通过分析影评数据,我们可以了解到观众对于不同电影的看法和评价,从而更好地了解市场需求和趋势。…

GPT、科技、人类的生产、知识与未来(上)

本文将继续结合GPT探讨人工智能技术升级可能对人类社会带来的影响。主要还是侧重历史、社会、文化、经济、政治等角度。 问题的提出:ChatGPT等工具会提高人的工作效率和产出。但它会让人类使用者自身变得更“聪明”,还是“更笨”?更“强”&am…

ChatGPT初尝试——合并Excel表格【AI版】

ChatGPT真的能提升生产力吗?【AI版】 无意间的刷到的视频一、提需求二、ChatGPT用Python编写代码三、意外的解释四、ChatGPT改用Java编写代码五、GPT第二次生成Java代码尾巴 无意间的刷到的视频 晚上在家刷视频,突然看到一个在讲关于AI编程的视频&#…

AI 3.0快速阅读后的思考

AI3.0阅读思考 梳理 几大技术词汇: 卷积神经网络CNN:权重和值之积的和深度神经网络DNN工具:深度指层数,深度学习强化学习符号人工智能亚符号人工智能,感知机,亚符号,从数据中学习机器学习对博…

HTTP的缓存机制是什么?

💂 个人网站:【海拥】【游戏大全】【神级源码资源网】🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】💅 寻找学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】 目录 前言HTTP缓存机制简介H…

进阶高级Python开发工程师,不得不掌握的Python高并发编程

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

【Python基础】- 文件的读写操作

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

数据分析案例-数据科学相关岗位薪资可视化分析

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

码上行动:零基础学会Python编程

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

【JDK环境配置】| 两种JDK环境能在同一台电脑共存吗?

目录 🦁 前言🦁 基础环境🦁 安装JDK1.8Ⅰ. 下载Ⅱ. 安装 🦁 在项目里更改JDK版本---------------------------------------------福利在下面--------------------------------------------------🦁 福利(送…