R语言中自带的一些数据集

在用R语言做数据分析的时候,我们经常需要一些数据做实验,尤其当学会一个新的方法或者算法的时候,就想赶快编程实现一下。那么,问题来了,用什么数据好呢,什么样的数据适合做这种实验呢?

好在R语言提供了很多的基本数据集,这些基本数据集是可以直接加载、可以完成几乎所有的数据分析任务模拟数据的。这都是些哪些种类的数据呢?

这些基本数据集都在R包datasets里面,可以执行命令:

> data(package = 'datasets')

就会datasets包带的出现所有基本基本数据集:

 

具体翻译一下各个数据集基本情况

向量

euro    #欧元汇率,长度为11,每个元素都有命名

landmasses    #48个陆地的面积,每个都有命名

precip    #长度为70的命名向量

rivers    #北美141条河流长度

state.abb    #美国50个州的双字母缩写

state.area    #美国50个州的面积

state.name    #美国50个州的全称

因子

state.division    #美国50个州的分类,9个类别

state.region    #美国50个州的地理分类

矩阵、数组

euro.cross    #11种货币的汇率矩阵

freeny.x    #每个季度影响收入四个因素的记录

state.x77    #美国50个州的八个指标

USPersonalExpenditure    #5个年份在5个消费方向的数据

VADeaths    #1940年弗吉尼亚州死亡率(每千人)

volcano    #某火山区的地理信息(10米×10米的网格)

WorldPhones    #8个区域在7个年份的电话总数

iris3    #3种鸢尾花形态数据

Titanic    #泰坦尼克乘员统计

UCBAdmissions    #伯克利分校1973年院系、录取和性别的频数

crimtab    #3000个男性罪犯左手中指长度和身高关系

HairEyeColor    #592人头发颜色、眼睛颜色和性别的频数

occupationalStatus    #英国男性父子职业联系

类矩阵

eurodist    #欧洲12个城市的距离矩阵,只有下三角部分

Harman23.cor    #305个女孩八个形态指标的相关系数矩阵

Harman74.cor    #145个儿童24个心理指标的相关系数矩阵

数据框

airquality    #纽约1973年5-9月每日空气质量

anscombe    #四组x-y数据,虽有相似的统计量,但实际数据差别较大

attenu    #多个观测站对加利福尼亚23次地震的观测数据

attitude    #30个部门在七个方面的调查结果,调查结果是同一部门35个职员赞成的百分比

beaver1    #一只海狸每10分钟的体温数据,共114条数据

beaver2    #另一只海狸每10分钟的体温数据,共100条数据

BOD    #随水质的提高,生化反应对氧的需求(mg/l)随时间(天)的变化

cars    #1920年代汽车速度对刹车距离的影响

chickwts    #不同饮食种类对小鸡生长速度的影响

esoph    #法国的一个食管癌病例对照研究

faithful    #一个间歇泉的爆发时间和持续时间

Formaldehyde    #两种方法测定甲醛浓度时分光光度计的读数

Freeny    #每季度收入和其他四因素的记录

dating from    #配对的病例对照数据,用于条件logistic回归

InsectSprays    #使用不同杀虫剂时昆虫数目

iris    #3种鸢尾花形态数据

LifeCycleSavings    #50个国家的存款率

longley    #强共线性的宏观经济数据

morley    #光速测量试验数据

mtcars    #32辆汽车在11个指标上的数据

OrchardSprays    #使用拉丁方设计研究不同喷雾剂对蜜蜂的影响

PlantGrowth    #三种处理方式对植物产量的影响

pressure    #温度和气压

Puromycin    #两种细胞中辅因子浓度对酶促反应的影响

quakes    #1000次地震观测数据(震级>4)

randu    #在VMS1.5中使用FORTRAN中的RANDU三个一组生成随机数字,共400组。

rock    #48块石头的形态数据

sleep    #两药物的催眠效果

stackloss    #化工厂将氨转为硝酸的数据

swiss    #瑞士生育率和社会经济指标

ToothGrowth    #VC剂量和摄入方式对豚鼠牙齿的影响

trees    #树木形态指标

USArrests    #美国50个州的四个犯罪率指标

USJudgeRatings    #43名律师的12个评价指标

warpbreaks    #织布机异常数据

women    #15名女性的身高和体重

列表

state.center    #美国50个州中心的经度和纬度

类数据框

ChickWeight    #饮食对鸡生长的影响

CO2    #耐寒植物CO2摄取的差异

DNase    #若干次试验中,DNase浓度和光密度的关系

Indometh    #某药物的药物动力学数据

Loblolly    #火炬松的高度、年龄和种源

Orange    #桔子树生长数据

Theoph    #茶碱药动学数据

时间序列数据

airmiles    #美国1937-1960年客运里程营收(实际售出机位乘以飞行哩数)

AirPassengers    #Box & Jenkins航空公司1949-1960年每月国际航线乘客数

austres    #澳大利亚1971-1994每季度人口数(以千为单位)

BJsales    #有关销售的一个时间序列

BJsales.lead    #前一指标的先行指标(leading indicator)

co2    #1959-1997年每月大气co2浓度(ppm)

discoveries    #1860-1959年每年巨大发现或发明的个数

ldeaths    #1974-1979年英国每月支气管炎、肺气肿和哮喘的死亡率

fdeaths    #前述死亡率的女性部分

mdeaths    #前述死亡率的男性部分

freeny.y    #每季度收入

JohnsonJohnson    #1960-1980年每季度Johnson & Johnson股票的红利

LakeHuron    #1875-1972年某一湖泊水位的记录

lh    #黄体生成素水平,10分钟测量一次

lynx    #1821-1934年加拿大猞猁数据

nhtemp    #1912-1971年每年平均温度

Nile    #1871-1970尼罗河流量

nottem    #1920-1939每月大气温度

presidents    #1945-1974年每季度美国总统支持率

UKDriverDeaths    #1969-1984年每月英国司机死亡或严重伤害的数目

sunspot.month    #1749-1997每月太阳黑子数

sunspot.year    #1700-1988每年太阳黑子数

sunspots    #1749-1983每月太阳黑子数

treering    #归一化的树木年轮数据

UKgas    #1960-1986每月英国天然气消耗

USAccDeaths    #1973-1978美国每月意外死亡人数

uspop    #1790–1970美国每十年一次的人口总数(百万为单位)

WWWusage    #每分钟网络连接数

Seatbelts    #多变量时间序列。和UKDriverDeaths时间段相同,反映更多因素。

EuStockMarkets    #多变量时间序列。欧洲股市四个主要指标的每个工作日记录,共1860条记录。

当然了,如果我们想知道任意一个包自带有哪些数据集,可以有命令:

> data(package = '包名')

下面这样可以查看R所有包的数据情况,从下面参数all.available = TRUE也能猜出来。

>data(package = .packages(all.available = TRUE))

这样,就可以查看所有包自带的数据集情况了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/34223.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

R语言---使用RTCGA包获取TCGA数据---笔记整理

原文链接:https://mp.weixin.qq.com/s?__bizMzAxMDkxODM1Ng&mid2247486585&idx1&sn3035f6420904aad2c8161b362cdeb472&chksm9b484cc2ac3fc5d479fc5bce3d68d4666b763652a21a55b281aad8c0c4df9b56b4d3b353cc4c&scene21#wechat_redirect 1.RTCGA…

R语言实操记录——获取包的三种渠道及安装包的三种方式

R语言 R语言实操记录——获取包的三种渠道及安装包的三种方式 文章目录 R语言一、获取包的三种渠道二、安装包的三种方式2.1、CRAN2.2、Bioconductor2.3、Github注意 一、获取包的三种渠道 渠道1 、CRAN:R语言的官网,里面包含有绝大多部分领域的大部分…

【R语言】2022年末特辑——ggsci包色版最详分享

目录 一、前言二、官方教程2.1 NPG2.2 AAAS2.3 NEJM2.4 Lancet2.5 JAMA2.6 JCO2.7 UCSCGB2.8 d32.9 locuszoom2.10 igv2.11 uchicago2.12 startrek2.13 tron2.14 futurama2.15 rickandmorty2.16 simpsons2.17 gsea2.18 material 三、讨论 一、前言 部分新手直接化用代码跑出来…

R语言txt文件自定义词云图

在R语言中获取txt文件文本,并进行词频统计,然后自定义词云图。 先获取txt文本 wordfreqs read.table("E:\\Python实训\\哔哩哔哩弹幕爬取\\dan_mu.txt",encoding "UTF-8")这是事先用python爬虫准备好的B站番剧(排球少…

基于R语言分析自带数据集heart

本文将对R语言中自带的heart数据集进行分析。本文会包含所有代码,尽可能多的使用有关可视化的函数以及数据分析的模型。 一、研究概述 1.1 数据集简介 数据集来源:使用R语言 glmpalh 包中自带的数据heart.data 数据集内容:该数据集描述了45…

摸鱼的小贤在瞎搞R - R语言内置数据集的使用

系列文章目录 1-R语言的安装及使用(还没写这个,太简单了不太想写) 2-R语言内置数据集的使用 …… 文章都会尽量详细,话多请见谅(我是话痨 文章目录 系列文章目录1. 查看包中有哪些数据集2. 查看某一特定数据集的基本信…

ChatGPT对高校人才培养模式的挑战与应对策略思考

酷吗?输入指令后直接就能生成一大串代码,即使不懂相关技术也能玩转编程,这就是ChatGPT赋予你的“新能力”,除了写代码,ChatGPT还能帮你执行各种五花八门的任务。 AI工具如ChatGPT在行业中的广泛应用对于行业的人才结…

如何使用SMS向客户传递服务信息?指南在这里!

关键词:SMS运营、实时聊天客服、聊天机器人 SMS作为一种客户服务策略正变得越来越流行。了解如何使用它,并在此获得一些有用的模板。 通过SMS发送客户服务信息是提升客户体验的一种强有力的方式,并使客户获得超出他们预期的快乐。它是最近许…

SMS Call---发送短信和打电话的方法

发送短信的方法 有两种方法可以实现发送短信,其一是使用intent-startActivity,URI数据格式为"smsto:num",调用的action为Intent.ACTION_SENDTO: Uri uri Uri.parse("smsto:5554"); Intent it new Intent(I…

ChatGPT token访问和API访问的区别,哪个更适合企业级应用?

文章目录 先介绍一下ChatGPT token访问和API访问的区别ChatGPT token访问和API访问哪种更适合企业级应用?如何搭建一个本地可以使用的 ChatGPT 聊天页面?微信公众号上如何对接 ChatGPT 并支持聊天? 先介绍一下 ChatGPT是基于OpenAI的GPT-4模…

UI设计:模仿淘宝App首页

UI设计:模仿淘宝App首页

场景导购系列一:个性化服饰搭配在淘宝搜索的实践

背景 日常生活中存在着各种各样的场景,比如参加晚会、海边度假、跑步、登山、垂钓等等。场景可以认为是在一些维度上相似的元素所构成的情境画面,不同场景会有不同的氛围、组成元素。 一些场景偏实用性,比如跑步,会让人想起要穿上…

仿淘宝商品详情,下拉切换到图片详情,上拉切换到图文简介

1:仿淘宝商品详情,下拉切换到图片详情,上拉切换到图文简介。 2:导航栏滑动显示时显示,静止时透明 有需要代码的可以私我

曾GMV过亿的淘宝品牌FFAN(泛泛)宣布店铺歇业

我是卢松松,点点上面的头像,欢迎关注我哦! 成立于2008年,曾经淘宝排名前十、年销售过亿的女装店铺,FFAN(泛泛)宣布店铺歇业。据店主说,2020年就开始了亏损。 致FFAN女孩们: 感谢一路走来的有你们的关注和…

自定义ViewGroup实现仿淘宝的商品详情页

最近公司在新版本上有一个需要, 要在首页添加一个滑动效果, 具体就是仿照X宝的商品详情页, 拉到页面底部时有一个粘滞效果, 如下图 X东的商品详情页,如果用户继续向上拉的话就进入商品图文描述界面: 刚开始…

实战淘宝穿衣搭配

1. 说明 《淘宝穿衣搭配》比赛是2015年的一个天池算法比赛,现已开放为新人赛,仍可下载数据,上传结果及计算排名。具体地址是: https://tianchi.aliyun.com/getStart/information.htm?spm5176.100067.5678.2.78904065HrZLpP&…

【Android】仿淘宝商品详情页

话不多说---先上效果图: 图1 商品详情页 图2 加入购物车点击事件 需求分析: 图1中主要需要实现的效果: 1.轮播图 2.顶部导航栏的渐变 3.顶部导航栏随着滑动的位置选择对应的值以及点击滑动到对应位置 图2中主要需要实现的效果&#xff1…

仿淘宝— 商品图片切换

在线展示 html: <div id"box"><ul><li id"li01"><img src"./images/01.jpg" alt""></li><li id"li02"><img src"./images/02.jpg" alt""></li><l…

淘宝内容场下的人物理解系统

本文的人物理解特指对人的视觉特征的识别&#xff0c;即从视觉维度&#xff0c;获取视频或图片中人物的身份、性别、年龄、颜值、身材、服饰、人-物关系等各种信息。 背景介绍 随着网络通信技术的迅猛发展&#xff0c;主流的信息传播已经揉合了文本、图像、语音、视频等多种媒体…

实战3-淘宝用户行为分析及可视化

淘宝用户行为分析及可视化 目录 淘宝用户行为分析及可视化分析背景明确问题读取和理解数据数据预处理数据分析与可视化用户行为分析日PV和日UVPV与UV相关性可视化 时PV和时UV相关性可视化 不同行为类型用户PV分析操作行为分析操作行为情况操作行为可视化 用户消费行为分析日ARP…