UCL葡萄酒(red white wine quality)数据集字段解释、数据导入实战

UCL葡萄酒(red white wine quality)数据集字段解释、数据导入实战

目录

UCL葡萄酒(red white wine quality)数据集字段解释、数据导入实战

#数据字段说明

#导入数据


#数据字段说明

葡萄酒分为白葡萄酒和红葡萄酒两类。

此处为白葡萄酒:增加一个类型字段则为包含白葡萄和红葡萄的葡萄酒数据集

两个数据集在单独拆分的时候quality的类别可能有轻微差异。

固定酸度:大多数与葡萄酒有关的酸或固定的或不挥发的(不易蒸发)
挥发性酸味:葡萄酒中醋酸的含量过高,会产生令人不快的醋味
柠檬酸:少量的柠檬酸可以增加葡萄酒的新鲜度和风味
残糖:发酵结束后的残糖量,每升1克以下的酒很少,45克以上的酒被认为是甜的
氯化物:酒中盐的含量
游离二氧化硫:SO2以游离形式存在于SO2分子(作为溶解气体)与亚硫酸氢盐离子之间的平衡状态;它可以防止葡萄酒中的微生物生长和氧化
总二氧化硫:SO2游离态和结合态的量;在低浓度的情况下,SO2在葡萄酒中几乎检测不到,但当游离SO2浓度超过50ppm时,SO2在葡萄酒的嗅觉和味觉中就会变得明显
密度:根据酒精和糖含量的百分比,水的密度接近于水的密度
pH值:描述葡萄酒的酸性或碱性程度,从0(非常酸)到14(非常碱性);大多数葡萄酒的pH值在3-4之间
硫酸盐:一种葡萄酒添加剂,可以提高二氧化硫气体(SO2)水平,起到抗菌和抗氧化剂的作用
酒精:葡萄酒中酒精含量的百分比
质量:输出变量(根据感官数据,评分0 - 10),有专门的评酒师和调酒师的职业

White Wine Quality dataset which is a tidy data set. This data set contains 4,898 white wines with 11 variables on quantifying the chemical properties of each wine. At least 3 wine experts rated the quality of each wine, providing a rating between 0 (very bad) and 10 (very excellent).


**fixed acidity** : most acids involved with wine or fixed or nonvolatile (do not evaporate readily)

**volatile acidity_** : the amount of acetic acid in wine, which at too high of levels can lead to an unpleasant, vinegar taste

**citric acid** : found in small quantities, citric acid can add ‘freshness’ and flavor to wines

**residual sugar** : the amount of sugar remaining after fermentation stops, it’s rare to find wines with less than 1 gram/liter and wines with greater than 45 grams/liter are considered sweet

**chlorides** : the amount of salt in the wine

**free sulfur dioxide** : the free form of SO2 exists in equilibrium between molecular SO2 (as a dissolved gas) and bisul-fite ion; it prevents microbial growth and the oxidation of wine

**total sulfur dioxide**: amount of free and bound forms of S02; in low concentrations, SO2 is mostly undetectable in wine, but at free SO2 concentrations over 50 ppm, SO2 becomes evident in the nose and taste of wine

**density** : the density of water is close to that of water depending on the percent alcohol and sugar con-tent

**pH** : describes how acidic or basic a wine is on a scale from 0 (very acidic) to 14 (very basic); most wines are between 3–4 on the pH scale

**sulphates** : a wine additive which can contribute to sulfur dioxide gas (S02) levels, which acts as an antimicrobial and antioxidant

**alcohol** : the percent alcohol content of the wine

**quality** : output variable (based on sensory data, score between 0 and 10)


葡萄酒认证包括物理化学测试,例如密度,pH,酒精含量,固定和挥发性酸度的测定等。

可以在UCI机器学习存储库中找到该数据集。 葡萄酒分为白葡萄酒和红葡萄酒两类。 
该分析涉及白葡萄酒,并基于数据集中显示的13个变量/特征:
固定酸度
挥发性酸度
柠檬酸
残留糖
氯化物
游离二氧化硫
总二氧化硫
密度
pH值
硫酸盐
酒精
质量

#导入数据

df = pd.read_csv('winequality-white.csv', sep=';')
df.head()
df.tail()
# df.sample(5)

 


UCL白葡萄酒和红葡萄酒合起来的数据集,增加一个类型字段指示是白葡萄酒还是红葡萄酒

## 'data.frame':    3000 obs. of  15 variables:
##  $ X                   : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ fixed.acidity       : num  7.4 7.8 7.8 11.2 7.4 7.4 7.9 7.3 7.8 7.5 ...
##  $ volatile.acidity    : num  0.7 0.88 0.76 0.28 0.7 0.66 0.6 0.65 0.58 0.5 ...
##  $ citric.acid         : num  0 0 0.04 0.56 0 0 0.06 0 0.02 0.36 ...
##  $ residual.sugar      : num  1.9 2.6 2.3 1.9 1.9 1.8 1.6 1.2 2 6.1 ...
##  $ chlorides           : num  0.076 0.098 0.092 0.075 0.076 0.075 0.069 0.065 0.073 0.071 ...
##  $ free.sulfur.dioxide : num  11 25 15 17 11 13 15 15 9 17 ...
##  $ total.sulfur.dioxide: num  34 67 54 60 34 40 59 21 18 102 ...
##  $ density             : num  0.998 0.997 0.997 0.998 0.998 ...
##  $ pH                  : num  3.51 3.2 3.26 3.16 3.51 3.51 3.3 3.39 3.36 3.35 ...
##  $ sulphates           : num  0.56 0.68 0.65 0.58 0.56 0.56 0.46 0.47 0.57 0.8 ...
##  $ alcohol             : num  9.4 9.8 9.8 9.8 9.4 9.4 9.4 10 9.5 10.5 ...
##  $ quality             : int  5 5 5 6 5 5 5 7 7 5 ...
##  $ type                : Factor w/ 2 levels "Red","White": 1 1 1 1 1 1 1 1 1 1 ...
##  $ quality.bucket      : Factor w/ 3 levels "Low","Medium",..: 2 2 2 2 2 2 2 3 3 2 ...

参考:kaggle+Predicting White Wine Quality

参考:UCL

参考:泰坦尼克号数据集_Kaggle | 泰坦尼克号幸存分析(字段介绍)

参考:Red and White Wine Quality

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/68166.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

强化学习入门笔记 | UCL silver RL | UC Berkely cs285 DRL

学习情况: 🌱 先后听了两门课程,分别是David Silver的RL和Sergey Levin的DRL。各耗时一周左右,后者更难一些。对RL基本概念、常用算法原理及其伪代码有了大致了解。但是因为时间有点赶,没有敲完整的算法代码。 &…

机器学习极好的入门学习视频推荐

首先说明本人最早看的机器学习视频是吴恩达的机器学习后来发现并不适合我。如果你以前了解过一些算法,不妨看看我以下推荐的视频,对于一点都不了解机器学习的小白,那就更要看我推荐的视频了,当然吴恩达的机器学习也很好&#xff0…

强化学习决策涉及因素太多,要知道确切的概率几乎不可能?

强化学习已经席卷了整个 AI 世界。从 AlphaGo 到 AlphaStar,由强化学习提供动力的 AI 智能体已经战胜了越来越多由人类主导的传统活动。通过在某一环境中对智能体行为进行优化以实现最大奖励是强化学习的关键,但是绝大多数强化学习方法需要对环境有完整的…

B站上线!DeepMind加UCL强强联手推出深度学习与强化学习进阶课程(附视频)

编辑:元子 涞源:新智元 DeepMind和伦敦大学学院(University College London,UCL)合作,推出了一个系列的深度学习与强化学习精品进阶课程。该课程内容已经被录制为视频,并由爱可可爱生活上传B站供…

ucl计算机教授汪军,UCL汪军教授开课:带你入坑多智能体机器学习(免费)!

人工智能已经在围棋、图像识别和语音识别等领域达到甚至超越了人类专家水平,但智能化的机器离我们仍然很远。要想实现通用智能,AI智能体必须学习如何在共享环境中与「他人」进行互动,由此产生了人工智能的一个前沿研究领域:多智能…

UCL USL过程控制上下限与产品公差及极差

upper control limit/ low control limit, UCL/LCL : 上控制限/下控制限, 一般是根据产品和过程特性, 统计数据, 按照一定公式及系数, 计算获得; 一般是在/-3sigma 之间; 用于查看过程的受控状态... 控制限的计算 首先计算极差图的控制限, 再计算均值图的控制限; 计算型数据…

抖音无水印下载不求人

1.得到分享 url 2.找到有水印的url chrom 浏览器 按 F12 打开调试 https://aweme.snssdk.com/aweme/v1/playwm/?video_idv0300fa50000c05t58fkppmf0vsga26g&ratio720p&line0 只有 video_id 有用, 其他的参数没用, 精简后的 url 为 https://aweme.snssdk.com/aweme/…

简历怎么写

简历是你进入面试的敲门砖,也是留给意向公司的第一印象,所以这个很重要,必须在这上面做足了文章,一份优秀的面试简历是整个面试成败的重中之重,我们会详细分析如何准备简历才能保证简历不被刷掉。 准备专业技能 关于对…

个人简历计算机水平如何填写,简历如何写计算机水平

简历如何写计算机水平 简历的内容要尽可能详尽,具体。下面小编整理的简历如何写计算机水平,欢迎来参考! 作为现代化办公系统,就是离不开电脑的配合,所以如果你在电脑方面有专长,一定要在个人简历当中表现出…

专用于个人简历的latex模板

介绍 一份简历模板,fork自hijiangtao/resume,自己随意删改了一些东西。地址为:resume 使用 将整个项目直接上传到overleaf上,使用xelatex编译使用本地的texstudio编译 预览 FontAwesome resume-zh_CN.tex 已经导入了 fontawe…

别在简历上写XXX管理系统了,太水!!!

我一直认为程序员的成长就像一个狙击手一样,好的狙击手都是子弹喂出来的。 同理,牛逼的程序员也需要一个个真实项目来打磨。 想要快速掌握开发技能,提升开发水平,做一个优质的项目往往可以事半功倍。 Java程序员从入门到大牛的终极…

程序员(应届生)求职简历模板+LaTex(overleaf)简历制作+博士简历模板分享+简历赏析

LaTex简历制作 模板介绍亮点模板改动 还在网上疯狂找简历模板吗?为改格式而烦恼吗?大牛都用这方法制作简历,精美又优雅–LaTex制作简历。 一份精美的简历能够迅速吸引HR的眼球引起对你的兴趣,特别是对于刚刚步入社会的应届生来说&…

使用Markdown写出一份漂亮的简历

文章目录 背景Markdown编辑器开始写你的简历个人优势项目经历            牧竹子个人技能公司经历项目经验XXXXXX项目 202N.N0.15-202N.N.N 导出文档格式高级版修改样式 背景 每当你要更新简历时是否因为各个平台不同输入框而陷入适配不同的模板,如此以来…

荒谬!高校院长在Nature论文一作位置P上自己名字,还写到简历里...

点击上方“深度学习爱好者”,选择加"星标"或“置顶” 重磅干货,第一时间送达 本文由募格学术撰写 参考来源:豆瓣、顶刊收割机、知乎等 你见过最荒唐的学术造假是什么样子的? 有人直接靠P图为自己得来一份Nature还写到了…

怎样制作一份简历?这些方面内容最好要写上

怎么制作一份简历呢?简历是个人求职的重要材料,它反映了你的个人信息、教育背景、工作经验、专业技能等方面的情况。写一份好的简历可以让你在众多求职者中脱颖而出,增加获得面试的机会。很多小伙伴不清楚简历中应该填写哪些内容,…

简历应该这么写

一、简历篇幅 首先程序员的简历力求简洁明了,不用设计上要过于复杂。 对于校招生,一页简历就够了,社招的话两页简历便可。 有的校招生说自己的经历太多了,简历要写出两三页,实际上基本是无关内容太多或者描述太啰唆…

使用Gitee多人项目协作开发的流程

多人协作开发流程 Step0 所有组员在Gitee上注册账户 http://gitee.com Step 1 组长创建项目例如:CoperationDemo Step2 组长将项目组成员拉进项目,成为开发者 等待其他用户同意邀请 Step3 其他组员同意加入项目,并成为正式开发者 其他成…

申报指南|教你如何优雅地报名、提交项目申请书

「2021腾讯犀牛鸟开源人才培养计划」开始已经20多天了,组委会已经收到不少同学的报名和提案。 还没有报名和准备proposal的同学请注意啦:距离6月21日报名和提交项目申请书截止还有13天! 关于如何报名和提交proposal,不少同学依然存…

GPT-4 竟被 CS 学生「开源」了!OpenAI 威胁:不撤下项目就告你!

转自:新智元(ID:AI_era) 众所周知,ChatGPT 是免费的,但想尝试最新最强的 GPT-4,基本上就只有「氪金」这一条路可以走—— 要么订阅 ChatGPT Plus,要么付费调用 API。 虽然也有一些集成了 GPT 的…

王者登基!GPT-4发布,功能史上最强

源 | 量子位 大家好,这里是 NewBeeNLP。 一觉醒来,万众期待的GPT-4,它来了! OpenAI老板Sam Altman直接开门见山地介绍说: 这是我们迄今为止功能最强大的模型! 有多强? 根据OpenAI官方的介绍&…