数据分析入门指南:数据库入门(五)

本文将总结CDA认证考试中数据库中部分知识点,内容来源于《CDA模拟题库与备考资料PPT》

CDA认证,作为源自中国、面向全球的专业技能认证,覆盖金融、电信、零售、制造、能源、医疗医药、旅游、咨询等多个行业,旨在培养能够胜任数据采集、清洗、处理、分析及业务报告制作、数字化决策等任务的新型数据人才。

作为当今的数据驱动时代,SQL是数据分析师不可或缺的技能之一。本文将以探讨数据库查询、查询操作符、子查询、函数等方法,帮助你建立对数据库操作的初步认识。

一、数据库查询
1、SELECT语句的操作符

根据特定条件从数据库中查询出数据。

加号(+)、减号(-)、乘号(*)和除号(/),查询中虽然不直接用于构造查询语句,但在数据查询常常涉及数据的计算和转换。

2、聚合类函数

在SQL中,聚合类函数如AVG(平均值)、SUM(总和)、MAX(最大值)、MIN(最小值)和COUNT(计数)等,允许对数据库中的数据进行汇总和统计,从而得出有意义的结论。

3、多表查询

在实际应用中,数据库通常包含多个相互关联的表。多表查询,如内连接(INNER JOIN)、左连接(LEFT JOIN)和联合查询(UNION),是处理这些复杂数据结构的关键。内连接查询返回两个或多个表中匹配的行;左连接查询则返回左表中的所有行,以及与右表中匹配的行(如果右表中没有匹配项,则结果中这些行的右表部分将为空);联合查询则用于合并两个或多个SELECT语句的结果集,要求这些结果集具有相同的列数和数据类型。

image

二、查询操作符与子查询
1、运算符

SQL查询操作符是用于在WHERE子句中设置条件,以过滤结果集。以下是一些常见的操作符及其用法:

BETWEEN:判断某个字段的值是否在指定的范围内。

SELECT * FROM fruits WHERE f_price BETWEEN 10 AND 20;

这个查询将返回价格在10元到20元之间的所有水果记录。

LIKE:用于匹配字段值是否包含指定的字符串。

SELECT * FROM fruits WHERE f_id LIKE 'b%';

这个查询将返回f_id以字母b开头且长度为两位的所有水果记录。

IS NULL:用于判断字段值是否为空(NULL)。

SELECT * FROM fruits WHERE f_name IS NULL;

此查询将返回所有f_name字段为空的水果记录。

DISTINCT:用于去除结果集中的重复记录。

SELECT DISTINCT s_id FROM fruits;

这里假设s_id是另一个相关字段,该查询将返回所有不重复的s_id值。

2、子查询与操作符组合应用

子查询是将一个查询的结果集作为另一个查询的条件或数据表来使用。以下是几种结合操作符使用子查询的例子:

ANY:表示满足内层查询结果中的任意一个条件。

SELECT * FROM fruits WHERE f_price = ANY (SELECT f_price FROM fruits WHERE f_price BETWEEN 10 AND 20);

这个查询会返回所有f_price在10元到20元之间的水果记录,尽管这里使用=和ANY的组合有些冗余,但展示了ANY的用法。

ALL:表示满足内层查询结果中的所有条件。
由于ALL通常用于比较操作符(如> ALL、< ALL),直接用于价格范围查询可能不太适用,但理论上可以这样使用:

SELECT * FROM fruits WHERE f_price > ALL (SELECT f_price FROM fruits WHERE f_price <= 20);

实际上,这个查询可能不会返回任何结果,因为没有任何价格能大于或等于20且同时小于20的所有价格。

EXISTS:用于判断内层查询是否存在满足条件的记录。

SELECT * FROM fruits f1 WHERE EXISTS (SELECT 1 FROM fruits f2 WHERE f2.f_price > 2
三、函数
1、常用的字符串函数

常用的字符串函数包括但不限于字符串的截取、替换、拼接等操作。在数据处理阶段对数据进行清洗和整理。

2、日期与时间函数

通过使用日期及时间函数,可以对时间数据进行提取、转换和计算,从而进行时间序列分析、趋势预测等高级操作。这些函数包括日期的加减、格式化、提取特定部分(如年、月、日)等。

3、其他函数

除了上述常见的函数之外,还需要掌握一些其他的高级函数,以应对更复杂的数据分析需求。这些函数包括但不限于逻辑函数、开窗函数等。

3.1、逻辑函数

逻辑函数用于对表达式进行判断,根据满足的条件不同,执行相应的流程。例如,IF函数可以根据条件判断的真假,返回不同的结果。

3.2、开窗函数

开窗函数是SQL中的一种高级函数,允许在不改变原始数据行的情况下,对数据进行分组统计和计算。MySQL 8.0版本支持多达11种开窗函数,如ROW_NUMBER()、RANK()等,这些函数常与GROUP BY子句一起使用,能够提供更灵活的数据分析能力。
特别值得一提的是GROUP_CONCAT()函数,能够将同一组中的所有列值连接成一个字符串返回,非常适合于处理需要将多行数据合并为一行显示的场景。

四、总结

作为数据分析师,掌握数据库是你必不可少的技能之一。需要你熟练掌握数据查询、操作符查询与子查询、函数等,并深入数据库等核心内容,以确保数据分析工作的顺利进行和结果的准确性。只有你不断学习和实践,才能成为一名优秀的CDA数据分析师。

CDA认证对于你来说非常具有价值的:

如果你是一名学生,能够增强职场竞争力,同时也是技能的证明,可以拓宽自己的就业领域。

如果你是一名打工人,可以更快地获得晋升机会,从而获得更高的薪资待遇。

最后分享一本由CDA认证命题专家组成员倾力打造红宝书《精益业务数据分析》,可以帮你在备考过程中事半功倍,祝你早日拿证~

《精益业务数据分析》试读下载:https://edu.cda.cn/group/4/thread/178774

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/380225.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

仿源码大师主界面UI的iAPP源文件

仿源码大师首页主界面的布局 首页&#xff0c;分类&#xff0c;需求&#xff0c;我的 就只有这几个界面内容而已 资源静态 没有任何动画和功能 纯UI布局 纯UI布局 他的最新版已经不是这个UI布局 放心使用 以学习参考为目的&#xff0c;如有不妥望告知 原创&#xff0c;纯…

一个非常好的美图展示网站整站打包源码,集成了wordpress和开源版ripro主题,可以完美运营。

一个非常好的美图展示网站整站打包源码&#xff0c;集成了wordpress和开源版ripro主题&#xff0c;可以完美运营。 自带了5个多g的美图资源&#xff0c;让网站内容看起来非常大气丰富&#xff0c;可以快速投入运营。 这个代码包&#xff0c;原网站已经稳定运营多年&#xff0…

Python和C++行人轨迹预推算和空间机器人多传感融合双图算法模型

&#x1f3af;要点 &#x1f3af;双图神经网络模型&#xff1a;最大后验推理和线性纠错码解码器 | &#x1f3af;重复结构和过约束问题超图推理模型 | &#x1f3af;无向图模型变量概率计算、和积消息传播图结构计算、隐马尔可夫模型图结构计算、矩阵图结构计算、图结构学习 |…

PostgreSql创建触发器并增加IF判断条件

在 PostgreSQL 中&#xff0c;可以使用触发器&#xff08;Trigger&#xff09;来在表上定义自定义的插入&#xff08;INSERT&#xff09;、更新&#xff08;UPDATE&#xff09;和删除&#xff08;DELETE&#xff09;操作的行为。触发器是与表相关联的特殊函数&#xff0c;它们在…

Linux 12:多线程2

1. 生产者消费者模型 生产者消费者模型有三种关系&#xff0c;两个角色&#xff0c;一个交易场所。 三种关系&#xff1a; 生产者之间是什么关系?竞争 - 互斥 消费者和消费者之间?竞争 - 互斥 消费者和消费者之间?互斥和同步 两个角色&#xff1a; 生产者和消费者 一个交…

【Apache POI】Java解析Excel文件并处理合并单元格-粘贴即用

同为牛马&#xff0c;点个赞吧&#xff01; 一、Excel文件样例 二、工具类源码 import org.apache.poi.ss.usermodel.*; import org.apache.poi.ss.util.CellRangeAddress; import org.apache.poi.xssf.usermodel.XSSFWorkbookFactory; import org.springframework.web.multip…

mac M1 创建Mysql8.0容器

MySLQ8.0 拉取m1镜像 docker pull mysql:8.0创建挂载文件夹并且赋予权限 sudo chmod 777 /Users/zhao/software/dockerLocalData/mysql 创建容器并且挂载 docker run --name mysql_8 \-e MYSQL_ROOT_PASSWORDadmin \-v /Users/zhao/software/dockerLocalData/mysql/:/var/l…

利用patch-package补丁,解决H5预览PDF时电子签章不显示问题

利用patch-package补丁&#xff0c;解决H5预览PDF时电子签章不显示问题 一、问题描述 在生产环境中&#xff0c;遇到了一个紧急的技术问题&#xff1a;用户在移动端H5页面上查看电子票时&#xff0c;PDF文件预览功能正常&#xff0c;但其中的电子签章未能正常显示。这一问题直…

C++ AVL树

目录 ​编辑 0.前言 1.AVL树的概念 1.1 平衡因子 1.2 AVL树的性质 2.AVL树节点的定义 3.AVL树的插入 4.AVL树的旋转 4.1 左单旋&#xff08;LL旋转&#xff09; 4.2 右单旋&#xff08;RR旋转&#xff09; 4.3 右左旋&#xff08;RL旋转&#xff09; 4.4 左右旋&…

集群架构-web服务器(接入负载均衡+数据库+会话保持redis)--15454核心配置详解

紧接着前面的集群架构深化—中小型公司&#xff08;拓展到大型公司业务&#xff09;–下面图简单回顾一下之前做的及故障核心知识总结&#xff08;等后期完全整理后&#xff0c;上传资源希望能帮大家&#xff09; web集群架构-接入负载均衡部署web02服务器等 web集群-搭建web0…

介绍 Elasticsearch 中的 Learning to Tank - 学习排名

作者&#xff1a;来自 Elastic Aurlien Foucret 从 Elasticsearch 8.13 开始&#xff0c;我们提供了原生集成到 Elasticsearch 中的学习排名 (learning to rank - LTR) 实现。LTR 使用经过训练的机器学习 (ML) 模型为你的搜索引擎构建排名功能。通常&#xff0c;该模型用作第二…

postman接口测试实战篇

击杀小游戏接口测试 接口测试简单介绍击杀小游戏代码下载单接口测试(postman)接口关联并参数化接口测试简单介绍 首先思考两个问题:1.接口是什么?2.接口测试是什么? 1.我们总是把接口想的很复杂,其实呢,它就是一个有特定输入和输出参数的交互逻辑处理单元,它不需要知…

通过 EMR Serverless Spark 提交 PySpark 流任务

在大数据快速发展的时代&#xff0c;流式处理技术对于实时数据分析至关重要。EMR Serverless Spark提供了一个强大而可扩展的平台&#xff0c;它不仅简化了实时数据处理流程&#xff0c;还免去了服务器管理的烦恼&#xff0c;提升了效率。本文将指导您使用EMR Serverless Spark…

PostgreSQL使用(二)

说明&#xff1a;本文介绍PostgreSQL的DML语言&#xff1b; 插入数据 -- 1.全字段插入&#xff0c;字段名可以省略 insert into tb_student values (1, 张三, 1990-01-01, 88.88);-- 2.部分字段插入&#xff0c;字段名必须写全 insert into tb_student (id, name) values (2,…

[数据集][目标检测]导盲犬拐杖检测数据集VOC+YOLO格式4635张2类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;4635 标注数量(xml文件个数)&#xff1a;4635 标注数量(txt文件个数)&#xff1a;4635 标注…

graham 算法计算平面投影点集的凸包

文章目录 向量的内积&#xff08;点乘&#xff09;、外积&#xff08;叉乘&#xff09;确定旋转方向numpy 的 cross 和 outernp.inner 向量与矩阵计算示例np.outer 向量与矩阵计算示例 python 示例生成样例散点数据图显示按极角排序的结果根据排序点计算向量转向并连成凸包 基本…

Linux云计算 |【第一阶段】ENGINEER-DAY3

主要内容&#xff1a; LVM逻辑卷管理、VDO、RAID磁盘阵列、进程管理 一、新建逻辑卷 1、什么是逻辑卷 逻辑卷&#xff08;Logical Volume&#xff09;是逻辑卷管理&#xff08;Logical Volume Management&#xff0c;LVM&#xff09;系统中的一个概念。LVM是一种用于磁盘管理…

C++ :友元类

友元类的概念和使用 (1)将类A声明为B中的friend class后&#xff0c;则A中所有成员函数都成为类B的友元函数了 (2)代码实战&#xff1a;友元类的定义和使用友元类是单向的 (3)友元类是单向的&#xff0c;代码实战验证 互为友元类 (1)2个类可以互为友元类&#xff0c;代码实战…

Intel和AMD用户再等等!微软确认Win11 24H2年底前登陆

微软近日确认&#xff0c;Windows 11 24H2版本将于2024年底前正式登陆使用英特尔和AMD处理器的PC。 根据微软介绍&#xff0c;Windows 11 24H2将作为传统功能更新&#xff0c;将在今年晚些时候提供给所有设备。 此前&#xff0c;微软已向搭载骁龙X Plus和X Elite系列处理器的Co…

VS2019安装MFC组件

VS2019支持的MFC版本是mfc140 ~ mfc142版本&#xff0c;它兼容VS2015、VS2017之前的老版本程序。 一、MFC的历史版本 MFC的历史版本如下&#xff1a; IDE发布时间工具集版本MSC_VERMSVCMFC版本dllVisual C6.01998V601200MSVC6.06.0mfc42.dll、mfcce400.dllVisual Studio 2002…