从 MySQL 5.7 到 8.0:理解 GROUP BY 的新规则与实战优化20241112

🎯 从 MySQL 5.7 到 8.0:理解 GROUP BY 的新规则与实战优化

🔎 引言

随着 MySQL 的不断升级,从 5.7 到 8.0,不仅性能得到提升,其对 SQL 标准的严格执行也显著提高。GROUP BY 的行为变化就是一个典型例子。对开发者而言,MySQL 8.0 强制遵守 ONLY_FULL_GROUP_BY 规则,虽然提高了数据一致性,但也为老代码迁移带来了不小的挑战。

本文将从 问题背景 出发,通过 报错分析 和 案例复盘,探讨如何应对 MySQL 升级带来的挑战,同时总结出一套高效的解决方案。

🌟 一、问题背景:MySQL 升级带来的挑战

1. 什么是 GROUP BY?

GROUP BY 是一种将数据按字段分组的 SQL 操作,通常用于统计、聚合和分析场景。示例如下:

SELECT department, COUNT(*) AS employee_count
FROM employees
GROUP BY department;

2. MySQL 5.7 的行为

  • 默认启用了 ONLY_FULL_GROUP_BY 模式,但执行较为宽松。
  • 某些情况下,未完全符合规则的查询也能隐式运行。

3. MySQL 8.0 的行为

  • 严格执行 ONLY_FULL_GROUP_BY 模式。
  • 未分组字段或未使用聚合函数的字段会直接报错。
  • 示例:
SELECT column1, column2, MAX(column3)
FROM table_name
GROUP BY column1;

在 MySQL 8.0 中,若 column2 未出现在 GROUP BY 或未使用聚合函数,将报错:

Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'column2' which is not functionally dependent on columns in GROUP BY clause.

🚨 二、常见报错与原因

1. 报错示例 1

SELECT column1, column2
FROM table_name
GROUP BY column1;
  • 错误信息:
Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'column2'.

原因:column2 既未分组也未聚合,违反了 SQL 标准。

2. 报错示例 2

SELECT column1, MAX(column2), column3
FROM table_name
GROUP BY column1;
  • 错误信息:
Expression #3 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'column3'.

原因:column3 未分组或聚合,与 ONLY_FULL_GROUP_BY 规则冲突。

🔧 三、解决方案

方法 1:修改 SQL 查询 🛠️

调整查询以符合 GROUP BY 规则:
1. 所有未聚合字段必须出现在 GROUP BY 中。
2. 为未分组字段使用聚合函数。

示例改写:

-- 错误写法
SELECT column1, column2
FROM table_name
GROUP BY column1;-- 正确写法
SELECT column1, MAX(column2) AS max_column2
FROM table_name
GROUP BY column1;
  • 优缺点:
    • ✅ 优点:符合标准,解决问题的长远之道。
    • ❌ 缺点:需要对旧代码进行大规模修改。

方法 2:调整 MySQL 配置 ⚙️

通过调整 MySQL 的 sql_mode 配置,禁用 ONLY_FULL_GROUP_BY:

步骤:

1. 检查当前 sql_mode:
SELECT @@GLOBAL.sql_mode;

输出示例:

STRICT_TRANS_TABLES,ONLY_FULL_GROUP_BY,NO_ENGINE_SUBSTITUTION
2. 移除 ONLY_FULL_GROUP_BY:
SET GLOBAL sql_mode=(SELECT REPLACE(@@sql_mode, 'ONLY_FULL_GROUP_BY', ''));
3. 修改配置文件,永久禁用:编辑 /etc/mysql/my.cnf:
[mysqld]
sql_mode=STRICT_TRANS_TABLES,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION
4. 重启 MySQL 服务:
sudo systemctl restart mysql

验证:

SELECT @@GLOBAL.sql_mode;

输出中不应包含 ONLY_FULL_GROUP_BY。

优缺点:
• ✅ 优点:快速解决问题,无需修改 SQL。
• ❌ 缺点:可能导致聚合结果错误,需谨慎使用。

🔍 四、插曲:配置文件冲突与排查

1. 配置文件加载顺序

MySQL 加载配置文件的顺序如下:
1. /etc/my.cnf
2. /etc/mysql/my.cnf
3. /etc/mysql/conf.d/.cnf
4. /etc/mysql/mysql.conf.d/
.cnf

  • 问题:
    多个配置文件中定义了 sql_mode,后加载的文件会覆盖前面的设置。

2. 如何发现冲突?

  • 检查所有配置文件:
sudo grep -R "sql_mode" /etc/mysql/
  • 查看实际加载的配置文件:
mysql --help | grep "Default options"
  • 验证实际生效的 sql_mode:
SELECT @@GLOBAL.sql_mode;

3. 解决冲突的最佳实践

•	将主要的 sql_mode 定义放在 /etc/mysql/my.cnf。
•	针对工具(如 mysqldump)的特殊需求,单独在 /etc/mysql/conf.d/*.cnf 中配置。

📚 五、实际案例复盘

案例 1:查询菜单类型统计

表名:eb_system_menu
表结构:

+------------+--------------+
| Field      | Type         |
+------------+--------------+
| id         | int          |
| menu_type  | varchar(2)   |
| name       | varchar(100) |
+------------+--------------+

需求:统计每种菜单类型的数量。

SELECT menu_type, COUNT(*) AS count
FROM `ydkj-mall`.`eb_system_menu`
GROUP BY menu_type;

案例 2:用户状态分布统计

表名:eb_user
表结构:

+------------+--------------+
| Field      | Type         |
+------------+--------------+
| uid        | int          |
| status     | tinyint(1)   |
| nickname   | varchar(100) |
+------------+--------------+

需求:统计每种状态的用户数量。

SELECT status, COUNT(*) AS user_count
FROM `ydkj-mall`.`eb_user`
GROUP BY status;

🎯 六、总结与最佳实践

1. 理解 MySQL 的变化

MySQL 8.0 的严格模式符合标准化要求,虽然迁移成本较高,但能显著提高数据一致性。

2. 合理选择解决方案

  • 修改 SQL 查询是最推荐的长远方案。
  • 调整 sql_mode 可作为短期过渡,但需严格测试。

3. 配置管理的建议

  • 集中管理 sql_mode,避免多文件冲突。
  • 使用工具检查实际生效的配置,确保一致性。

🎉 附录:常用 SQL 验证命令

-- 查看当前模式
SELECT @@GLOBAL.sql_mode;-- 查看表结构
DESCRIBE `table_name`;-- 显示加载的配置文件
mysql --help | grep "Default options";

通过对 MySQL 的深入分析和实战操作,相信你已经掌握了解决 GROUP BY 规则冲突的技巧。希望这篇文章能帮助你在数据库升级中游刃有余,轻松应对变化! 😊

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/470119.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RAFT: Recurrent All-Pairs Field Transforms for Optical Flow用于光流估计的循环全对场变换

背景: 1.光流估计是一个长期存在的计算机视觉问题,对于理解视频内容至关重要。 2.光流估计面临的挑战包括快速移动的物体、遮挡、运动模糊和无纹理表面。 3.传统方法通常将光流估计视为一个手工优化问题,但这些方法在处理各种特殊情况时存…

大数据面试题--kafka夺命连环问(后10问)

目录 16、kafka是如何做到高效读写? 17、Kafka集群中数据的存储是按照什么方式存储的? 18、kafka中是如何快速定位到一个offset的。 19、简述kafka中的数据清理策略。 20、消费者组和分区数之间的关系是怎样的? 21、kafka如何知道哪个消…

【Android、IOS、Flutter、鸿蒙、ReactNative 】约束布局

Android XML 约束布局 参考 TextView居中 TextView 垂直居中并且靠右 TextView 宽高设置百分比 宽和高的比例 app:layout_constraintDimensionRatio"h,2:1" 表示子视图的宽高比为2:1,其中 h表示保持宽度不变,高度自动调整。 最大宽度 设…

【机器学习】平均绝对误差(MAE:Mean Absolute Error)

平均绝对误差 (Mean Absolute Error, MAE) 是一种衡量预测值与实际值之间平均差异的统计指标。它在机器学习、统计学等领域中广泛应用,用于评估模型的预测精度。与均方误差 (MSE) 或均方误差根 (RMSE) 不同,MAE 使用误差的绝对值,因此它在处理…

【Qt】在 Qt Creator 中使用图片资源方法(含素材网站推荐)

先准备图片资源 推荐一个好用的图标素材网站,有很多免费资源。 Ic, fluent, animal, dog, filled icon - Free download 其他辅助工具,类似 AI 抠图去背景,实测效果还行,但是非免费。 美图秀秀-在线一键抠图,无需P…

Dial-insight:利用高质量特定领域数据微调大型语言模型防止灾难性遗忘

摘要 大型语言模型(LLM)的性能很大程度上依赖于底层数据的质量,特别是在专业领域。在针对特定领域应用微调LLM时,一个常见的挑战是模型泛化能力的潜在下降。为了解决这些问题,我们提出了一种两阶段方法来构建提示词&a…

品融电商:新形势下电商平台如何助力品牌长期经营

品融电商:新形势下电商平台如何助力品牌长期经营 在过去几年中,随着内容电商的兴起,一批新兴品牌通过精准的内容种草和互动营销迅速打开市场,实现了从“0到1”的品牌起步阶段。比如,新品牌SIINSIIN通过小红书等内容电商…

Springboot整合Prometheus+grafana实现系统监控

前言 Prometheus是一个开源的服务监控系统和时序数据库,它提供了强大的功能和灵活的架构,是目前主流的监控和管理应用系统的工具。 而Grafana是一个开源的数据可视化工具,与Prometheus集成,就可以可视化地监控系统的各个指标。 …

运行WHTools批量启动游戏房间工具提示要安装.Net Framework3.5解决

确认电脑能正常上网 点击下载并安装此功能,开始安装.Net Framework 3.5 安装成功 成功启动WHTools

怎么监控员工电脑?分享5个监控员工电脑的绝佳方法(立竿见影!建议收藏!)

怎么监控员工电脑? 在企业管理中,缺乏行之有效的监控时,便会滋生一些不当行为便,如偷偷浏览与工作无关的网站、泄露公司机密信息、甚至进行非法操作等。 为了有效管理员工电脑,确保企业信息安全,学会合理合…

监控录音如何消除杂音?降低录音噪音的五个技巧

在日常生活和工作中,监控录音的清晰度对信息获取极为重要。然而,录音过程中常会遇到各种杂音干扰,这些干扰可能来自环境噪音、设备故障等多种因素。为了提高录音质量,采取有效的杂音消除技术是必不可少的。监控录音如何消除杂音&a…

红日靶机(七)笔记

VulnStack-红日靶机七 概述 在 VulnStack7 是由 5 台目标机器组成的三层网络环境,分别为 DMZ 区、第二层网络、第三层网络。涉及到的知识点也是有很多,redis未授权的利用、laravel的历史漏洞、docker逃逸、隧道、代理的搭建、通达OA系统的历史漏洞、ms…

沃飞长空郭亮博士荣获中国航空航天月桂奖

11月11日晚,第十六届中国航空航天月桂奖颁奖典礼在珠海成功举办。本届月桂奖共有29个为中国航空航天事业做出突出贡献的团体与个人获奖,其中,沃飞长空CEO兼首席科学家郭亮博士因其在低空经济领域的突出贡献荣膺第十六届中国航空航天月桂奖“风…

WordPress 2024主题实例镜像

目录 隐藏 1 WordPress 2024主题实例镜像启用的插件 2 WordPress 2024主题实例镜像截图 WordPress 2024主题实例镜像启用的插件 WordPress 2024主题实例镜像启用了2024主题,配置了: Akismet 反垃圾评论插件 Admin Notices Manager仪表盘通知隐藏…

Nginx中实现流量控制(限制给定时间内HTTP请求的数量)示例

场景 流量控制 流量限制 (rate-limiting),可以用来限制用户在给定时间内HTTP请求的数量。 流量限制可以用作安全目的,比如可以减慢暴力密码破解的速率, 更常见的情况是该功能被用来保护上游应用服务器不被同时太多用户请求所压垮。 流量…

探索 JNI - Rust 与 Java 互调实战

真正的救赎,并非厮杀后的胜利,而是能在苦难之中,找到生的力量和内心的安宁。 ——加缪Albert Camus 一、Rust Java ? Java 和 Rust 是两种现代编程语言,各自具有独特的优势,适用于不同的应用场景。 1、…

使用HTML、CSS和JavaScript创建动态圣诞树

✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 ✨特色专栏&#xff1a…

3DTiles之i3dm介绍

3DTiles之i3dm介绍 3D Tiles 是一种用于高效存储和传输三维城市、建筑、地形、点云等空间数据的开放标准格式。i3dm(Intel 3D Model)是 3D Tiles 中用于表示三维模型(如建筑物或其他对象)的一个子格式。i3dm 格式的出现&#xff…

重新认识HTTPS

一. 什么是 HTTPS HTTP 由于是明文传输,所谓的明文,就是说客户端与服务端通信的信息都是肉眼可见的,随意使用一个抓包工具都可以截获通信的内容。 所以安全上存在以下三个风险: 窃听风险,比如通信链路上可以获取通信…

pycharm快速更换虚拟环境

目录 1. 选择Conda 虚拟环境2. 创建环境3. 直接选择现有虚拟环境 1. 选择Conda 虚拟环境 2. 创建环境 3. 直接选择现有虚拟环境