GROUP BY用于按列分组数据并结合聚合函数进行统计分析,支持单列、多列分组及WHERE过滤和HAVING筛选,常用于汇总客户订单、产品销量等场景,需注意非聚合字段必须出现在GROUP BY中且建议对分组字段建索引以提升性能。

在 mysql 中,GROUP BY 用于将结果集按一个或多个列进行分组,通常与聚合函数(如 count、SUM、AVG、MAX、MIN)一起使用,以便对每组数据进行统计分析。它能帮助你从大量数据中提取出有意义的汇总信息。
基本语法结构
GROUP BY 的基本语法如下:
select 列名, 聚合函数(列)
FROM 表名
WHERE 条件(可选)
GROUP BY 分组列名;
注意:SELECT 子句中除了聚合函数外的字段,一般都应出现在 GROUP BY 后面。
常见使用场景和示例
假设有一张名为 orders 的表,包含以下字段:
- customer_name(客户姓名)
- product(产品名称)
- quantity(数量)
- order_date(订单日期)
1. 按客户统计订单总数
你想知道每个客户下了多少笔订单:
SELECT customer_name, COUNT(*) AS order_count
FROM orders
GROUP BY customer_name;
2. 按产品统计总销售量
计算每种产品的销售总量:
SELECT product, SUM(quantity) AS total_quantity
FROM orders
GROUP BY product;
3. 结合 WHERE 进行过滤后再分组
只统计2024年以后的订单中,每个客户的平均购买数量:
SELECT customer_name, AVG(quantity) AS avg_quantity
FROM orders
WHERE order_date >= ‘2024-01-01’
GROUP BY customer_name;
4. 按多个字段分组
如果你想查看每个客户购买每种产品的总数量:
SELECT customer_name, product, SUM(quantity) AS total_quantity
FROM orders
GROUP BY customer_name, product;
使用 HAVING 过滤分组结果
WHERE 是在分组前过滤行,而 HAVING 用于在分组后对组进行筛选。例如,只显示订单数大于2的客户:
SELECT customer_name, COUNT(*) AS order_count
FROM orders
GROUP BY customer_name
HAVING order_count > 2;
HAVING 可以使用聚合函数,而 WHERE 不可以。
注意事项
- GROUP BY 后的列应该是有实际意义的分类字段,比如类别、地区、用户ID等。
- 在 SQL_MODE 开启了 ONLY_FULL_GROUP_BY(MySQL 默认开启)时,SELECT 中所有非聚合字段必须出现在 GROUP BY 中。
- GROUP BY 会影响查询性能,尤其是大数据量时,建议对分组字段建立索引。
基本上就这些。掌握 GROUP BY 能让你轻松做数据汇总,是写报表类 SQL 的核心技能之一。