1. GROUP BY(分组)
- GROUP BY用于将查询结果按照指定的列进行分组
- 通常与聚合函数(如COUNT、SUM、AVG等)一起使用
- 每个分组返回一行结果
示例:
SELECT department, COUNT(*) as employee_count
FROM employees
GROUP BY department;
2. DISTINCT(去重)
- DISTINCT用于去除结果集中的重复行
- 可以作用于单列或多列
- 在结果返回之前进行去重
示例:
SELECT DISTINCT department
FROM employees;-- 多列去重
SELECT DISTINCT department, job_title
FROM employees;
3. HAVING(分组后过滤)
- HAVING用于对GROUP BY分组后的结果进行过滤
- 只能用于GROUP BY之后
- 可以使用聚合函数作为过滤条件
- WHERE是在分组前过滤,HAVING是在分组后过滤
示例:
SELECT department, COUNT(*) as employee_count
FROM employees
GROUP BY department
HAVING COUNT(*) > 10;
主要区别
1. 执行顺序:
- WHERE → GROUP BY → HAVING → SELECT → DISTINCT → ORDER BY
2. 使用场景:
- DISTINCT:消除重复行
- GROUP BY:分组统计
- HAVING:对分组结果进行过滤
3. 实际应用示例:
SELECT department, COUNT(DISTINCT employee_id) as unique_employees
FROM employees
GROUP BY department
HAVING COUNT(DISTINCT employee_id) > 5
ORDER BY unique_employees DESC;
这个查询:
- 按部门分组
- 统计每个部门的独特员工数(使用DISTINCT去重)
- 只显示超过5个独特员工的部门
- 按员工数降序排序
重要提示
- WHERE在分组前过滤原始数据
- HAVING在分组后过滤结果
- DISTINCT可以独立使用,也可以在聚合函数中使用
- GROUP BY通常与聚合函数配合使用