MySQL 使用 `WHERE` 子句时 `COUNT(*)`、`COUNT(1)` 和 `COUNT(column)` 的区别解析

文章目录

- 1. COUNT() 函数的基本作用
- 2. `COUNT(*)`、`COUNT(1)` 和 `COUNT(column)` 的详细对比
- - 2.1 `COUNT(*)` —— 统计所有符合条件的行
  - 2.2 `COUNT(1)` —— 统计所有符合条件的行
  - 2.3 `COUNT(column)` —— 统计某一列非 NULL 的记录数
- 3. 性能对比
- - 3.1 `EXPLAIN` 分析
- 4. 哪种方式更好？
- - 4.1 如果只是统计行数：
  - 4.2 统计某列的非 NULL 值：
  - 4.3 `COUNT(1)` 是否比 `COUNT(*)` 快？
- 5. 结论
- - **最佳实践**

在 MySQL 查询优化过程中，COUNT(*)、COUNT(1) 和 COUNT(column) 这三种计数方式常常被混淆，尤其是在使用 WHERE 子句进行数据筛选时，它们的执行效率和结果可能有所不同。本文将深入解析这三者的区别，并结合 SQL 执行原理和优化策略，帮助开发者更高效地使用 COUNT() 函数。

1. COUNT() 函数的基本作用

COUNT() 是 SQL 语言中的聚合函数之一，主要用于统计符合条件的记录数。不同的 COUNT() 变体在处理 NULL 值和优化策略方面有所不同。

常见的 COUNT() 语法包括：

COUNT(*)：统计表中所有符合条件的行（包括 NULL）。
COUNT(1)：统计表中所有符合条件的行，与 COUNT(*) 类似。
COUNT(column)：统计某一列中非 NULL 值的个数。

2. `COUNT(*)`、`COUNT(1)` 和 `COUNT(column)` 的详细对比

2.1 `COUNT(*)` —— 统计所有符合条件的行

COUNT(*) 计算所有符合 WHERE 条件的行数，不论这些行中的列是否包含 NULL 值。

示例：

SELECT COUNT(*) FROM users WHERE age > 18;

执行原理：

MySQL 不会具体读取某一列的数据，而是统计符合 WHERE 条件的行数。
在 InnoDB 存储引擎中，COUNT(*) 可以直接从索引中读取数据（如果合适的索引可用），性能较优。

适用场景：

需要统计表中所有符合条件的记录数，且不关心是否有 NULL 值时，COUNT(*) 是最佳选择。

2.2 `COUNT(1)` —— 统计所有符合条件的行

COUNT(1) 也是统计符合 WHERE 条件的行数，与 COUNT(*) 类似。

示例：

SELECT COUNT(1) FROM users WHERE age > 18;

执行原理：

COUNT(1) 会在每一行返回 1，然后统计这些 1 的个数。
在 MySQL 优化器看来，COUNT(1) 和 COUNT(*) 的执行计划通常是相同的。
在没有合适索引时，InnoDB 仍需进行全表扫描（或者索引扫描），不会因为 COUNT(1) 而有性能提升。

适用场景：

和 COUNT(*) 作用几乎一致，但一般推荐使用 COUNT(*)，因为 COUNT(*) 更符合 SQL 规范，并能适用于所有数据库系统。

2.3 `COUNT(column)` —— 统计某一列非 NULL 的记录数

COUNT(column) 仅统计某一列中非 NULL 的记录数，而不会统计 NULL 值。

示例：

SELECT COUNT(email) FROM users WHERE age > 18;

执行原理：

只有 email 列不为 NULL 的行才会被计入统计。
MySQL 需要读取 email 列的数据，以判断其是否为 NULL，因此比 COUNT(*) 和 COUNT(1) 可能稍慢（如果 email 列没有索引）。

适用场景：

需要排除 NULL 值时，比如统计已填写 email 地址的用户数量。

3. 性能对比

为了对比 COUNT(*)、COUNT(1) 和 COUNT(column) 的性能，我们进行如下实验：

假设有一个 users 表，其中 id 为主键，email 为可能包含 NULL 的列，数据如下：

id	name	age	email
1	张三	20	zhangsan@a.com
2	李四	25	NULL
3	王五	22	wangwu@b.com
4	赵六	19	NULL

测试 SQL 及其返回结果如下：

SELECT COUNT(*) FROM users WHERE age > 18;  -- 结果：3
SELECT COUNT(1) FROM users WHERE age > 18;  -- 结果：3
SELECT COUNT(email) FROM users WHERE age > 18;  -- 结果：2 （NULL 值被排除）

3.1 `EXPLAIN` 分析

如果 users 表的 email 没有索引，那么 COUNT(email) 需要扫描 email 列的数据，会比 COUNT(*) 略慢。

对于 COUNT(*) 和 COUNT(1)，InnoDB 通常会直接使用主键索引进行优化，因此在大多数情况下，两者性能相同。

示例 EXPLAIN 结果：

EXPLAIN SELECT COUNT(*) FROM users WHERE age > 18;

id	select_type	table	type	possible_keys	key	rows	Extra
1	SIMPLE	users	index	NULL	PRIMARY	3	Using index

Using index 表示 MySQL 直接利用索引进行优化，而无需扫描所有数据。

4. 哪种方式更好？

4.1 如果只是统计行数：

推荐使用 COUNT(*)，因为它可以利用索引优化，并且与数据库无关，通用性更强。

4.2 统计某列的非 NULL 值：

使用 COUNT(column)，但要注意 NULL 值不会被计入。

4.3 `COUNT(1)` 是否比 `COUNT(*)` 快？

在 MySQL 5.7 及以上版本，COUNT(1) 和 COUNT(*) 在优化器层面已经没有明显性能差异，因此一般推荐使用 COUNT(*)，更符合 SQL 规范。

5. 结论

计数方式	作用	处理 NULL	性能优化
`COUNT(*)`	统计符合 `WHERE` 条件的总行数	统计所有行（包括 NULL）	最优（可利用索引）
`COUNT(1)`	统计符合 `WHERE` 条件的总行数	统计所有行（包括 NULL）	与 `COUNT(*)` 类似
`COUNT(column)`	统计某列非 NULL 的行数	只统计非 NULL 值	可能稍慢（依赖索引情况）