count(1)、count(*)、count(列名)的区别

Marlowe

数据库

发布于：Aug 29, 2021

次浏览

1.4k words

5 min

在平时开发，或者写sql过程中，没怎么注意过count(1)、count(*)、count(列名)的区别，本文，将结束一下这三者的区别。

1. count(1) and count(*)

从执行效果来看，count(1)和count(*)的效果是一样的。

当表的数据量大些时，对表作分析之后，使用count(1)还要比使用count()用时多！当数据量在1W以内时，count(1)会比count()的用时少些，不过也差不了多少。

如果count(1)是聚集索引时，那肯定是count(1)快，但是差的很小。因为count()，会自动优化指定到那一个字段。所以没必要去count(1)，使用count()，sql会帮你完成优化的，因此：在有聚集索引时count(1)和count(*)基本没有差别！

以下来自官方文档：

*InnoDB处理count()和count(1)采用的是一样的方式，没有性能上的差别。**

2. count(1) and count(字段)

两者的主要区别是

count(1) 会统计表中的所有的记录数，包含字段为null 的记录。
count(字段) 会统计该字段在表中出现的次数，忽略字段为null 的情况。
即不统计字段为null 的记录。

3. count(*) 和 count(1)和count(列名)区别

执行效果上：

count(*)包括了所有的列，相当于行数，在统计结果的时候，不会忽略为NULL的值。
count(1)包括了忽略所有列，用1代表代码行，在统计结果的时候，不会忽略为NULL的值。
count(列名)只包括列名那一列，在统计结果的时候，会忽略列值为空（这里的空不是指空字符串或者0，而是表示null）的计数，即某个字段值为NULL时，不统计。

执行效率上：

列名为主键，count(列名)会比count(1)快
列名不为主键，count(1)会比count(列名)快
如果表多个列并且没有主键，则 count(1 的执行效率优于 count（*）
如果有主键，则 select count（主键）的执行效率是最优的
如果表只有一个字段，则 select count（*）最优。

4. 实例分析

create table counttest
(name char(1),
age char(2));
 
insert into counttest values
('a', '14'),
('a', '15'),
('a', '15'),
('b', NULL),
('b', '16'),
('c', '17'),
('d', null),
('e', '');

select name,
count(name),
count(1),
count(*),
count(age),
count(distinct(age))
from counttest
group by name;

结果如下：

5. 一些问题

在INNODB与MYISAM中统计当前数据行，用count(*）有什么区别？

MyISAM对于表的行数做了优化，具体做法是有一个变量存储了表的行数，如果查询条件没有WHERE条件则是查询表中一共有多少条数据，MyISAM可以做到迅速返回，前提条件是没有where语句的哦， InnoDB不保存表的具体行数，执行select count(*) from table时需要全表扫描。

那么为什么InnoDB没有了这个变量呢？

因为InnoDB的事务特性，在同一时刻表中的行数对于不同的事务而言是不一样的，因此count统计会计算对于当前事务而言可以统计到的行数，而不是将总行数储存起来方便快速查询。

InnoDB会尝试遍历一个尽可能小的索引除非优化器提示使用别的索引。如果二级索引不存在，InnoDB还会尝试去遍历其他聚簇索引。 如果索引并没有完全处于InnoDB维护的缓冲区（Buffer Pool）中，count操作会比较费时。

MySQL查询一定大范围的数据和在Redis中查询一定大范围的数据量，那个更快一点？

Redis的查询效率比Mysql查询效率要快；因为Redis的数据是保存在内存中， 我们可以直接去内存中读取数据，这样的效率更快一点，而MySql数据是保存在磁盘中，每次查询数据我们都要去磁盘进行IO读取，大大增加了查询时间，同时还会涉及到回表的问题，影响查询效率。

Redis存储的是k-v格式的数据。时间复杂度是O(1),常数阶，而MySQL引擎的底层实现是B+Tree，时间复杂度是O(logn)**，对数阶。Redis会比MySQL快一点点。

Redis是单线程的多路复用IO**，单线程避免了线程切换的开销，而多路复用IO避免了IO等待的开销，在多核处理器下提高处理器的使用效率可以对数据进行分区，然后每个处理器处理不同的数据。

6. 总结

如果在开发中确实需要用到count()聚合，那么优先考虑count()，因为mysql数据库本身对于count()做了特别的优化处理。
有主键或联合主键的情况下，count(*)略比count(1)快一些。
没有主键的情况下count(1)比count(*)快一些。
如果表只有一个字段，则count(*)是最快的。
使用count()聚合函数后，最好不要跟where age = 1；这样的条件，会导致不走索引，降低查询效率。除非该字段已经建立了索引。使用count()聚合函数后，若有where条件，且where条件的字段未建立索引，则查询不会走索引，直接扫描了全表。
count(字段),非主键字段，这样的使用方式最好不要出现。因为它不会走索引.