MySQL 单表三千万条数据，怎么优化 count 查询？

查询

count

分表

MySQL

46 replies 2020-09-30 10:47:06 +08:00

1

Joyboo

Sep 29, 2020

分区，索引

2

G2bN4dbX9J3ncp0r

Sep 29, 2020

可以不做 count，就不做
非做的话，看看能不能自己统计

或者放 es 里？

3

CodeXx

OP

Sep 29, 2020

@Joyboo 索引对 count 查询貌似没用，还是得扫描全表

4

CodeXx

OP

Sep 29, 2020

@lidashuang 分页查询用到的，也不知道会用什么条件查询

5

huntcool001

Sep 29, 2020

2

每天晚上把到零点的数据库的数据,离线做分析统计,count+各种查询条件等等(大概 es 或者其他框架,我不是很清楚), 结果存起来.

然后每天的数据,你有了当天零点以来的 binlog,就有了增量的 count. 和离线分析做出来的 count 结合起来.

大概是这个思路. 大厂都是这么干的.

6

RickyC

Sep 29, 2020

如果数据库不经常改变
根据查询条件建立几个 count 表, 里面保存根据各种条件得到的 count 数字;
并给 count 表建立索引

这样也许行

7

RickyC

Sep 29, 2020

接上
如果你每天还有 10w 的数据更改, 可以在每次更改的时候修改 count 表.

我觉得用 count 表可能解决你的问题. 预先统计

8

egglin

Sep 29, 2020

异构吧，es + mysql

9

maigebaoer

Sep 29, 2020 via Android

如果直接 count，用 count(*)吧，没啥特别好的建议。要不就直接入库前统计，写 count 字段。

10

mrhhsg

Sep 29, 2020

三千万的 count 那还不是一瞬间的事？加内存就完了

11

v2orz

Sep 29, 2020

插入的时候维护 count 信息？同 9L

12

Leigg

Sep 29, 2020 via Android

1

不要做实时查询即可，延迟个 30s 几分钟，数量到达一定高度后，多数场景中的实时统计就变成了一种伪需求，如果一定需要，换数据库，比如 clickhouse

13

RangerWolf

Sep 29, 2020

12 楼+1，clickhouse 的统计非常

14

dongisking

Sep 29, 2020

这问题我这边也遇到过，特别是做管理后台特别多复杂的条件做 where 的 count 根本无法缓存，最后的解决办法是把 count 缓存，然后页面显示“大约 xx 条”，每一段时间更新一次

15

cccy0

Sep 29, 2020

近实时统计的话建议放 es

16

sagaxu

Sep 29, 2020 via Android

@CodeXx 索引 count 时有没有用，要看区分度，你索引类似性别这种低区分度的当然没用

17

liuzhaowei55

Sep 29, 2020 via Android

不要使用 count，如果是 id 自增而且没有删除数据可以使用最后一条数据的 id，或者使用 explain 返回的 rows，这个值不太准但响应很快

18

nomansky

Sep 29, 2020

加个表，里面保存 count，每插入一条数据更新 count

19

haohappy

Sep 29, 2020

count 慢 select 不慢吗

20

dzdh

Sep 29, 2020

@CodeXx 分页场景的话，where 排序字段 >上一页的最大值 limt x, n

21

juntao

Sep 29, 2020

最近有遇到，多字段 WHERE 查询，1kw 条不到，不想分表
1 做好索引。可以用 EXPLAIN 来帮助优化。 -- 有一定效果
2 限制查询的时间范围 -- 特别有效
3 异构，mysql，redis 、elasticsearch 等等单独统计数据，因为 2 能够满足我们的需求，所以没采用。

@liuzhaowei55 直接获取自增 id 也是一种方法诶。之前没考虑，需要匹配场景。