数据库
首页 > 数据库> > Postgresql聚簇索引cluster使用说明

Postgresql聚簇索引cluster使用说明

作者:互联网

CLUSTER public.test USING test_id_idx;
CLUSTER public.test; -- 自动执行上次的聚簇

官方手册:http://postgres.cn/docs/9.6/sql-cluster.html


 -- sql语句大概是 select xxx,count(*) from test where id < 317 and id > 0 group by xxx
 -- 执行计划一部分如下:
 ->  Bitmap Heap Scan on test  (cost=26785.44..49868.47 rows=7141 width=222) (actual time=1113.964..3513.711 rows=50849 loops=1)
      Recheck Cond: ((id < 317) AND (id > 0))
      Heap Blocks: exact=50616
      Buffers: shared hit=33 read=62433 written=23

如上Bitmap扫描出exact=50616个block(id < 317 and id > 0 这个条件匹配到50616分block),随机扫描的block太多导致sql性能非常低。

针对该场景我们可以让test表基于id字段顺序分布在磁盘中,这样可以大大减少扫描的block。

CLUSTER public.test USING test_id_idx;

执行上面这个sql可以让id < 317的数据顺序分布在磁盘中,大大减低执行sql是扫描的block,提高查询性能

标签:Postgresql,聚簇,317,public,cluster,sql,test,id,block
来源: https://www.cnblogs.com/JaminXie/p/15793720.html