clickhouse官方文档
作者:互联网
clickhouse官方文档
https://clickhouse.com/docs/zh/getting-started/tutorial
clickhouse常用概念:
1.分区是表的分区,具体的DDL操作关键词是 PARTITION BY,指的是一个表按照某一列数据(比如日期)进行分区,对应到最终的结果就是不同分区的数据会写入不同的文件中。
.2.ClickHouse的集群由分片 ( Shard ) 组成,而每个分片又通过副本 ( Replica ) 组成。这种分层的概念,在一些流行的分布式系统中十分普遍。例如,在Elasticsearch的概念中,一个索引由分片和副本组成,副本可以看作一种特殊的分片。如果一个索引由5个分片组成,副本的基数是1,那么这个索引一共会拥有10个分片 ( 每1个分片对应1个副本 )。
clickhouse 搭建:
clickhouse引擎分为库引擎和表引擎:
mergetree建表注意点:
order by 设定了分区内的数据按照哪些字段顺序进行有序保存;
order by 是 MergeTree 中唯一一个必填项,甚至比 primary key 还重要,因为当用户不设置主键的情况,很多处理会依照 order by 的字段进行处理(比如后面会讲的去重和汇总);
要求:主键必须是 order by 字段的前缀字段,比如 order by 字段是 (id,sku_id) 那么主键必须是 id 或者(id,sku_id)
clickhouse常用sql用法:
手动合并分区:optimize table t_order_mt final;
建表:create table t_order_mt(
id UInt32,
sku_id String,
total_amount Decimal(16,2),
create_time Datetime
) engine =MergeTree
partition by toYYYYMMDD(create_time)
primary key (id)
order by (id,sku_id);
clickhouse常用类型:
clickhouse函数:
标签:sku,副本,order,官方,文档,分片,id,clickhouse 来源: https://www.cnblogs.com/wangdayea/p/16360948.html