其他分享
首页 > 其他分享> > Hive分桶表

Hive分桶表

作者:互联网

一、分桶表的创建

  1. 原始分桶表

    create table test_tb_f
    (
        id     int,
        name   string,
        age    int,
        gender string
    ) row format delimited
        fields terminated by ',';
    
  2. 创建分桶表

    create table test_tb_ft(
        id int,
        name string,
        age int,
        gender string
    )clustered by (gender) sorted by (age desc ) into 2 buckets ;
    
  3. 将原始数据中的数据进行分桶操作,本质是将原始数据表中的某个字段进行平均分配

    insert into test_tb_ft select * from python.test_tb_f;
    

二、分桶计算过程

三、分桶表和分区表的区别

标签:分桶,int,gender,分区,Hive,test,tb
来源: https://blog.csdn.net/feizuiku0116/article/details/120811610