其他分享
首页 > 其他分享> > impala 表迁移方式 partquet数据文件移动方法

impala 表迁移方式 partquet数据文件移动方法

作者:互联网

1、原表查询:
select count(*) from edm.ucard_wxd0123 where stat_dt = '2024-01-09' and id_no = '110101199003072893'

 

2、查看数据文件

hadoop fs -ls /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=2024-01-09

Found 2 items
-rw-r--r--   3 impala hive      11173 2019-12-10 16:57 /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=2024-01-09/214b1691c9ed3b01-dfd95f5f00000000_894437036_data.0.parq
-rw-r--r--   3 impala hive      10051 2019-12-10 16:57 /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=2024-01-09/214b1691c9ed3b01-dfd95f5f00000001_1509455238_data.0.parq

 

3、创建一张表

create table edm.ucard_wxd0123_20191211 like edm.ucard_wxd0123

 

4、获取parquet 格式文件

hadoop fs -get  /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=2024-01-09/214b1691c9ed3b01-dfd95f5f00000000_894437036_data.0.parq
hadoop fs -get  /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=2024-01-09/214b1691c9ed3b01-dfd95f5f00000001_1509455238_data.0.parq

 

5、创建分区目录

hadoop fs -mkdir /user/hive/warehouse/edm.db/ucard_wxd0123_20191211/stat_dt=2024-01-09

 

6、上传partquet文件

hadoop fs -put 214b1691c9ed3b01-dfd95f5f00000000_894437036_data.0.parq /user/hive/warehouse/edm.db/ucard_wxd0123_20191211/stat_dt=2024-01-09/
hadoop fs -put 214b1691c9ed3b01-dfd95f5f00000001_1509455238_data.0.parq /user/hive/warehouse/edm.db/ucard_wxd0123_20191211/stat_dt=2024-01-09/

7、Hive中修复表信息

msck REPAIR TABLE edm.ucard_wxd0123_20191211;

 

8、Impala 中刷新元数据

Invalidate  metadata edm.ucard_wxd0123_20191211;

 

9、进行查询

select * from  edm.ucard_wxd0123_20191211;

可以显示结果

 

总结:我们可以迁移partquet 文件到指定分区,然后进行查询数据。

标签:01,数据文件,ucard,09,hive,edm,wxd0123,impala,partquet
来源: https://www.cnblogs.com/hello-wei/p/12022088.html