其他分享
首页 > 其他分享> > Hive 数据导入/导出

Hive 数据导入/导出

作者:互联网

Hive 支持的文件格式

综合上述各种性能指标,生产环境中主流做法是原始日志写入 hive 的存储格式都采用 ORC 或者 Qarquet 格式

文件存储分类

数据导入

方式一

手动用 hdfs 命令,直接导入本地数据或 hdfs 数据到 Hive 仓库的表目录中

方式二

在 Hive 的交互式 shell 中用 load 命令,导入本地数据到 Hive 仓库的表目录中(文件复制)

注:Hive 的 load 命令是将文件直接加载到 Hive 仓库表的目录中, 将相关的元数据信息加到 MySQL 中,不涉及到文件格式的转换

方式三

在 Hive 的交互式 shell 中用 load 命令,导入 hdfs 数据到 Hive 仓库的表目录中(文件移动)

注:导入的 hfds 数据将被移动到 Hive 仓库表目录中

方式四

在 Hive 的交互式 shell 中用 insert 命令,导入Hive 表数据到 Hive 仓库的表目录中(主要用于创建表的文件格式和加载的数据文件格式不一致的时候

方式五

在 Hive 的交互式 shell 中用 import 命令,导入使用 Export 命令导出的文件数据

注:Import 导入的数据必须是 Export 导出的数据

数据导出

方式一

标签:文件,存储,导出,Hive,导入,格式,数据,ORC
来源: https://www.cnblogs.com/ccl971123/p/15689191.html