数据库
首页 > 数据库> > spark(19)sparksql概述及其四大特性

spark(19)sparksql概述及其四大特性

作者:互联网

sparksql概述

sparksql的前世今生

什么是sparksql

Spark SQL is Apache Spark's module for working with structured data.

SparkSQL是apache Spark用来处理结构化数据的一个模块。

1569468946521

sparksql的四大特性

易整合

将SQL查询与Spark程序无缝混合

可以使用不同的语言进行代码开发

1569469087993

统一的数据源访问

以相同的方式连接到任何数据源,sparksql后期可以采用一种统一的方式去对接任意的外部数据源,不需要使用不同的Api

val  dataFrame = sparkSession.read.文件格式的方法名("该文件格式的路径")

1569469225309

兼容hive

sparksql可以支持hivesql这种语法 sparksql兼容hivesql

1569469413038

支持标准的数据库连接

sparksql支持标准的数据库连接JDBC或者ODBC

1569469446641

标签:Shark,19,数据源,兼容,sparksql,SQL,spark,Spark
来源: https://www.cnblogs.com/jimmy888/p/13551729.html