数据库
首页 > 数据库> > java – 使用spark streaming从数据库中读取流

java – 使用spark streaming从数据库中读取流

作者:互联网

我想使用spark streaming来读取来自RDBMS数据库的数据,比如mysql.

但我不知道如何使用JavaStreamingContext来做到这一点

 JavaStreamingContext jssc = new JavaStreamingContext(conf, Durations.milliseconds(500));
DataFrame df = jssc. ??

我在互联网上搜索,但我没有找到任何东西

先感谢您.

解决方法:

如果不安装某些第三方软件,你就无法做到这一点.
你可以做的是创建一个个性化的接收器,它可以完成你想要的,使用SparkSQL包和Streaming组合.
实现扩展Receiver的类,并在内部执行从数据库中提取数据所需的所有连接和查询.
我现在在工作,所以我会给你一个链接,看看而不是产生代码,抱歉:
http://spark.apache.org/docs/latest/streaming-custom-receivers.html
https://medium.com/@anicolaspp/spark-custom-streaming-sources-e7d52da72e80

标签:java,apache-spark,mysql,spark-dataframe,spark-streaming
来源: https://codeday.me/bug/20190824/1704428.html