首页 > TAG信息列表 > SensorReading
Flink-富函数(Rich Functions)
4.富函数(Rich Functions) 4.1 函数类(Function Classes) Flink 暴露了所有 udf 函数的接口(实现方式为接口或者抽象类)。例如MapFunction, FilterFunction, ProcessFunction 等等。 下面例子实现了 FilterFunction 接口: class FilterFilter extends FilterFunction[String] {flink报错This type (GenericType<cn.kgc.SensorReading>) cannot be used as key.
原始代码 object TransformTest { def main(args: Array[String]): Unit = { val env = StreamExecutionEnvironment.getExecutionEnvironment val stream: DataStreamSource[String] = env.readTextFile("src/main/resources/hello.txt") val value: DatFlink代码1
1.maven依赖 <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</artifactId> <version>1.10.1</version> </dependency> <dependenFlink——四种读取数据方式(集合、文件、kafka、自定义数据源)
Flink分别从集合、文件、kafka和自定义数据源四种方式中读取数据。代码如下: package apiTest import org.apache.flink.api.common.serialization.SimpleStringSchema import org.apache.flink.api.scala.createTypeInformation import org.apache.flink.streaming.api.funcflink的souce方法
主要包括有界流和无界流 import java.util.Properties import org.apache.flink.api.common.serialization.SimpleStringSchema import org.apache.flink.streaming.api.functions.source.SourceFunction import org.apache.flink.streaming.api.scala._ import org.apache.fliFlink-状态管理
Flink-状态管理 在 Flink 的框架中,进行有状态的计算是 Flink 最重要的特性之一。所谓的状态,其实指的是 Flink 程序的中间计算结果。Flink 支持了不同类型的状态,并且针对状态的持久化还提供了专门的机制和状态管理器。 状态 我们在 Flink 的官方博客中找到这样一段话,可以认为这是对Flink之Watermarks
1、代码案例 package window import com.yangwj.api.SensorReading import org.apache.flink.streaming.api.TimeCharacteristic import org.apache.flink.streaming.api.functions.source.SourceFunction import org.apache.flink.streaming.api.functions.timestamps.BoundedOFlink 侧输出流 DEMO
代码: package com.kpwong.sideoutput import com.atguigu.window.{SensorReading} import org.apache.flink.streaming.api.functions.ProcessFunction //import org.apache.flink.streaming.api.functions.timestamps.BoundedOutOfOrdernessTimestampExtractor import org.aFlink流处理API之environment And Source
Flink流处理API flink API主要分为四个模块:environment, source,transform,sink environment getExecutionEnvironment 会根据执行的方式底层调用下面两种方式创建对应的环境: createLocalEnvironment和createRemoteEnvironment,分别为创建本地和远程的执行环境 source source分为四Flink实例(三十一):状态管理(二)自定义键控状态(一)ValueState
ValueState[T]保存单个的值,值的类型为T。 get操作: ValueState.value() set操作: ValueState.update(value: T) 实例一 scala version val sensorData: DataStream[SensorReading] = ... val keyedData: KeyedStream[SensorReading, String] = sensorData.keyBy(_.id) valFlink实例(二): 自定义source
1 工程目录 SensorReading package com.atguigu.flink.bean case class SensorReading( id: String, timestamp: Long, timepreture: Double ) SensorSource packagFlink基础(五):Flink 流处理 API
1 Environment 1.1 getExecutionEnvironment 创建一个执行环境,表示当前执行程序的上下文。 如果程序是独立调用的,则此方法返回本地执行环境;如果从命令行客户端调用程序以提交到集群,则此方法返回此集群的执行环境,也就是说,getExecutionEnvironment 会根据查询运行的方式决定返大数据之输出报警信息
package com.sjw.flink import org.apache.flink.api.common.state.{ValueState, ValueStateDescriptor}import org.apache.flink.streaming.api.functions.KeyedProcessFunctionimport org.apache.flink.streaming.api.scala._import org.apache.flink.util.Collector /** *Flink学习(十七) Emitting to Side Outputs(侧输出)
我们在生产实践中经常会遇到这样的场景,需把输入源按照需要进行拆分,比如我期望把订单流按照金额大小进行拆分,或者把用户访问日志按照访问者的地理位置进行拆分等。面对这样的需求该如何操作呢? 大部分的DataStream API的算子的输出时单一输出,也就是某种数据类型的流。除了split算子(Flink(五) —— DataStream API
package flink import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment import org.apache.flink.api.scala._ case class SensorReading(id: String, timestamp: Long, temperature: Double) object SourceTest { def main(args: Array[String]): UnFlink 笔录
Flink 文章目录Flink一、Flink 简介1.1 Flink 的特点1.2 Flink 与 Spark Streaming 对比二、快速上手2.1 搭建 maven 工程2.2 批处理 wordcount三、Flink 部署3.1 Yarn 部署3.2 Kubernetes 部署四、Flink 运行时架构4.1 Flink 运行时组件4.2 任务提交流程4.3 任务调度原理2.