flinkSql 将流和表的互相转换

流——>表

方式一

方式二

方式一：写sql 
DataStreamSource<String> source = env.socketTextStream("localhost", 8881);
// 表名，流，字段名称
tableEnv.createTemporaryView("t_1",source，$("word"));方式二：使用dsl
DataStreamSource<String> source = env.socketTextStream("localhost", 8881);
// 表名，流，字段名称
Table table = tableEnv.fromDataStream(source,$("word"));

表——>流

Table table = tEnv.sqlQuery("select word,count(1) wordCount from t_1 group by word");// 方式一：toAppendStream
DataStream<Row> appendStream = tEnv.toAppendStream(table, Row.class);// 报错：toAppendStream doesn't support consuming update changes which is produced by node GroupAggregate(groupBy=[word], select=[word, SUM(num) AS sumNum])// 这个不支持分组和聚合操作，若出现聚合操作使用方式二将表转为流//方式二：toRetractStream
DataStream<Tuple2<Boolean, Row>> retractStream = tEnv.toRetractStream(table, Row.class);

wordCount案例

方式一：使用sql

package com.bigdata.day07;import org.apache.flink.api.common.RuntimeExecutionMode;
import org.apache.flink.api.common.functions.FilterFunction;
import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.table.api.Table;
import org.apache.flink.table.api.bridge.java.StreamTableEnvironment;
import org.apache.flink.types.Row;
import org.apache.flink.util.Collector;import static org.apache.flink.table.api.Expressions.$;/*** @基本功能:* @program:flinkProject* @author: 堇年* @create:2024-11-28 14:42:27**/
public class _06_flink_wordcounnt {public static void main(String[] args) throws Exception {//1. env-准备环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.setRuntimeMode(RuntimeExecutionMode.AUTOMATIC);// 获取tableEnv对象// 通过env 获取一个table 环境StreamTableEnvironment tEnv = StreamTableEnvironment.create(env);DataStreamSource<String> source = env.socketTextStream("localhost", 8881);SingleOutputStreamOperator<String> flatMap = source.flatMap(new FlatMapFunction<String, String>() {@Overridepublic void flatMap(String value, Collector<String> out) throws Exception {String[] split = value.split(",");for (String s : split) {out.collect(s);}}});//2. 创建表对象tEnv.createTemporaryView("t_1",flatMap,$("word"));//3. 编写sql语句Table table = tEnv.sqlQuery("select word,count(1) wordCount from t_1 group by word");//4. 将Table变为stream流//使用toAppendStream时会报错 因为有聚合操作//DataStream<Row> appendStream = tEnv.toAppendStream(table, Row.class);// toAppendStream doesn't support consuming update changes which is produced by node GroupAggregate(groupBy=[word], select=[word, SUM(num) AS sumNum])// 在这里可以映射为ROW对象，也可以映射为自己定义的实体类DataStream<Tuple2<Boolean, Row>> retractStream = tEnv.toRetractStream(table, Row.class);retractStream.filter(new FilterFunction<Tuple2<Boolean, Row>>() {@Overridepublic boolean filter(Tuple2<Boolean, Row> value) throws Exception {return value.f0;}}).print();//5. execute-执行env.execute();}
}

方式二：使用dsl语句

package com.bigdata.day07;import org.apache.flink.api.common.RuntimeExecutionMode;
import org.apache.flink.api.common.functions.FilterFunction;
import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.table.api.Table;
import org.apache.flink.table.api.bridge.java.StreamTableEnvironment;
import org.apache.flink.types.Row;
import org.apache.flink.util.Collector;import static org.apache.flink.table.api.Expressions.$;public class _06_flink_wordcounnt_dsl {public static void main(String[] args) throws Exception {//1. env-准备环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.setRuntimeMode(RuntimeExecutionMode.AUTOMATIC);// 获取tableEnv对象// 通过env 获取一个table 环境StreamTableEnvironment tEnv = StreamTableEnvironment.create(env);DataStreamSource<String> source = env.socketTextStream("localhost", 8881);SingleOutputStreamOperator<String> flatMap = source.flatMap(new FlatMapFunction<String, String>() {@Overridepublic void flatMap(String value, Collector<String> out) throws Exception {String[] split = value.split(",");for (String s : split) {out.collect(s);}}});//2. 创建表对象Table table = tEnv.fromDataStream(flatMap,$("word"));//3. 编写sql语句Table rsTable = table.groupBy($("word")).select($("word"),$("word").count().as("wordcount"));rsTable.printSchema();//4. 将Table变为stream流DataStream<Tuple2<Boolean, Row>> retractStream = tEnv.toRetractStream(rsTable, Row.class);retractStream.filter(new FilterFunction<Tuple2<Boolean, Row>>() {@Overridepublic boolean filter(Tuple2<Boolean, Row> value) throws Exception {return value.f0;}}).print();//5. execute-执行env.execute();}
}

结果展示

+I 表示有一条新数据进行了插入
+U 表示有一条已存在的数据有插入了一条，需要进行更新
-U 在+U前表示，先删除原本的，在update新的

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/486776.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

flinkSql 将流和表的互相转换

流——>表

表——>流

wordCount案例

方式一：使用sql

方式二：使用dsl语句

结果展示

相关文章

AI大模型驱动数据分析：利用自然语言实现数据查询与可视化（1）

PyCharm+Selenium+Pytest配置小记

【原生js案例】webApp实现鼠标移入移出相册放大缩小动画

Qt 安装Qt Serial Port

语音识别flask接口开发

计算机毕业设计Python医疗问答系统医疗可视化 BERT+LSTM+CRF深度学习识别模型机器学习深度学习爬虫知识图谱人工智能大数据毕业设计

shell条件测试

Couchbase Lite for Android 开源项目 FAQ

DVWA 靶场 SQL 注入报错 Illegal mix of collations for operation ‘UNION‘ 的解决方案

使用伪装IP地址和MAC地址进行Nmap扫描

PT8M2102 触控型 8Bit MCU

ARM A32多数据处理汇编指令理解分享

Docker 安装中文版 GitLab

二分查找（带图详解）

arguments和纯函数的介绍

煤矿 35kV 变电站 3 套巡检机器人 “上岗”，力破供电瓶颈

隐式神经网络实现低光照图像增强

【人工智能基础06】人工神经网络（练习题）：神经网络的计算、激活函数的选择与神经网络的退化

记录Windows中Mysql安装

【Java计算机毕业设计】Springboot+vue校园外卖配送服务管理系统【源代码+数据库+LW文档+开题报告+答辩稿+部署教程+代码讲解】