完整教程:flink批处理-时间和窗口

news/2025/10/3 20:48:55/文章来源:https://www.cnblogs.com/tlnshuju/p/19124978

完整教程:flink批处理-时间和窗口

2025-10-03 20:43  tlnshuju  阅读(0)  评论(0)    收藏  举报

流处理:流处理是对连续产生的实时数据进行即时处理的技巧,内容以事件流的形式逐条(flink)或按小批次(spark)处理,无需等待完整素材集就绪。
批处理对静态数据集按固定批次(如每小时/每天)进行离线处理的手艺,遵循“先存储后处理”模式。就是:批处理
有界流:有界流:具有明确的开始和结束点(如静态材料、数据库表)。有界流处理通常被称为批处理。
无界流:只有开始点,数据持续产生无终止(如Kafka消息流、IoT传感器数据)。

所谓的窗口计算。flink通过这种方式,实现数据的批处理。就是flink通过划定一段时间范围(时间窗),对在这范围内的数据进行处理,就
窗口和时间往往是分不开的,所以需要了解flink中的时间语义和窗口的概念。

流处理的核心组件,其设计原理和应用方式如下:就是Flink的时间语义和窗口机制

一、时间语义

1.事件时间(Event Time)‌

数据产生时自带的时间戳,需配合水位线(Watermark)处理乱序事件,适用于需要精确时间戳的场景

2.处理时间(Processing Time)‌

算子本地系统时间,延迟低但结果不可重现,适用于实时性要求高的场景

3.摄入时间(Ingestion Time)‌

资料进入Flink Source的时间。

二、窗口类型

1. 按驱动方式

‌时间窗口‌:基于时间范围划分,包括滚动、滑动、会话三种子类型。
‌计数窗口‌:基于材料条数划分,与时间无关。

2. 按分配规则

类型特点示例场景
滚动窗口固定长度、无重叠(如每小时统计)日活用户统计
滑动窗口固定长度、可重叠(如每5分钟统计近1小时)实时监控报警
会话窗口动态间隙触发(用户无管理后关闭)用户行为分析
全局窗口需自定义触发器(如批处理)全量聚合计算

三、关键机制

‌1.水位线(Watermark)

用于处理事件时间乱序。

2.窗口函数

增量聚合(ReduceFunction)
全量计算(ProcessWindowFunction)

3.迟到数据处理

通过侧输出流(Side Output)或允许延迟(Allowed Lateness)保障结果准确性

// 事件时间滑动窗口
dataStream.assignTimestampsAndWatermarks(WatermarkStrategy.forBoundedOutOfOrderness(Duration.ofSeconds(5))).keyBy(Event::getUserId).window(SlidingEventTimeWindows.of(Time.seconds(30), Time.seconds(5))).aggregate(new CustomAggregate());

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/926302.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

详细介绍:Java基础

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

10.3 考试总结

10.3 考试总结10.3 考试总结 题面下载 得分情况 悲痛爆零 时间分配(大概) 8:30 $ \ $ -- $ \ $T1第一版dp写了出来,大样例没过,开始打dfs 9:20 $ \ $ -- $ \ $T1 dfs好像过了,感觉T3更简单,想去打T3 10:10 --…

国庆集训-JDAY3

国庆集训-JDAY3T1 love思路 暴力枚举 解法 枚举天数,累加即可 归纳总结解题策略 枚举 结果 100pts 时间分配 10minT2 square思路 递推,从\(s_1\)推到\(s_n\) 解法 \(s\)每次变成\(s+n个.+s\) 归纳总结解题策略 递归/…

CSP-S 复赛指南(2025年版)

第一章 数据结构 第一节 线性结构 1.1 【5】双端栈 1.1.1 什么是双端栈? 在理解双端栈之前,我们先回顾一下普通的栈。一个普通的栈,所有元素的插入(入栈,push)和删除(出栈,pop)都只能在同一端——也就是“栈…

AI元人文系列文章:AI元人文的未来——软硬件协同

AI元人文系列文章:AI元人文的未来——软硬件协同 当算法的思考开始关乎人类社会的命运,我们需要为它构建一个既能思考也能自省的数字大脑。 引言:从软件困境到硬件曙光 在AI元人文的探索中,我们构想了一个能够理解…

10.3考试反思

今天得了130/400,问题如下: 1.不应盲目直接开始做t1,应先花10mins把所有题看一遍,确定一下大概题型,判断难易程度。 2.考试时不要浮躁,不要说话,认真做题,发挥自己的最大水平。 3.t1正解->30pts,原因是写哈…

10.2 考试总结

10.2 考试总结$ \Huge 10.2 考试总结$ 得分情况预计得分:20+20+0+0 实际得分:0+4+0+0时间分配(大概)8:20 - 9:10 把所有题都看了一遍,决定先做T1 9:10 - 9:50 打出T1第一版过小样例,去做T2(T1最接近正解的一次…

中建西部建设网站wordpress网站压缩

本文将介绍如何通过EventChannel实现Flutter与原生平台之间的双向通信。如果想了解如何通过MethodChannel实现Flutter调用Android原生平台的方法,可以参考上篇文章。 Flutter如何实现与Android底层平台通信,调用底层Android原生方法https://sgknight.blog.csdn.net/article/…

网站的注册和登录怎么做网站开发公司长春

登陆linux系统之后,使用tab自动补全快捷键的时候显示:cannot create temp file for here-document: No space left on device。 原因:磁盘满了,不能创建临时文件。 解决方法:(逐级查看占用空间过多的目录…

ハレハレヤ

夜の街迷いし秽れの乱歩 以不洁的乱步 迷失于夜晚的街道 何処から来たのよ见窄らしいね 是从何而来的呢 真是潦倒落魄啊 ねぇうちにおいで温めてあげるよ 呐 来我这吧 会给你温暖的 今までよく顽张ったよね 一直以来都…

【愚公系列】《人工智能70年》056-形形色色的机器人(前世今生) - 实践

【愚公系列】《人工智能70年》056-形形色色的机器人(前世今生) - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: …

黑龙江企业网站建设公司宣传片拍摄设备清单

一、概念 1.1 Compose优势 由一个个可以组合的Composable函数拼成界面,方便维护和复用。布局模型不允许多次测量,提升了性能。Compose可以和View互操作(相互包含对方)。 1.2 声明式UI APP展示的数据绝大多数不是静态数据而是会…

4-创建索引和约束 - 实践

4-创建索引和约束 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", &q…

双线网站选服务器我要申请开网店

操作 DDL(Data Definition Language 数据定义语言)用于操作对象和对象的属性,这种对象包括数据库本身,以及数据库对象,像:表、视图等等,DDL 对这些对象和属性的管理和定义具体表现在 create、drop 和 alter 上。 create 可以创建数据库和数据库的一些对象 drop …

Unity 单元测试框架用法 - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025十一集训——Day2做题

https://vjudge.net/contest/753101 A. vjudge CF给 a、b、d,求 x 使 \(a or x\) 与 \(b or x\) 是 d 的因数,\(a,b,d<2^{30}\),要求 \(x<2^{60}\)考虑让 \(a or x = x\),\(b or x = x\),使 x 是 d 的倍数即…

20250929给PRO-RK3566开发板在Buildroot系统下裁剪内核【已关闭摄像头ov4689为例子】 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

核聚变:Commonwealth Fusion Systems

核聚变:Commonwealth Fusion Systems 核聚变,作为模仿太阳能量产生机制的终极清洁能源梦想,长久以来面临着“永远还有三十年”的困境。如今,一家从麻省理工学院(MIT)剥离出来的公司——Commonwealth Fusion Syst…

个人可以建论坛网站吗商会网站建设招标方案

文章目录 2.1_3 奈氏准则和香农定理&#xff08;一&#xff09;失真&#xff08;二&#xff09;失真的一种现象——码间串扰&#xff08;三&#xff09;奈氏准则&#xff08;奈奎斯特定理&#xff09;&#xff08;四&#xff09;香农定理&#xff08;五&#xff09;“Nice”和“…