大数据Flink进阶(三):Flink核心特性
Flink具有先进的架构理念,拥有诸多的优秀特性以及完善的编程接口,Flink的优势有以下几点:
Flink具有先进的架构理念,拥有诸多的优秀特性以及完善的编程接口,Flink的优势有以下几点:
(资料图片)
Flink可以在底层用同样的数据抽象和计算模型来进行批处理和流处理。事实上,Flink在设计理念上没有刻意强调批处理和流处理,而更多的强调数据的有界和无界,这就意味着Flink能够满足企业业务需求,无需用两种甚至多种框架分别实现批处理和流处理,这大大降低了架构设计、开发、运维的复杂度,可以节省大量的人力成本。
Flink是目前开源社区中唯一一套集高吞吐、低延迟、高性能三者于一身的分布式流式数据处理框架。像Apache Spark也只能兼顾高吞吐和高性能特性,主要因为在SparkStreaming流式计算中无
法做到低延迟保障;而流式计算框架Apache Storm只能支持低延迟和高性能特性,但是无法满足高吞吐的要求。而满足高吞吐、低延迟、高性能这三个目标对分布式流式计算框架来说是非常重要的。
在流式计算领域中,窗口计算的地位举足轻重,但目前大多数框架窗口计算采用的都是系统时间(Process Time),也是事件传输到计算框架处理时,系统主机的当前时间。Flink能够支持基于事件时间(Event Time)语义进行窗口计算,也就是使用事件产生的时间,这种基于事件驱动的机制使得事件即使乱序到达,流系统也能够计算出精确的结果,保持了事件原本产生时的时序性,尽可能避免网络传输或硬件系统的影响。
Flink在1.4版本中实现了状态管理,所谓状态就是在流式计算过程中将算子的中间结果数据保存在内存或者文件系统中,等下一个事件进入算子后可以从之前的状态中获取中间结果中计算当前的结果, 从而无须每次都基于全部的原始数据来统计结果,这种方式极大地提升了系统的性能,并降低了数据计算过程的资源消耗。对于数据量大且运算逻辑非常复杂的流式计算场景,有状态计算发挥了非常重要的作用。
在流处理应用中,数据是连续不断的,需要通过窗口的方式对流数据进行一定范围的聚合计算,例如统计在过去的1分钟内有多少用户点击某一网页,在这种情况下,我们必须定义一个窗口,用来收集最近一分钟内的数据,并对这个窗口内的数据进行再计算。Flink将窗口划分为基于Time、Count、Session,以及Data-driven等类型的窗口操作,窗口可以用灵活的触发条件定制化来达到对复杂的流传输模式的支持,用户可以定义不同的窗口触发机制来满足不同的需求。
Flink能够分布式运行在上千个节点上,将一个大型计算任务的流程拆解成小的计算过程,然后将task分布到并行节点上进行处理。在任务执行过程中,能够自动发现事件处理过程中的错误而导致数据不一致的问题,比如:节点宕机、网路传输问题,或是由于用户因为升级或修复问题而导致计算服务重启等。在这些情况下,通过基于分布式快照技术的Checkpoints,将执行过程中的状态信息进行持久化存储,一旦任务出现异常停止,Flink就能够从Checkpoints中进行任务的自动恢复,以确保数据在处理过程中的一致性(Exactly-Once)。
内存管理是所有计算框架需要重点考虑的部分,尤其对于计算量比较大的计算场景,数据在内存中该如何进行管理显得至关重要。针对内存管理,Flink实现了自身管理内存的机制,尽可能减少JVM GC 对系统的影响。另外,Flink通过序列化/反序列化方法将所有的数据对象转换成二进制在内存中存储,降低数据存储的大小的同时,能够更加有效地对内存空间进行利用,降低GC带来的性能下降或任务异常的风险,因此Flink较其他分布式处理的框架会显得更加稳定,不会因为JVM GC等问题而影响整个应用的运行。
对于7*24小时运行的流式应用,数据源源不断地接入,在一段时间内应用的终止有可能导致数据的丢失或者计算结果的不准确,例如进行集群版本的升级、停机运维操作等操作。值得一提的是, Flink通过Save Points技术将任务执行的快照保存在存储介质上,当任务重启的时候可以直接从事先保存的Save Points恢复原有的计算状态,使得任务继续按照停机之前的状态运行,Save Points技术可以让用户更好地管理和运维实时流式应用。
Flink为用户提供了多个层级API,用户可以根据自身对于表达力和易用性的需求来选择,不同的API 层级可以混用以实现复杂的业务逻辑。
关键词:
Flink具有先进的架构理念,拥有诸多的优秀特性以及完善的编程接口,Flink的优势有以下几点:
1、发汗解表是中医的疗法。2、发汗、呕吐、泻下、调和、温、清、消、补是治病的八法。3、发汗是用来缓解出汗的。4、是用来治
1、人类红绿色盲的遗传方式是X染色体上的隐性遗传,色盲是遗传病。2、色盲有很多种,最常见的是红绿色盲,即患者分不清红色和
大将风范!湖人喜得球队基石,浓眉哈姆隔阂解开,詹姆斯应该留下,浓眉,湖人,美国足球,米娅·哈姆,勒布朗詹姆斯,国际篮球赛事,国际足球赛事,安
一、题文【发表观点】有人说:“生活需要诚信,不需要善意的谎言。”还有人说:“生活需要善意的谎言。”对这个问题,你怎么看?
1、《英国陶工》是由罗伯特·弗拉哈迪执导拍摄的一部纪录片。本文关于英国陶工的简介就讲解完毕,希望对大家有所帮助。
2023年3月17日上午,伴随现场总指挥的一声令下,最后一节拱肋节段平稳而精准的安装就位,中交二公局承建的渝湘复线高速公
财政部17日公布的2023年1-2月财政收支情况显示,1-2月累计,全国一般公共预算收入45642亿元,同比下降1 2%;全国一般公共预算支出40898亿元,
王若琳柠檬树,王若琳夜来香这个很多人还不知道,现在让我们一起来看看吧!1、能唱出大上海舞厅感觉的是周旋吧!晕邓丽君的应
鉴于以上人员的行为涉嫌刑事犯罪被公安和检查机关处理,因此公司宣布永远终止与姜广涛、宋明、王雪、宋扬的合作关系。据悉,姜广涛毕业于北京
注:1、扭曲慎入2、角色死亡注意3、先天疾病注意如果可以接受那就开始吧真昼有严重的慢性胃炎,因为在圣翔作息比较规律,一年内没有复发。本来
此前《图片报》曾报道,图赫尔前妻收到一封写有图赫尔被切尔西解雇的真实原因的邮件,图赫尔希望通过临时禁令来禁止邮件的传播。根据《图片报
1、东南亚集团是长期专注于办公、文教领域。2、本公司倡导“专业、务实、高效、创新”的企业精神,具有良好的内部机制。3、优
1、建议LZ去下正版KOF系列游戏,或者可以自己弄个MUGEN程序,自己加人物玩。2、另会分身的女的应该是神乐千鹤。
1、打开手机的设置,然后单击辅助功能。2、点击上方智慧多窗口。3、点按以打开智能多窗口应用程序栏。4、拉出多窗口应用程序
以下是创业黑马在北京时间3月17日10:23分盘口异动快照:3月17日,创业黑马盘中涨幅达5%,截至10点23分,报20 76元,成交1 42亿元,换手率5 14%
3月16日,统联精密(688210)融资买入639 13万元,融资偿还248 37万元,融资净买入390 76万元,融资余额6237 25万元,近3个交易日已连续净买入
【口舌之勇】“君子爱财,取之有道。”这原本是一个基本的常识,也是逐利者的底线。可是,却有无数人在这个问题上犯迷糊、摔跟斗
1、DIY手账手账源自于日本,最初是用于日常备忘录和生活规划,传入国内后越来越为年轻人所熟悉和追捧,并且功能逐渐拓展,不
文:懂车帝原创高帅鹏[懂车帝原创产品]3月16日,我们从福特中国进口车获悉,福特F-150猛禽(F-150Raptor)烈焰风暴特别版将于4月10日开启