搜索【ApacheFlink】的结果

快手基于ApacheFlink的优化实践

流式计算主要针对unboundeddata（无界数据流）进行实时的计算，将计算结果快速的输出或者修正。这部分将分为三个小节来介绍。第一，介绍大数据系统发展史，包括初始的批处理到现在比较成熟的流计算；第二，为大家简单对比下批处理和流处理的区别；第三，介绍流式计算里面的关键问题，这是每个优秀的流式计算引擎所必须面临的问题。上图是2003年到2018年大数据系统的发展史，看看是怎么一步步走到流式计算的。2003年，Google的MapReduce横空出世，通过经典的Map&Reduce定义和系统容错等保障来方便处理各种大数据。很快就到了Hadoop，被认为是开源版的MapReduce，带动了整个ap

2021-02-24 09:09:11 448KB 快手基于ApacheFlink的优化实践

ApacheFlink：特性、概念、组件栈、架构及原理分析

ApacheFlink是一个面向分布式数据流处理和批量数据处理的开源计算平台，它能够基于同一个Flink运行时（FlinkRuntime），提供支持流处理和批处理两种类型应用的功能。现有的开源计算方案，会把流处理和批处理作为两种不同的应用类型，因为他们它们所提供的SLA是完全不相同的：流处理一般需要支持低延迟、Exactly-once保证，而批处理需要支持高吞吐、高效处理，所以在实现的时候通常是分别给出两套实现方法，或者通过一个独立的开源框架来实现其中每一种处理方案。例如，实现批处理的开源方案有MapReduce、Tez、Crunch、Spark，实现流处理的开源方案有Samza、Stor

2021-01-29 23:09:40 691KB ApacheFlink：特性、概念、组件栈、架构及原理分析

个人信息

热门下载

最新下载

其他资源