1.为什么需要Window?在流处理应用程序中,数据是连续的。有时候我们需要做一些聚合处理,比如:过去1分钟有多少用户点击了我们的网页。在这种情况下,我们必须定义一个窗口(window)来收集最近1分钟内的数据,并计算这个窗口内的数据。2.Window的分类2.1time-window按时间和计数分类:timeWindow:按时间划分窗口,如:每隔xx分钟统计最近xx分钟的数据count-window:Quantitywindow:划分window按照数量,比如:每xx条数据统计最新的xx条数据两个重要的属性:windowsize和滑动间隔slide,按照它们的大小关系可以分为:tumbling-window:rollingwindow:size=slide,比如as:每10s统计最近10s的数据sliding-window:slidingwindow:size>slide,例如:每5s统计最近10s的数据注意:当size
