窗口函数对点击流处理,和类似的时间序列/滑动窗分析很有用。最近在做时间序列分析,希望趁这个机会对窗口函数有进一步深入的了解。
Lead & Lag Lead 和Lag是金融方面的术语,意思是提前和延期。
按照时间段统计时,有些时间段没有对应数据,造成这个时间段不出现在SQL统计的结果中,但是我们又需要这些行,怎么解决? 调研了一些方案:Generate a set or sequence without loops – part 1
参考
https://issues.apache.org/jira/browse/HIVE-896LanguageManual WindowingAndAnalytics