关于hive中join的一些优化事项

xiaoxiao2021-02-28  92

JOIN 原则 :

在使用写有 Join 操作的查询语句时有一条原则:

应该将条目少的表/子查询放在 Join 操作符的左边 

原因是在 Join 操作的 Reduce 阶段,位于 Join 操作符左边的表的内容会被加载进内存,将条目少的表放在左边,

可以有效减少发生 OOM 错误的几率 。

Map Join Join 操作在 Map 阶段完成,不再需要Reduce,前提条件是需要的数据在 Map 的过程中可以访问到.

转载请注明原文地址: https://www.6miu.com/read-28071.html

最新回复(0)