Spark 2.2.1 + Hive 案例之不使用现有的Hive环境；使用现有的Hive数据仓库；UDF自定义函数

xiaoxiao2021-02-28 111

Spark 2.2.1 Hive 案例之不使用现有的Hive环境；使用现有的Hive数据仓库；UDF自定义函数

Spark SQL支持读写存储在Apache Hive中的数据。在Spark 2.2.1中，不需要显式地创建SparkContext、SQLContext、HiveContext实例，其已经封装在SparkSession中。 Spark 2.2.1中的

段智华认证博客专家 Spark AI 企业级AI技术本人从事大数据人工智能开发和运维工作十余年，码龄5年，深入研究Spark源码，参与王家林大咖主编出版Spark+AI系列图书5本，清华大学出版社最新出版2本新书《Spark大数据商业实战三部曲：内核解密|商业案例|性能调优》第二版、《企业级AI技术内幕：深度学习框架开发+机器学习案例实战+Alluxio解密》，《企业级AI技术内幕》新书分为盘古人工智能框架开发专题篇、机器学习案例实战篇、分布式内存管理系统Alluxio解密篇。Spark新书第二版以数据智能为灵魂，包括内核解密篇，商业案例篇，性能调优篇和Spark+AI解密篇。从2015年开始撰写博文，累计原创1059篇，博客阅读量达155万次

转载请注明原文地址: https://www.6miu.com/read-2628589.html

技术

最新回复(0)