学习spark的网站地址:真心不错 https://www.cnblogs.com/qingyunzong/p/8899715.html https://www.cnblogs.com/qingyunzong/category/1202252.html 如下:
目录
一、RDD的概述
1.1 什么是RDD? 1.2 RDD的属性 1.3 WordCount粗图解RDD
二、RDD的创建方式
2.1 通过读取文件生成的 2.2 通过并行化的方式创建RDD 2.3 其他方式
三、RDD编程API
3.1 Transformation 3.2 Action 3.3 Spark WordCount代码编写 3.4 WordCount执行过程图
四、RDD的宽依赖和窄依赖
4.1 RDD依赖关系的本质内幕 4.2 依赖关系下的数据流视图