Spark RDD 编程从驱动程序到共享变量、Shuffle 与持久化
1. Spark 应用的基本形态
Driver(驱动程序):运行你的 main 函数,负责构建 DAG、提交任务、汇总结果。
Executors(执行器):分布在集群各节点,执行并行任务。
RDD(Resilient Distributed Datasetÿ
