在 Amazon EMR 上运行 PySpark 报表业务 前言 关于Spark和Amazon EMR 正文 数据集 启动EMR Spark集群 PySpark编程和调试 使用Spark SQL API和DataFrame编写报表任务 使用EMR步骤功能提交PySpark任务 创建EMR一次性集群运行PySpark任务 对并表后的数据进行查询 结语