纸上得来终觉浅
Jinxin Li的个人博客
01
03
Spark_SparkSQL Spark_SparkSQL
SparkSQL_Abstract什么是Spark SQLSpark SQL是Spark用于结构化数据(Structured Data) 处理的Spark模块 Spark SQL的底层实现方式是DataFrame API 和 DataSet
2021-01-03
03
Spark中的hive任务的stage溯源 Spark中的hive任务的stage溯源
关于一个sql,join几张表能有几个stage的问题,我使用spark on hive做了一些尝试,网上内容也不靠谱,其中也抛出了一些问题,可以思考给出建议,我也给出了源码,提供直接粘贴测试
2021-01-03 Jinxin Li
3 / 3