纸上得来终觉浅
Jinxin Li的个人博客
01
03
Spark_SparkSQL Spark_SparkSQL
SparkSQL_Abstract什么是Spark SQLSpark SQL是Spark用于结构化数据(Structured Data) 处理的Spark模块 Spark SQL的底层实现方式是DataFrame API 和 DataSet
2021-01-03
03
Spark中的hive任务的stage溯源 Spark中的hive任务的stage溯源
关于一个sql,join几张表能有几个stage的问题,我使用spark on hive做了一些尝试,网上内容也不靠谱,其中也抛出了一些问题,可以思考给出建议,我也给出了源码,提供直接粘贴测试
2021-01-03 Jinxin Li
12
28
Jetbrains系列产品重置试用方法 Jetbrains系列产品重置试用方法
0x0. 项目背景Jetbrains家的产品有一个很良心的地方,他会允许你试用30天(这个数字写死在代码里了)以评估是否你真的需要为它而付费。但很多时候会出现一种情况:IDE并不能按照我们实际的试用时间来计算。我举个例子:如果我们开始了试用
2020-12-28
11
23
Hbase的学习笔记(中间板) Hbase的学习笔记(中间板)
1. HBase1.1定义分布式的Mysql数据库 NoSQL关系型数据库 多维数据库 列族 列族不是越多越好 Column Family 列族分文件夹 Row Key –> 主键 根据列切分成store 行切分成region(一个r
2020-11-23 Jinxin Li
10
27
09
24
ElasticSearch的学习总结(包含API) ElasticSearch的学习总结(包含API)
ElasticSearch_总结1.lucenelucene,就是一个jar包,里面包含了封装好的各种建立倒排索引,以及进行搜索的代码,包括各种算法。我们就用java开发的时候,引入lucene jar,然后基于lucene的api进行去进
2020-09-24 Jinxin Li
3 / 9