一种SparkBroadcasthashjoin操作的改进方法与流程

文档序号:11251015阅读:来源:国知局

技术特征:

技术总结
本发明公开了一种Spark Broadcasthashjoin操作的改进方法,该方法包括:获取小表,并获取小表中key值被大表查找的先验概率;依据先验概率对小表中的key从大到小进行排序,得到一个新的有序表;利用所述新的有序表构建哈希表,将哈希表广播到各个节点;在各个节点获取大表内容,将大表内容与哈希表中的匹配项进行连接。该方法实现提高查找效率,进而提高join的连接效率。

技术研发人员:曹芳
受保护的技术使用者:郑州云海信息技术有限公司
技术研发日:2017.05.15
技术公布日:2017.09.15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1