HIVE lateral view

yugouai

浏览: 492199 次
性别:
来自: 深圳

最近访客更多访客>>

淡定情绪

spaceandroid

fengbin2005

hundun

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Hive分享

Lateral View语法

lateralView: LATERAL VIEW udtf(expression) tableAlias AS columnAlias (',' columnAlias)*
fromClause: FROM baseTable (lateralView)*

描述

lateral view用于和split, explode等UDTF一起使用，它能够将一行数据拆成多行数据，在此基础上可以对拆分后的数据进行聚合。lateral view首先为原始表的每行调用UDTF，UTDF会把一行拆分成一或者多行，lateral view再把结果组合，产生一个支持别名表的虚拟表。

例子

假设我们有一张表pageAds，它有两列数据，第一列是pageid string，第二列是adid_list，即用逗号分隔的广告ID集合：

string pageid	Array<int> adid_list
"front_page"	[1, 2, 3]
"contact_page"	[3, 4, 5]

要统计所有广告ID在所有页面中出现的次数。

首先分拆广告ID：

SELECT pageid, adid FROM pageAds LATERAL VIEW explode(adid_list) adTable AS adid;

执行结果：

string pageid	int adid
"front_page"	1
"front_page"	2
"front_page"	3
"contact_page"	3
"contact_page"	4
"contact_page"	5

接着是一个聚合的统计：

SELECT adid, count(1) FROM pageAds LATERAL VIEW explode(adid_list) adTable AS adid GROUP BY adid;

执行结果如下：

int adid	count(1)
1	1
2	1
3	2
4	1
5	1

多个lateral view语句

一个FROM语句后可以跟多个lateral view语句，后面的lateral view语句能够引用它前面的所有表和列名。以下面的表为例：

Array<int> col1	Array<string> col2
[1,2]	["a","b","c"]
[3,4]	["d","e","f"]

SELECT myCol1, col2 FROM baseTableLATERAL VIEW explode(col1) myTable1 AS myCol1;

执行结果：

int mycol1	Array<string> col2
1	[a", "b", "c"]
2	[a", "b", "c"]
3	[d", "e", "f"]
4	[d", "e", "f"]

加上一个lateral view：

SELECT myCol1, myCol2 FROM baseTable
    LATERAL VIEW explode(col1) myTable1 AS myCol1
    LATERAL VIEW explode(col2) myTable2 AS myCol2;

执行结果：

int myCol1	string myCol2
1	"a"
1	"b"
1	"c"
2	"a"
2	"b"
2	"c"
3	"d"
3	"e"
3	"f"
4	"d"
4	"e"
4	"f"

注意上面语句中，两个lateral view按照出现的次序被执行。

分享到：

HIVE Explain | HIVE中的排序细谈

2013-04-18 23:15
浏览 3332
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

HIVE lateral view

Lateral View语法

描述

例子

多个lateral view语句

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

HIVE lateral view

Lateral View语法

描述

例子

多个lateral view语句

评论

发表评论

相关推荐

HIVE窗口及分析函数simple及说明

HIVE 窗口及分析函数 应用场景

Hive0.11.0版本新特征

HIVE GenericeUDF------row_number

HIVE MAP排序 GenericUDF

记录中的最大行max_row

再谈GenericUDAF（以collect_set源码分析）

HIVE调优的两个好用参数

Hive授权（Security配置）

Hive索引Demo

Hive索引

Hive文件存储格式的测试比较

Hive文件存储格式

hive的hive.exec.parallel参数说明

Hive决定reducer个数的标准

Hive中UDTF的编写与使用

hive udaf开发入门和运行过程详解

Hive自定义函数（generic）

Hive自定义函数（simple）

Hive锁与并发模型

最近访客更多访客>>

HIVE 窗口及分析函数应用场景