1. 程式人生 > >hive常用的一些函式

hive常用的一些函式

1.分組後查詢前幾列資料

row_number() over (partition by p_day,uid order by time asc) num

num = 1 取第一個,num<=10取分割槽後前十個

2.lag/lead 某一行前/後附近一行的資料

lag(url,1,2001) over (partition by uid order by time) url_1

url這一列2001這一行前一列資料