您好,登錄后才能下訂單哦!
本篇內容介紹了“hive常用sql有哪些”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
1.hive分組去重函數使用。
select *,row_num() over(partition by id order by modifytime desc) rn from lyjtest where rn=1;
row_num() over函數對id做分區根據修改時間做降序,然后篩選出時間最新的一條(rn=1)的數據,達到去重的效果。
2.hive 寫入數據
insert into table table2 select * from table1; --查詢table1中的數據寫入table2;
insert overwrite table table2 select * from table1;--覆蓋寫入
3.where和having的區別
//where是先限定性條件再分組(對原始數據過濾,where不能過濾聚合函數)
hive> select count(*),age from table1 where id>18 group by age;
//having是先分組在限定條件(對每個組進行過濾,having后只能跟select中已有的列)
hive> select age,count(*) c from table1 group by age having c>2;
//where和having一起使用
select id,count(*) from table1 where id>18 group by id having count(*)>2;
4.hive只支持union all,不支持union
union all 不去重
select name,age from table1 where id<80
union all
select name,age from table2 where age>18;
5.查詢前五條數據
select * from table1 order by age desc limit 5; --查詢年齡最大的五條數據
select * from student limit 5;--隨機查詢五條數據
6.五種子句的嚴格順序
where → group by → having → order by → limit
7.distinct
//distinct關鍵字返回唯一不同的值(返回age和id均不相同的記錄)
hive> select distinct age,id from test;
8.復制表
create table test1_temp like test1; --只復制表不包含數據
create table test1 as select * from test2; --復制表復制數據到新表9.創建表
9.創建表
CREATE TABLE `lyjtest1`( `id` double, `name` string, `sex` string) COMMENT 'create table from sql' ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' WITH SERDEPROPERTIES ( 'field.delim'='\t', 'line.delim'='\n', 'serialization.format'='\t') STORED AS INPUTFORMAT 'org.apache.hadoop.mapred.TextInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' LOCATION 'hdfs://ambari1:8020/warehouse/tablespace/managed/hive/ods_lyjtest.db/lyjtest1' ;
“hive常用sql有哪些”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。