您好,登錄后才能下訂單哦!
小編給大家分享一下hive是什么工具,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
hive是基于Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射為一張數據庫表,并提供簡單的sql查詢功能,可以將sql語句轉換為MapReduce任務進行運行,其優點是學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合數據倉庫的統計分析.
hive是建立在Hadoop上的數據倉庫基礎架構,它提供了一系列的工具,可以用來進行數據提取轉化加載(ETL),這是一種可以存儲、查詢和分析存儲在Hadoop中的大規模數據的機制。
hive定義了簡單的類SQL查詢語言,稱為HQL,它允許熟悉SQL的用戶查詢數據。同時,這個語言也允許熟悉MapReduce開發者的開發自定義的mapper和reduce來處理內建的mapper和reduce無法完成的復雜的分析工作.
hive沒有專門的數據格式,hive可以很好的工作在Thrift之上,控制分隔符,也允許用戶指定數據格式.
hive是基于hadoop的sql解析引擎.
在hive中運行的是sql.hive中的sql非常接近mysql的sql語法.
hiveQL中的數據庫、表、字段、類型與hadoop上的文件結構的對比.
數據庫----------文件夾
表--------------文件夾
表中數據-------文件夾中的數據文件
字段------------數據文件中的列
hiveQL運行-----MapReduce
hiveQL中的表信息必須映射成HDFS中的文件信息,類似于Hibernate的配置文件(*.hmb.xml)。
這些映射信息不實存放在文件中,而是存放在RDBMS(derby,mysql)中.
以上是“hive是什么工具”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。