您好,登錄后才能下訂單哦!
本篇內容介紹了“Presto有哪些特征”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
Presto 旨在與現有數據生態系統無縫集成,無需對正在進行的系統進行任何修改。這就像使用額外的更快的數據訪問接口為您現有的堆棧增壓。
Presto 提供額外的計算層以加快分析速度。它不存儲數據,這使它具有能夠根據需求向上和向下擴展查詢資源的巨大優勢。
這種計算和存儲分離使 Presto 查詢引擎非常適合云環境。大多數云部署利用對象存儲,它已經從計算層中分離出來,并自動擴展以優化資源成本。
SQL 是迄今為止最古老、使用最廣泛的數據分析語言。分析師、數據工程師和數據科學家使用 SQL 來探索數據、構建儀表板并通過 Jupyter 和 Zeppelin 等筆記本或 Tableau、PowerBI 和 Looker 等 BI 工具來測試假設。
Presto 是一個聯合查詢引擎,它不僅能夠從分布式文件系統中查詢數據,還能夠從其他來源查詢數據,例如 Cassandra、Elasticsearch 和 RDBMS 等 NoSQL 存儲,甚至是 Kafka 等消息隊列。
Facebook 團隊開發 Presto 是因為 Apache Hive 不適合交互式查詢。Hive 的下劃線架構通過執行多個 MapReduce 和 Tez 作業來執行查詢,非常適合大型復雜作業,但不適用于低延遲查詢。Hive 項目最近使用 Hive LLAP 引入了內存緩存;然而,它適用于某些類型的查詢,但它也使 Hive 更加資源密集。
同樣,Apache Spark 非常適合使用內存計算的大型復雜作業。但是,它不如 Presto 交互式 BI 查詢有效。
Presto 專為高性能而打造,具有多項關鍵功能和優化,例如代碼生成、內存中處理和流水線執行。Presto 查詢在工作節點上共享一個長期存在的 Java 虛擬機 (JVM) 進程,從而避免了產生新 JVM 容器的開銷。
Presto 提供了一個統一的 SQL 方言,可以抽象出所有支持的數據源。這是一項強大的功能,用戶無需了解底層系統的連接和 SQL 方言。
Presto 將存儲和計算分開運行的基本設計使其在云環境中操作極其方便。由于 Presto 集群不存儲任何數據,因此可以根據負載自動擴展,而不會造成任何數據丟失。
如您所見,Presto 為交互式即席查詢提供了許多優勢。難怪數據平臺團隊越來越多地使用 Presto 作為事實上的 SQL 查詢引擎,在不需要移動數據的情況下跨數據源運行分析。
“Presto有哪些特征”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。