您好,登錄后才能下訂單哦!
本篇內容主要講解“常用的開源數據分析應用軟件有哪些”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“常用的開源數據分析應用軟件有哪些”吧!
談到開源數據分析技術,就不可能不提到Hadoop。Apache基金會的這個項目已經幾乎成為大數據的同義詞,它讓企業能夠大規模分布式處理極其龐大的數據集。TDWI和SAS聯合開展的一項調查發現,近60%的企業預計在2016年年底之前會在生產環境中擁有Hadoop集群。
然而值得一提的是,Hadoop本身無法實現數據分析。它通常是從大數據獲取洞察力的整個更龐大解決方案的一部分。
Spark也是Apache旗下的一個項目,它承諾可以迅速處理大數據。實際上,它聲稱“在內存中運行程序的速度比Hadoop MapReduce快100倍,在磁盤上運行程度的速度快10倍。”由于這種出色性能,它常常用于分析流式數據或用于需要交互式分析功能的應用軟件中。許多公司經常把它與Hadoop或Mesos一起使用,不過它也能獨立運行。最近,它的人氣得到了急劇提升,Syncsort在2016年開展的一項調查發現,受訪的企業大數據工作人員中近70%對Spark有興趣。
不像前面兩個項目,Talend由一家營利公司管理,而不是由基金會管理。因而,提供收費支付服務。Talend既提供免費產品,又提供收費產品。它免費的開源解決方案名為Talend Open Studio,下載量已超過了200萬人次。
市場研究公司Gartner最近將Talend評為數據集成領域的“領導者”。這家公司聲稱,相比與之競爭的解決方案,它幫助企業分析大數據的速度快五倍,而成本卻只有五分之一。
與Talend一樣,Jaspersoft也有多個版本,有的版本免費,有的版本收費。社區版是免費、開源的,而Reporting版、AWS版、專業版和企業版需要收費,不過隨帶支持服務。
Jaspersoft是一款開源商業智能工具,旨在讓企業用戶可以借助自助服務,滿足自己的要求。該公司聲稱,它的技術支持130000多款應用軟件,提供嵌入式商業智能功能。
Pentaho自詡為“全面的數據集成和商業智能平臺。”該公司主要大力推銷它的商業版軟件,該軟件基于開源社區版。許多公司將它與Hadoop和Spark之類的工具一起使用,以便能夠報告和顯示大數據。該軟件聲稱擁有一大批的知名客戶,包括英國電信(BT)、卡特皮勒、納斯達克、美國國土安全部、美國國家海洋和大氣局(NOAA)、《紐約時報》、EMC及其他許多企業組織。
RapidMiner聲稱是“頭號開源數據科學平臺”,Gartner將它評為高級分析魔力象限報告中的領導者。它能夠實現自助式預測分析,承諾有望提升速度飛快的性能。用戶包括寶馬、漢莎航空、達美樂比薩公司、索尼、福特、Salesforce、國際特赦組織和通用電氣公司。整個RadiMiner平臺包括三個獨立的組件:RapidMiner Studio、RapidMiner Server和RapidMiner Radoop。這三個組件都采用開源許可證或商業許可證,商業版價格取決于用戶數量。
Apache Storm被雅虎、推特、Spotify、Yelp、Flipboard和Groupon之類的公司所使用,它是一種實時大數據處理引擎。它的官方網站解釋:“Storm讓用戶很容易可靠地處理無限制的數據流,它在實時處理方面的功能好比Hadoop在批處理方面的功能。”客戶可以將它與任何數據庫或任何編程語言一起使用。它具有可擴展、容錯、易于部分使用的優點。然而用戶要注意的是,Storm還沒有進入到1.0版本這個階段。
H2O被60000多個數據科學家和7000多家企業組織所使用,聲稱是“世界上領先的開源機器學習平臺。”由于它的內存技術,它提供了極其出色的性能。它還與Hadoop和Spark之類的其他許多開源數據分析工具整合起來,支持所有主要的流行數據庫,提供收費的支持服務。
除了標準版的H2O外,該公司還提供Sparkling Water,這個版本整合了Spark和Steam,后者是一種端到端人工智能應用引擎。
9. Lumif3y
Lumify由一家名為Altamira 科技的公司開發,自稱是“開源大數據分析和可視化平臺。”它讓用戶易于創建二維或三維圖形,可顯示實體之間的關系,或在地圖上覆蓋數據。對于有興趣深入了解它的工作原理的那些人來說,官方網站提供了幾個視頻,顯示了Lumify的實際運行,上面還有一個演示網站,讓用戶可以上傳自己的數據,并試用軟件。
Apache Dril讓用戶得以使用SQL查詢用于非關系型數據存儲系統。它支持一系列NoSQL和基于云的數據存儲系統,包括HBase、MongoDB、MapR-DB、HDFS、MapR-FS、亞馬遜S3、Azure Blob Storage、谷歌云存儲和Swift。它還讓用戶可以使用單一查詢,即可搜索用不同技術存儲起來的多個數據集。此外,它支持許多流行的商業智能工具。
作為最知名的NoSQL數據庫之一,MongoDB是一種開源非關系型數據存儲解決方案。客戶包括大都會人壽(MetLife)、芝加哥市、Expedia、谷歌、氣象頻道、BuzzFeed和Facebook。除了免費開源版外,該公司還提供一款收費的企業版和云托管的版本MongoDB Atlas。知名市場研究機構弗雷斯特研究公司將MongoDB評為大數據NoSQL領域的“領導者”。
SpagoBI是一款開源商業智能和大數據分析平臺。該軟件完全免費,但還提供收費的用戶支持、維護、咨詢和培訓等服務。它包括了用于報告、多維分析(OLAP)、圖表、位置情報、數據挖掘、ETL(抽取轉換和加載)及更多其他方面的工具。它還與流行的內存處理引擎整合起來,能夠實現實時處理。
到此,相信大家對“常用的開源數據分析應用軟件有哪些”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。