您好,登錄后才能下訂單哦!
本篇文章為大家展示了如何分析數據可視化,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
我們現在生活的每一秒都在產生著數據,比如你現在看這篇文章的時候。用的什么手機,型號,你所在地點,點開這篇文章的時間,花了多久看的文章……都是被收集的數據。
當同類的數據集合在一起,甚至于縱向的其他數據展開聯系時,都可以成為大數據。取決于是誰用這些數據,以及使用目的,大數據沒有嚴格意義上的類型界定。但是當你有了龐大的數據后,如何最直接的反應數據情況?如何以最快的速度發現需要進一步分析的數據?做了一系列分析得出結果后,如何如何簡單快速的說服你的讀者或者領導?
我們本身可能就是大數據的生產者。也會是使用者。
其實大數據是一個很空洞的概念,具體的意義針對不同的人有不同的含義。大數據的基本流程鏈包括:數據挖掘,數據清理,數據存儲,數據分析,數據展示。
數據可視化就是這樣一種,貫穿數據分析整個時期,在前期助數據分析人員通過迅速呈現整體數據,發現可能的問題點,后期通過可視化,后期將數據分析結果更快速的呈現在讀者面前。數據可視化可以通過使用圖形、圖標、色彩變化等各種組合對數據進行解讀,從而使人們快速理解一組或多組數據中的復雜關系。通過數據可視化,人們可以從中辨別出趨勢,固定模式,發現特定問題,甚至可以為決策提供依據。
拿最近新冠的例子來說,你一定很熟悉下面的這些圖了:
第一第二張圖就是數據可視化的例子。折線圖和地圖很直觀的將第三張圖的新冠肺炎每日新增人數,以及分布,很直觀的用圖像表現出來,而省去讀者對第三張圖標具體數字的解讀和處理。當讀者需要進一步了解圖形背后的具體數字時,讀者可以去第三張圖標進行研讀。而這僅僅是最簡單的例子。
通過上面的例子,如果說大數據可以幫助我們找到規律和趨勢,那數據可視化是一種將數據直觀呈現出來的方式。數據可視化貫穿數據清理,數據整合的一個步驟。比如說你是一名銷售人員要向上一級匯報銷售成果。你涉及的數據可能包括客戶姓名,客戶地址,購買產品,購買型號,購買數量,購買日期,購買單號,發貨時間,發貨方式,銷售金額,折扣數目,利潤率……你應該從何種角度下手處理你的數據,你得出需要加強某個產品的宣傳的結論時,覺得你的領導是更愿意直觀的了解到結果,還是愿意花15分鐘一頁一頁研讀你的分析?
美國民眾對新冠病毒看法的變化,用圖像的形式比用電子表格或者文字的形式,更加具體直接。(圖源:538)
所以數據可視化可以簡化人腦處理信息,并得到結論的一種有效手段。我們人腦更容易通過圖像等視覺上的呈現來得出一定的結論。就算一些分析人員可以通過復雜的演算,模型設計得出某些結論,但這些結論遠遠沒有比直接用圖形來總結來的更直觀。
拿個最簡單的例子來說,北京上海的地鐵公交圖就可以稱為一種數據可視化。縱橫交錯的軌道交通,不同的線路站點,相交的換乘點,如果通過文字或者表格來呈現遠遠不及軌交地圖來的直觀明了
既然連軌交地圖都是數據可視化的一種,那你可以放開了聯想,其實生活中很多方面,我們都涉及數據可視化。
數據可視化很容易和數據分析相混淆,誠然兩者有相似之處——數據可視化和數據分析都是在可視界面中展示數據。
多組可視化合在一起時,可以展示更多的信息甚至可以講述一個完整時間(圖源:Center for Data Innovation)
是兩者還有很多方面有不同。數據分析是一個探索性的過程。因為很多數據分析人員拿到數據后,通常有一個特定問題需要去發現,圍繞著這個問題,要進行不同測試,需要足夠的耐心才能發現使用某個手段,集中分析某些數據,才能體現出某些關系,并且回答最初的問題。而數據可視化是數據分析中的一部分,前期后期都可以通過數據可視化,做到更有效的數據分析,以及更清楚的呈現最終分析結果。大致概括如下:
使用目的不同。數據分析可以發現某些潛在的模型,或者趨勢,可以幫助預測某些將來發生的事件。數據分析所使用的前期或后期的數據,可以作為數據可視化的數據源。而數據可視化能夠更直觀的呈現某一局部特征,更明確的展現出某個變量的影響,前期是幫助數據分析人員了解大體數據情況,發現異常值。后期通過可是后分析的數據,更好的展現分析結果。
兩者之間關系不同。數據分析是將分析和可視化相結合,去找出某些結論。有時候,數據分析是數據可視化的前端,數據可視化呈現的就是數據分析的結果。
使用工具不同。數據分析一般通過規范分析(prescriptive analytics)和預測分析(predictive analytics),診斷分析(diagnostic analytics)。數據分析所使用的工具有Excel ,hive, Ploybase,SAP Business Intelligence,Presto, Trifacta,Clear Analytics,等等。而數據可視化可以是靜態展示也可以是互動展示數據,所使用的工具有:Plotly,DataHero,Tableau,QlikView,ZingCHhart 等等
數據可視化有很多用途,每種類型的數據可視化可以有不同的用途。這里就說一下數據可視化的最常見的情況。
時間變化。使用時間變化展現另一個變量的變化的形式是最基本和最常見的方法。但是請注意,這并不代表這樣的可視化沒有價值。這種類型的數據可視化之所以常見,是因為大多數的數據都涉及到時間因素。因此,許多數據分析的第一步就是查看數據是如何隨著時間變化而變化的。
確定頻率。確定頻率也是數據可視化的基本用途之一。因為他也適用于設計涉及時間的數據。如果涉及時間的話,除了檢查數據如何隨時間變化,還要查看在某一單位時間內,相關事件隨時間發生的頻率是否合乎邏輯。
確定數據之間的關系(關聯)。識別數據之間的關聯是數據可視化非常有價值的用途之一。了解數據中的關系非常重要,但是如果沒有可視化,就很難確定兩個變量之間的關系了。
檢查整個數據。在市場研究中,經常可以使用數據可視化檢查數據整體的例子。因為市場和銷售人員需要知道他們的消息針對于何種群體,因此他們需要分析整個市場的受眾群體,以及群體中的集群與集群之間的關聯,集群中有影響力的人以及異常值。
時間規劃。在做一項非常復雜的項目或者計劃表的時候,通常涉及不同部門,不同人員,不同項目細節,會讓人非常困惑。甘特圖(Gantt Chart) 可以通過清楚說明項目中的每個任務,以及所需完成的時間來解決這個問題。
分析價值和確定風險。由于分析價值和風險這類指標有很多相關因素,要考慮很多不同的變量,那么使用各種變量的普通電子表格,很難準確有效的一眼將價值和風險看出。數據可視化可以像對公式進行顏色編碼一樣,以顯示哪些機會有價值,哪些機會有風險。
可視化圖類型有多種多樣,這里我列舉了大多數市面上能見到的可視化類型圖。
折線圖 (Line chart)
面積圖 (Area chart)
條形圖(Bar chart)
直方圖(Histogram)
值得注意的是條形圖和直方圖是有區別的。條形圖的寬度表示類別且固定,長度表示頻數。直方圖用“面積”表示各組頻數,舉行高度表示每一組的頻數,寬度表示組距,因此高度與寬度均有意義。直方圖為X軸為連續數列,且連續排列。條形圖X軸為分類數據,分開排列。
散點圖(Scatterplot)
箱型圖(Box Plot)
氣泡圖(bubble chart)
餅圖(Pie chart)
量規圖(gauge)
地圖(Maps)
此處特別推薦哈佛大學地理分析中心(Center for Geographic Analysis - Harvard University)
https://gis.harvard.edu/researchhttp://worldmap.harvard.edu/africamap/
以及哈佛大學做的非洲地圖:
http://worldmap.harvard.edu/africamap/ 這張互動地圖包括了經濟,宗教,社會,人口,歷史,交通等方方面面。
熱圖(Heat map)
這就有很多種了。這里就放一個我曾使用過的眼動儀(eye tracking)所產生的熱圖
框架圖(Frame diagram)
瀑布圖 (Waterfall chart)
漏斗圖(Funnel chart)
雷達圖或蜘蛛圖(Radar or Spider Chart)
這些就是市面上你可以見到的數據可視化圖形。當然還有其它形式的,以及圖形與圖形之間的疊加組合,比如折線圖與直方圖的組合等等,我就不一一列舉了。
因此數據可視化并非那么神秘,我們常用的EXCEL就可以做出上述可視化圖形中的好幾種。除了Excel,Tableau可以創建其中絕大部分的數據可視化,而且通過使用其中的Dashboard可以創建互動式的數據可視化,story功能實現圖組創建故事講述功能。最最重要的是Tableau提供免費版本,使用Tableau的一切功能。免費版本和付費版本的區別在于保存,付費版本可以保存在本地,而免費版本可以上傳到Tableau的公共資源網上,和別人分享你所創建的數據可視化,同時還能查看別人創建的各種出色的可視化。
上述內容就是如何分析數據可視化,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。