您好,登錄后才能下訂單哦!
武林中人很多都要求自己各種兵器都能夠使用,但每個人都會有一個自己最擅長的兵器。以前這四種軟件就如大數據里的“刀槍棍棒”。兵器只是一部分,重要的還是我們自身對于大數據的理解,也就相當于是內功。畢竟,雙方比武,兵器取勝的部分是很大,但不是決定因素!試想,一個內功高深的人跟一個只會使槍的人來比試,說不定對方摘葉就可以傷到那個只會使劍的人..........
好吧!我們就一一揭開這四種“武器”的面紗!
先說R,與其說是一門語言,不如說是一個軟件。他更多的應用是在數據量在中小型公司的運用。個人感覺,它也將會是國內下一門比較熱的語言。從大數據的角度來看,什么樣的數據最有價值,首當其沖的是運營商的數據,再者是銀行數據,再者是微信數據,電商數據........而這些數據對于數據所有部門來說,大都是以地市為單位來存儲的。就相當于將數據劃小成為一個個的分片,這樣有利于R的施展。在做數據挖掘及可視化的時候,我的導師說過,在國內,最好要在兩周內要讓客戶看到你數據挖掘的價值。而要達到這樣的目標,用R就會有很好的效果。特別是在數據展示方面。
而對于R的學習,是要有一定的代碼邏輯及調用規范的。因為小眾,它就要不斷的與其它的語言對接,就相當于一個說中文,一個說洋文,中間的翻譯很重要。
再來說說Python,有人說早晚運維要用到這個語言,因為它在大數據時代下,有著太多的應用場景。它基于LINUX。這就首先方便了大家的使用,他可以和任何語言又能夠互相調用接口。這就大大的便利它在大數據時代下運維人的工作。這么說牽扯到一個問題:運維人員是否要掌握一兩門開發語言?新時期的運維,將會大面積為自動化運維,變被動維護為主動防護。這樣就要求運維人員除了裝機器外,要能夠簡單的對服務器及相關網絡設備有一定的開發定制能力。
對于Python,我的學習計劃就是在R的魔鬼訓練完之后再開始學。力爭避免學的多而都不精的現像,先學精一門語言,而觸類旁通的學另一門語言。
對于SAS,這個就先放一放吧!畢竟,這個軟件是要收費的,它里邊的內置算法較多,對一些數據的相關統計效果較好。適用于一些科研機構對于大量數據的收集,統計使用。這個軟件,我以前在自己的虛擬機上裝過,運行起來很費內存。而且他的代碼,總體感覺跟C類似。大數據用它來處理是很好,但是這個軟件收費較高。依當下國內的情況,不建議初創公司使用。
最后再說一下SPSS,這一個IBM的軟件。有人說它跟SAS齊名,但這個軟件,個人感覺最好用它來得理EXCEL的數據,又或者向領導及客戶展示你的數據挖掘過程的時候演示來使用。但這個軟件具體還沒有使用過,只是見老師鏈好線,去跑數據,它對原始數據的要求較高。所以也可以結全R與SAS在處理好原始數據后,再用SPSS來走流程會更好一些。
以上,是對自己所知道的這四個軟件的理解,在大數據的領域,都會多少用到這四個軟件的。而怎么去用,取決于我們個人。
鄙人才疏學淺,若有同道中人,如有冒犯,還望不吝賜教!技術切磋,共同成長!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。