您好,登錄后才能下訂單哦!
兩年的時間,大數據像雨后的野草一樣,頑強的長滿了草原。不管是互聯網的、金融的、醫療的、汽車的,好像不提大數據,就像是落伍了一樣的。
近期筆者所在團隊給某部位的研究院做了大數據的一個可行***規劃,有些事,正好與各位做一個分享。
大數據,顧名思義,數據量特別大,按照定義來說,就是數據量特別大,無法用傳統的手段解決。所謂傳統的手段,也就是業界內注明的IOE,即,高性能服務器+專用存儲設備+數據庫設備。其實,大數據這個詞雖然是近些年才火起來,但是大數據一直存在,不過是由于互聯網、移動互聯網的飛速發展,導致近些年的增長速度越來越快。同時互聯網的迅速發展,也使得國外的Google、FaceBook,國內的BAT對數據進行深層次價值挖掘,進一步促進其發展。
大數據在互聯網內的發展迅猛,使得各個國家紛紛出手,美國發布政府公共大數據計劃之后,歐盟、中國等也均投入這一戰斗當中。在我國,政府的大數據公開計劃剛開始,各部委下屬的研究院所,各大央企也都開始發聲自己已經、正在、馬上開展大數據項目。可是,對于大數據項目,政府、企事業單位的信息化人員們,你們做好準備了嗎?下面從幾個角度給大家提一些建議。
數據源是一切的基礎
其實,不管大數據、小數據,效果在于價值,起點在于數據,如果沒有合適的數據來源,或者數據來源還使用的傳統的紙質文檔管理,那么,大數據對你是沒有價值的,你需要做的第一步是如何用信息化手段,量化企業的數據。數據的信息化,是一切的基礎。沒有一個堅實的數據源,一切都是妄談。
2.業務的目標是數據價值的方向
這點在很多的文章里都提過,不過很多都是希望你根據業務目標,分解業務場景,然后再進行數據建模等等。這里想說的,業務的目標很重要,但是你不能指望企業領導或者業務人員,既告訴你想吃烤雞翅膀,又得告訴你烤雞翅膀怎么做。很多時候,引你進門之后,剩下的是數據分析人員需要做的事情,包括業務目標的分解,包括數據源的選擇,包括數據采集方式的確定,包括數據模型的建立。用戶需要做的事情是,確認你做的結果和他的要求差距有多大。
3.技術方案的選擇同樣很重要
對于用戶來說,技術方案就像無字天書,看著都很高大上,但是作為一個技術人員或者數據分析供應商,你需要考慮的問題不知高大上,還有落地。中國目前國企范圍內的大數據項目成功的幾率低的讓人可憐。究其原因,技術方案的不可落地,在做技術方案的時候,你是否科學的估算了數據量?在計算量不可估算的情況你會如何處理?你是否選擇虛擬化作為集群服務器的管理層?實體物理服務器如何管理?計算內容是批處理多一些還是流計算多一些?業務可能會需要哪些算法作為支撐?筆者前期做大數據項目時,遇到的一個難題是,選擇虛擬化架構的集群還是選擇物理服務器的集群?二者到底有多大的區別。
4.數據的運營是在項目之初應該預見的
很多時候,做一個大數據項目,不只是要一個分析結果,更多的是要做一個數據運營,因為用戶的數據更多的是未來的數據,如何讓你的大數據項目能夠適應用戶未來的發展,是在大數據項目之初就應該預見的,也是在規劃過程中需要給用戶做出足夠的設計的。如果不考慮數據未來如何來,如何采集,如何用,如何發揮價值,分析后的結果如何支撐用戶的大數據項目,用戶的大數據也只能局限在一年、兩年......真正的大數據雖然不能像永動機,但是好歹也應該是風車,只要有風,就能轉下去。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。