您好,登錄后才能下訂單哦!
本篇內容介紹了“大數據對科學研究的影響有哪些”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
著名數據庫專家吉姆·格雷(Jim Gray)博士觀察并總結認為,人類自古以來在科學研究上先后歷經了實驗、理論、計算和數據四種范式,具體如下:
(1)第一種范式:實驗
在最初的科學研究階段,人類采用實驗來解決一些科學問題,著名的比薩斜塔實驗就是一個典型實例。1590年,伽利略在比薩斜塔上做了“兩個鐵球同時落地”的實驗,得出了重量不同的兩個鐵球同時下落的結論,從此推翻了亞里士多德“物體下落速度和重量成比例”的學說,糾正了這個持續了1 900年之久的錯誤結論。
(2)第二種范式:理論
隨著科學的進步,人類開始采用各種數學、幾何、物理等理論,構建問題模型和解決方案。比如牛頓第一定律、牛頓第二定律、牛頓第三定律構成了牛頓力學的完整體系,奠定了經典力學的概念基礎,它的廣泛傳播和運用對人們的生活和思想產生了重大影響,在很大程度上推動了人類社會的發展與進步。
(3)第三種范式:計算
隨著1946年人類歷史上第一臺計算機ENIAC的誕生,人類社會開始步入計算機時代,科學研究也進入了一個以“計算”為中心的全新時期。通過設計算法并編寫相應程序輸入計算機運行,人類可以借助于計算機的高速運算能力去解決各種問題。計算機具有存儲容量大、運算速度快、精度高、可重復執行等特點,是科學研究的利器,推動了人類社會的飛速發展
(4)第四種范式:數據
隨著數據的不斷累積,其寶貴價值日益得到體現,物聯網和云計算的出現,更是促成了事物發展從量變到質變的轉變,使人類社會開啟了全新的大數據時代。在大數據環境下,一切將以數據為中心,從數據中發現問題、解決問題,真正體現數據的價值。大數據將成為科學工作者的寶藏,從數據中可以挖掘未知模式和有價值的信息,服務于生產和生活,推動科技創新和社會進步。
2 大數據對思維方式的影響
維克托·邁爾·舍恩伯格在《大數據時代:生活、工作與思維的大變革》一書中明確指出,大數據時代最大的轉變就是思維方式的3種轉變:全樣而非抽樣、效率而非精確、相關而非因果。
(1)全樣而非抽樣
過去,由于數據存儲和處理能力的限制,在科學分析中,通常采用抽樣的方法,即從全集數據中抽取一部分樣本數據,通過對樣本數據的分析,來推斷全集數據的總體特征。通常,樣本數據規模要比全集數據小很多,因此,可以在可控的代價內實現數據分析的目的。現在,我們已經迎來大數據時代,大數據技術的核心就是海量數據的存儲和處理,分布式文件系統和分布式數據庫技術,提供了理論上近乎無限的數據存儲能力,分布式并行編程框架MapReduce提供了強大的海量數據并行處理能力。因此,有了大數據技術的支持,科學分析完全可以直接針對全集數據而不是抽樣數據,并且可以在短時間內迅速得到分析結果,速度之快,超乎我們的想象。就像前面我們已經提到過的,谷歌公司的Dremel可以在2~3秒內完成PB級別數據的查詢。
(2)效率而非精確
過去,我們在科學分析中采用抽樣分析方法,就必須追求分析方法的精確性,因為,抽樣分析只是針對部分樣本的分析,其分析結果被應用到全集數據以后,誤差會被放大,這就意味著,抽樣分析的微小誤差,被放大到全集數據以后,可能會變成一個很大的誤差。因此,為了保證誤差被放大到全集數據時仍然處于可以接受的范圍,就必要確保抽樣分析結果的精確性。正是由于這個原因,傳統的數據分析方法往往更加注重提高算法的精確性,其次才是提高算法效率。現在,大數據時代采用全樣分析而不是抽樣分析,全樣分析結果就不存在誤差被放大的問題,因此,追求高精確性已經不是其首要目標;相反,大數據時代具有“秒級響應”的特征,要求在幾秒內就迅速給出針對海量數據的實時分析結果,否則就會喪失數據的價值,因此,數據分析的效率成為關注的核心。
(3)相關而非因果
過去,數據分析的目的,一方面是解釋事物背后的發展機理,比如,一個大型超市在某個地區的連鎖店在某個時期內凈利潤下降很多,這就需要IT部門對相關銷售數據進行詳細分析找出發生問題的原因;另一方面是用于預測未來可能發生的事件,比如,通過實時分析微博數據,當發現人們對霧霾的討論明顯增加時,就可以建議銷售部門增加口罩的進貨量,因為,人們關注霧霾的一個直接結果是,大家會想到購買一個口罩來保護自己的身體健康。不管是哪個目的,其實都反映了一種“因果關系”。但是,在大數據時代,因果關系不再那么重要,人們轉而追求“相關性”而非“因果性”。比如,我們去淘寶網購物時,當我們購買了一個汽車防盜鎖以后,淘寶網還會自動提示你,與你購買相同物品的其他客戶還購買了汽車坐墊,也就是說,淘寶網只會告訴你“購買汽車防盜鎖”和“購買汽車坐墊”之間存在相關性,但是,并不會告訴你為什么其他客戶購買了汽車防盜鎖以后還會購買汽車坐墊。
“大數據對科學研究的影響有哪些”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。