您好,登錄后才能下訂單哦!
引子
有人在某個專注SQL的公眾號留言如下:
對SQL Server的鄙視
這個留言觸碰到一個非常敏感的問題:搞關系型數據庫還有前途嗎?現在都2020年了,區塊鏈正火熱,AI人才已經“過剩”,大數據都成了稀松平常的蘿卜白菜,你卻還在搞SQL Server? 你還在搞SQL?
原因
最近10年,數據管理領域的變化可謂精彩紛呈。什么Hadoop, Spark,MemcacheDB, Redis, Vertica, HANA, Cassandra, MongoDB, InfluxDB,TiDB等等,不一而足。各類高端峰會、論壇確實只見AI, 大數據,很少見傳統關系型數據庫的身影了。
初步分析下來原因有四:
云計算的興起跟開源數據庫的大規模應用,大大降低了算力以及數據存儲的成本。
以傳統關系型數據的龍頭老大Oracle為例,隨著互聯網的興起,海量用戶產生了海量數據,但當Oracle大規模部署的時候,不僅Oracle軟件本身貴,與之配套的IBM小型機+EMC的存儲開支也相當龐大。比如將Oracle的數據集群從一個房間搬到同一個數據中心的另外一個房間,收費都要十幾萬。軟硬件維護成本,包括對管理員的要求也非常高。
另外Oracle本身也有性能的上限,其次是閉源的黑盒子。對于沒碰到過的場景,無論再怎么努力,也是無法預測可能出現的問題的。
中國的互聯網公司大部分都草莽出身,對于性價比極為看重。當年的互聯網老大美國的雅虎公司開始率先使用MySQL數據庫,中國的互聯網公司隨之跟進。
最典型的例子是阿里巴巴。阿里巴巴曾經被稱為Oracle的“明星客戶“,”黃埔軍校“。但隨著注冊用戶數激增,用戶產生的數據也越來越多,淘寶啟用了全亞洲最大的Oracle RAC集群,阿里巴巴B2B中文站的數據量也因數據量大和業務要求,每年早上08:00—09:30之間CPU保持98%的使用率,服務器負載也超高,即使采用冷熱隔離的方式也解決不了大容量數據且大并發的難題,更換存儲設備不久又會再次出現這樣的狀況。
阿里巴巴被迫“攢出”一條去IOE的技術路線:“低成本、線性可控、去中心化(即分布式):去IBM,PC Sever替代小型機;去Oracle,用MySQL替代;去EMC,用中低端存儲”。
在之后的爆發式增長中,包括以2014,15,16年雙十一為代表的業務高峰,阿里基于開源版本搞出來的MySQL分支很好地支撐了極其嚴苛的業務要求,最終很方便云化、同時又開源的MySQL在國內的互聯網公司逐步開始取代Oracle的江湖地位,成為諸多中國互聯網企業的首選。
通用硬件成本的降低。隨著摩爾定律的作用,甚至出現了HANA,, Vertica,InfluxDB等等很多內存或者分布式內存數據庫。
那么現在云計算跟云存儲到底有多便宜呢? 看看今天剛從某網站截取的廣告吧:
某網站的云主機廣告
這種面向市場大規模銷售的產品,因為可以采用廉價的PC Server,可以做到真正的白菜價,這在10年前是根本無法想象的。
另外MySQL代碼跟文檔都是公開的,這樣對數據庫開發維護人員的要求相應的也就大大降低了。
從SQL 發展到NoSQL,支持半結構化數據,非結構數據的數據庫大放異彩,之前這類無法處理的非結構化數據難題得到了解決,非結構化數據處理成為標準配置,似乎占據了市場熱點。而NewSQL尚在發展中。
發展
數據庫的發展方向大致包括以下幾個方面:
- 由單機、集群向徹底分布式發展,目前Oracle等數據庫已經實現
- OLTP跟OLAP的融合,這個特性很早就已經實現了
- 結構化非結構化的融合,目前Oracle, MS SQL Server等也已經實現
- 磁盤跟內存數據庫的融合,目前Oracle, MS SQL Server等也已經實現
- 行、列、圖、對象、文檔、內容、時序、搜索引擎、導航類等等不同類型的數據庫的融合,筆者初步研究發現已經小部分實現
- 初略分析來看,數據建模工具對以上特性的支持也在跟進中,但離完美支持還有很大距離
綜上來看,今后縱向上數據庫個人認為對圖片、音視頻的存儲會繼續成為熱點,橫向上也會進一步融合發展,比如音視頻存儲跟結構化數據的融合等等。
那么是不是傳統的關系型數據庫徹底成了昨日黃花呢?如果你這么想,那就大錯特錯了!讓我們看看權威的數據排名:
近年數據流行度趨勢
2019年12月份數據庫流行度排名
由此可見非結構化數據雖然火熱,但是關系型數據庫仍然穩坐釣魚臺!
原因在哪里呢?數據庫發展絢麗多彩,但最終關鍵還在其擅長的業務場景。不同類型的數據庫適配不同的業務場景。在現實世界大量存在的結構化數據,關系型數據庫處理起它們來相對成熟,經過幾十年的發展和各種嚴苛的考驗,各方面優勢得天獨厚。現在大火的大數據重點在于其有效解決了之前一直無法處理的半結構化、非結構化數據這個老大難問題。讓非結構化數據庫擔當關系型數據庫的重任,無異于讓挖掘機去跟大貨車比賽拉貨。
之前關系型數據庫確實占據了絕對的主流。只是近幾年隨著3G、4G的發展,圖片、音視頻內容略有增加。后面隨著5G、AR\VR、物聯網等等新技術的發展,存儲又會變貴,區塊鏈跟量子計算也會給世界帶來新的變化……但不管怎么發展,我認為關系型數據庫未來十年仍將是主流,再遠的將來也會有它重要的地位。因為在可預見的將來,結構化數據仍是人類最重要的數字資產。
原創質量保證,關注我,每周分享數據相關干貨!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。