您好,登錄后才能下訂單哦!
導語:今年是華為存儲業務第十八年,這十八年來風雨兼程,從篳路藍縷到星辰大海,華為存儲見證了中國存儲產業從無到有、從弱到強的發展全過程。
本文詳細回憶了華為存儲十八年走過的風雨歷程:艱難曲折的成長過程、平凡可敬的奮斗者、扭轉乾坤的重要時刻、激動人心的產品技術……
由于篇幅較長,特劃分為十個小節,采用連載的形式發布,具體章節如下:
下面讓我們正式重溫華為存儲這段絲路藍縷、以啟山林的奮斗歷程。
這是一個頗為勵志的成長故事。從三五個人的小團隊,到如今幾千人的團隊規模;從一臺預研機產品,到如今全面布局的存儲產品線;從起步階段多年的凈投入,到如今連續八個季度全球全閃存增速第一;從過去的默默無聞,到如今Gartner魔力四象限領導者的常客……
做到這些,華為存儲花了十八年。
十八年風雨歷程,華為存儲從蹣跚學步的孩童,摸著河岸的石頭艱難前行,到仗劍走天涯、勇闖天下的少年,一路艱辛卻也收獲滿滿。今年是華為存儲十八年,猶如一場成人禮,它既是致敬自己過去奮斗的青春,也意味著未來要肩負起更大的責任。
現在讓我們重溫歷史,感受存儲產業奮斗者的溫度。
在科技領域,任何業務從0到1的過程都注定是艱難無比的,華為存儲也不例外。
華為進入到存儲領域純屬偶然,2001年互聯網科技泡沫破裂之后,幾乎波及到所有科技公司,華為亦不能幸免。
置之死地而后生,華為當時認為只做通信產品未來會面臨很大的風險,需要積極尋找新的產業機會點。于是,華為商業網絡部悄然成立,存儲恰恰是其中一個新業務。“當時有幾十個新業務,存儲是到現在依然活著的三個業務之一。”華為存儲資深專家張國彬如是說。
張國彬2002年清華畢業后進入華為,恰好分配到存儲研發團隊,從此開啟了與存儲近二十年的緣分,見證了華為存儲從無到有,從追趕到逐步超越的全過程。
“公司是2002年正式對存儲業務進行投入的。當時,存儲產業的確是一個潛力無比巨大的朝陽產業。不過,公司剛開始比較謹慎,當時團隊加起來也就十來個人”,張國彬回憶道,“華為存儲團隊首先需要證明有沒有能力把存儲這件事情干成。”
彼時的全球存儲產業正處于高速發展的階段,北美互聯網四騎士之一的存儲公司EMC因為在911事件中幫助摩根斯坦利24小時恢復全部業務而名聲大噪,全球存儲工業也正式開啟黃金時代。EMC在隨后短短幾年之內完成了對Data General、Legato、Documentum、Avamar、VMware等一系列的收購,迅速完成了從高端存儲廠商到存儲巨頭的角色轉換,并開啟了長達十五年的存儲霸主生涯。
不過,誰能想到此時處于襁褓之中的華為存儲,會在十余年之后的中國市場實現對EMC的超越。
沒人、沒槍,但是又必須在一年之內把預研的產品研發出來,這就是華為存儲團隊當時所面臨的困難局面。為此,華為存儲率先想到的思路是與高校科研機構合作。于是,華為存儲與華中理工大學(之后改名為華中科技大學)謝長生教授團隊進行合作,開始基于標準服務器+商用FC卡+開源RAID代碼+Cache/SCSI組件打造預研的存儲系統。
“經過一年的努力,存儲原型機終于研發成功,將FC環境的I/O跑通。”張國彬介紹,“后來通過了管理層的驗收,華為存儲在2003年也順理成章地正式啟動研發。”
借助開源+創新的力量,華為存儲第一次證明了自己有能力活下去。不過,接下來還有更多意想不到的困難等待著華為。
在這個世界上,成功從來沒有捷徑可走,因為世上本來就沒有捷徑,科技領域尤甚。
正式開啟研發的華為存儲,馬上面臨著一道選擇題:走開源路線還是走創新路線從頭開始。
為此,華為存儲團隊內部發生了激烈的討論。采用開源路線,意味著可以加速產品研發成功的速度,這對于初涉存儲領域的華為而言,不失為一條“捷徑”,但開源也普遍存在著代碼與功能相對簡單、效率較低、Bug較多等情況;而從一開始就走創新路線的話,意味著需要保持持續投入,對時間和成本上是一場考驗。
“從長遠來看,選擇開源在未來會帶來更多風險。”張國彬解釋道,“經過充分論證和權衡,團隊最后一致決定寧愿花費數年時間,也要為客戶、自己奠定堅實的基礎。”這個決定對華為存儲后來的研發體系打造、平臺級研發策略有著決定性的影響,也是華為存儲后續能夠實現持續突破的關鍵。
不過一年下來,研發團隊發現這條路遠沒想象中那么容易,頗有“一入存儲深似海”的感覺。
“干了一年發現不對勁,存儲對于研發投入實在太大了。”張國彬如是說,“當時光企業級硬盤的價格就非常昂貴,加上人力成本也較高。”實際上,企業級存儲的技術門檻極高,作為企業數據的最后歸屬地,企業級存儲產品對于可靠性以及數據一致性有著極高的要求,這也直接決定了存儲研發需要高投入。
面臨著如此高昂的成本,華為也開始有一些猶豫。到底還要不要堅持投入?如果堅持下去,還需要持續高投入多久才能做出有市場競爭力的產品?做出產品之后,留給華為的市場窗口還有多大?
2004年,華為認為咬緊牙關也要上,但是需要靈活的方法去更加快速地了解市場變化和用戶需求,進而加速存儲產品的研發。為此,華為決定開始采用跟國外領先存儲廠商合作的方式,一方面滿足了內部業務需求,另外則可以通過成熟產品了解到用戶的實際需求。
之后,操作系統內存管理、消息通信、各種存儲協議、Cache、RAID軟件、集群管理、配置運維……團隊們把一個個功能都給實現了。在完成單控制器產品之后,華為存儲研發團隊又開始著手實現雙控存儲系統的研發。
在當時,從單控制器存儲到雙控制器存儲意味著研發能力有著本質的飛躍,對于存儲架構設計、軟件研發等都有著極高的要求。單控制器存儲一旦控制器出現某個問題,將會導致整個存儲的故障,這無疑會給用戶業務帶來致命的影響;而雙控制器則相當于給存儲買了一份保險,一個控制器出現故障,另一個控制器立馬跟上,確保客戶業務不會出現中斷。
到了2005年,華為花費三年多時間基本完成了對于雙控存儲系統的研發工作,這也意味著華為存儲研發實現了階段性的勝利。
就在此時,一次良機又出現在華為存儲面前,它有膽量去接受它么?
2006年,華為正式上市了F800存儲。此時,華為開始考慮大規模進入到存儲產業之中。這時,華為又面臨著選擇:第一是自己完全做,無論是研發、市場、渠道、服務都是自己來;第二是選擇與合作伙伴一起。
這一次,華為選擇了后者。
2005年,存儲與安全巨頭賽門鐵克拋來橄欖枝,華為與賽門鐵克有了第一次接觸。經過不斷的接觸與談判,華為與賽門鐵克在2006年正式開始運作合資公司--華為賽門鐵克(以下簡稱:華賽):華為出人和研發,賽門鐵克出資,主攻存儲與安全業務。
采用獨立合資公司的方式在當時對雙方都有最大利益,華為獲得了充足的資金,可以持續加大對存儲研發的投入,打造出更具市場競爭力的產品;賽門鐵克則規避了自己從頭開始干的風險。
經過近兩年的籌備,華賽公司在2008年正式對外掛牌成立,存儲團隊規模達到了200人左右。華為存儲此時猶如一個獨自闖蕩江湖的少年,懷揣遠大夢想,卻也心存忐忑。
2008年是存儲產業標志性的一年,存儲市場孕育著巨大變革,高端存儲創新架構、重復數據刪除與壓縮技術、閃存技術、集群文件技術……幾乎所有存儲細分領域都涌現出一大批具有創新精神的創業公司,存儲產業的創新可謂是百花齊放。
“合資公司給了華為存儲獨立成長的機會。”張國彬如是說。
華賽猶如一個奔跑的少年,脫離了華為體系,運轉效率、決策效率就像創業公司那樣迅速,積極參與到存儲的創新之中。2009年華賽就開發出了第一款SSD,要知道SSD在高端存儲中首次采用也僅僅是在2008年。
不僅如此,華賽作為一家獨立的合資公司,開始走出去、引進來,在全球范圍招募了大量優秀人才,從而奠定了華為存儲全球研發體系的基礎。通過不斷見世面和引進存儲大咖,華為存儲整體人才體系的視野和思路得到了大幅開拓。
“賽門鐵克并沒有為華賽注入一行代碼。華賽沒有采用賽門鐵克任何技術,但是研發團隊與賽門鐵克存儲專家們交流的確是受益匪淺。”張國彬澄清道。
不僅僅在研發體系、研發思路上突飛猛進,獨立運作的華賽意味著沒有大公司的市場和銷售資源可用,必須自己建立專業的銷售與市場團隊,勇敢走出去見客戶、啃單子。張國彬回憶道,那幾年的獨立運營,的確給了銷售與市場團隊很大鍛煉,政府、金融、運營商、大企業的頭部客戶都要挨個啃下來。“2009年,華賽存儲產品就用在了國有大銀行的影像歸檔上,并且在各個行業都開始取得突破。”
然而,成長的道路從來沒有一帆風順。人們常說,成長其實就是一種刻骨銘心的蛻變。華賽這位奔跑的存儲少年,一樣也有摔得刻骨銘心的時刻。
2009年,隨著華賽產品在多個行業用戶中得到使用,一些問題也開始接踵而至:告警器聲音與旋轉磁盤聲音形成共振,造成硬盤批量次故障;空氣污染、環境中的硫化物腐蝕硬盤,造成硬盤變慢;控制器短路;甚至傳說中宇宙射線引起內存Bit位翻轉導致數據不一致的情況也出現了。
這讓華賽公司開始重新審視存儲。張國彬表示:“老實說,這些問題讓華為存儲真正學會了尊敬存儲、敬畏數據。”這個世界上從來沒有隨隨便便的成功,市場上的競爭友商之所以能夠在市場中占據領先,跟它們多年以來摸爬滾打分不開,此時的華為存儲還稍顯稚嫩,面對這些問題顯得有點措手不及。
從摔倒的地方重新開始,華賽公司痛定思痛,在時任華賽存儲業務總裁范瑞琦的帶領下,研發團隊在2009年干了一件事情,除了手頭上的研發工作之外,將底層所有存儲協議、硬件部件要搞得清清楚楚、明明白白。
之后,研發團隊硬是把厚厚的英文協議書全部啃了下來,然后重新進行抗振、防腐設計,并且與硬盤廠商進行聯合設計,認真摸索每種、每塊硬盤故障參數,并且進行軟硬件聯合處理,硬盤百萬行代碼的固件(Firmware)必須經過長時間的實驗室驗證才能給用戶升級。
自此,華為存儲確定了堅不可動的原則:存儲可靠性第一,數據絕對不能丟失,存儲產品只有做到數據不丟失才能上市。
“直到今天我依然清晰的記得,每個周末大家聚在一起做問題根因分析的日子,針對每個出現的問題大家刨根問底,直到最終把它解決。”張國彬回憶道。
另外讓華賽這位存儲少年受益匪淺的就是與世界一流人才的交流與學習。當時的華賽研發團隊,很多人都畢業于名校,并且已經在存儲領域積累了好幾年的經驗,對自己可謂是信心滿滿。但是世界一流人才的到來,向華為注入的不僅僅是存儲領域各種領先的經驗、技巧和方法,更是在思想層面對于華賽存儲研發團隊產生重要的影響。
比如,在存儲領域非常常見的時延控制方面,時延可謂是存儲領域一個關鍵指標,時延的波動與異常可能會給存儲系統的性能帶來極大影響,進而會直接影響到業務的性能。如何對于時延進行精準的控制可謂是一門手藝活,一流存儲的大咖對于時延精準控制的專注猶如匠心精神,讓華賽研發團隊醍醐灌頂,明白了存儲技術的打磨沒有止境,需要有匠心精神對技術精益求精。
在這幾年的獨立運營中,華賽存儲摔了很多跤、吃了很多苦,也獲得了很多回報,整個公司運營狀況良好,連續兩次實現盈利;人才隊伍建設卓有成效,研發體系打造初步成型;產品研發上節節開花,第二代中端系統、SSD硬盤等新品讓業界為之一亮。
就在這時,華賽卻選擇了回歸華為大家庭,這個選擇會對存儲已經構建起來的產品、研發、銷售體系產生什么樣的影響?
2011年11月4日,華為和賽門鐵克宣布,雙方已就華為以5.3億美元收購賽門鐵克持有的華為賽門鐵克公司49%的股權達成協議。自此,華賽回歸成為定局。
如果按照5.3億美元的價格來計劃,華賽公司當年的估值已經突破了10億美金,可謂是名副其實的存儲獨角獸。華賽公司也用自己親身經歷證明了一個事實:這批華為存儲人是有能力在市場中生存乃至干出一番事業。
此刻的回歸,是會重蹈過去創業公司被并購入大公司之后碌碌無為的覆轍,還是會讓整個存儲業務如虎添翼、再上一個新臺階?這不僅是外界的疑慮,也是存儲團隊熱切期盼知道的。
“正式回歸之后,公司立刻大力投入存儲,明顯感覺到公司希望做大、做強存儲業務。”一位經歷過華為存儲離開、獨立、回歸全過程的員工感嘆道,“如果依然保持獨立,出于營收、盈利等方面的考慮,研發上不可能完全放開手腳,尤其是在基礎技術領域的研發上。”
自此,華為存儲在研發體系和研發人才上正式步入了全球化、頂尖水平的建設階段,為日后的OceanStor存儲Dorado系列全閃存,Pacific系列海量存儲等重磅產品打下了堅實的基礎。
從國內來看,在成都、北京、深圳三地,華為存儲早已建立起完善和強大的研發中心。全球也建立了多所存儲領域的研究所。經過幾年的打造,華為存儲的研發團隊已經媲美世界任何頂尖存儲公司。
研發在回歸之后另外一個最大的變化就是:平臺化。隨著全球研發體系的逐步建立與完善,華為存儲研發平臺化開始踏上了日程。張國彬透露:“以前在華賽時期,公司其實非常希望研發平臺化。但是華賽畢竟在規模上還較小,平臺化需要較長時間才會發揮作用。”但是,回歸華為之后,華為存儲研發平臺戰略所需要的條件非常完善,華為存儲抽調了大部分研發力量來對平臺化進行建設。
華為數據存儲產品部部長項飛介紹:“存儲平臺化其實是一個漸進的過程,需要存儲關鍵技術能力、軟硬件研發能力、項目管理能力的不斷積累,然后通過一個組件化的思路,讓復雜的存儲系統由各種組件來構成,不同的存儲系統之間的組件構成也會有很大變化。”
毫無疑問,平臺化戰略就是先讓各項技術、功能逐步完成組件化,并且基于解耦的思路去構建存儲系統,最大限度的去復用各種技術與組件。這種平臺化戰略帶來最直接的好處就是:研發效率大幅提升,組件之間互融互通、產品更新迭代更加快速,可以更加快速地響應市場上靈活多變的需求。
華為存儲這種自成立第一天就基于平臺化戰略,與通過各種并購而來的平臺有著天壤之別,雖然需要長時間的積累,但是隨著時間推移,研發布局與分工逐步完善,核心關鍵技術的不斷積累與沉淀,省去了日后各種產品與功能打通、兼容甚至未來規劃的種種麻煩,其所帶來的飛輪效應也會日漸突出。
還有一個顯著改變就是,華為整個研發大體系中的研發成果能為存儲所用,比如華為2012實驗室研發成果、操作系統技術等等。項飛直言,存儲是一種極為復雜的產品,涉及到計算、網絡、介質等多個領域,考慮到數據中心未來的發展趨勢,僅僅站在存儲研發團隊自身的視角是遠遠不夠的,需要充分利用華為內部不同的研發團隊,進行協作,以更加寬廣的視角和開發合作的方式來推動存儲不斷向前發展。
自此,華為存儲的技術創新+用戶需求的雙輪創新機制開始真正發揮威力。日后,華為存儲產品一次次的在各種測試中刷屏霸榜,產品開創性創新也猶如芝麻開花節節高,這與其他相對“沉寂”的競爭對手形成了鮮明對比。
不過建立平臺化是一個痛苦和長期的過程。在這之前,華為存儲還遇到了更加富有挑戰的事情:如何讓自身產品線豐富和強大起來,在高端存儲和分布式文件存儲這兩大領域實現突破。
在存儲產業中,高端存儲猶如最大一顆明珠,它直接代表著一家存儲廠商在業界的地位。如果說不想當將軍的士兵不是好士兵,那么不想做高端存儲的廠商一定不是有遠大抱負的廠商。這也是為什么華為會孜孜不倦投入到高端存儲的研發之中。
眾所周知,高端存儲所擁有的高可靠、高性能、高一致性使得其技術門檻極高,從1990年以來,在高端存儲市場真正擁有絕對實力只有EMC和HDS(后來更名為Hitachi Vantara)兩家公司,要想突破市場競爭壁壘談何容易。
“當時做決定還是非常艱難的,大家爭議與討論很多。”張國彬如是說,“畢竟一旦決定了,投入成本會非常巨大,也不允許失敗。”事實上,華為存儲要想進一步突破市場,攻克高端存儲也是必經之路,“沒有高端存儲產品,中低端產品從長期來看也可能會賣不好。”
當時,云計算的趨勢剛開始冒起,一些存儲廠商已經看到了高端存儲的弊病,雖然能夠完美滿足傳統業務場景的需求,但擴展性弱、投入大的弊病開始在云計算時代中逐步放大。張國彬透露:“當時的確有好幾家廠商看到了傳統高端存儲的弊病,大家都看到了未來的方向。”
為此,華為基于自身的技術基礎,以及業界的趨勢,開始著手投入到高端存儲的研發之中。當時,張國彬帶領100來號人在山里封閉了幾個月,專攻華為高端存儲的新架構設計。整個過程就像修煉絕世武功一樣,日復一日的用功無法感知到武功的精進程度,當打通任督二脈,捅破那層窗戶紙,猶如撥云見日、豁然開朗。
經過不斷的摸索和努力,華為存儲終于在2013年正式推出了基于SmartMatrix架構的第一代高端存儲產品。這是中國存儲廠商首次推出高端存儲產品,其意義和價值非凡。
它給華為存儲人注入了巨大的信心,也驅動著華為人主動去思考未來存儲的變革,為日后Dorado系列高端全閃存等一系列開創性的創新奠定了堅實基礎。其次,它為華為存儲打開各個行業頭部客戶提供了產品利器,大大提升了華為存儲的市場拓展深度和廣度。
“項飛,有個重要的任務交給你們!帶領團隊把分布式文件存儲搞出來。”
接到領導的通知之后,項飛心中不禁有點忐忑,一直干通信軟件研發的他,這次要半路出家去搞存儲啦。
此時的華為存儲剛剛回歸,產品線主要還是以SAN存儲為主,之前華賽期間主要銷售賽門鐵克的文件存儲產品。如今回歸,要做大做強存儲業務,屬于華為自己的分布式文件存儲產品必不可少。但在當時,研發分布式文件存儲產品的確是一項重大考驗,以致于華為內部也有部分聲音認為很難研發來。
畢竟,在分布式文件存儲領域,IBM、NetApp、EMC(收購分布式存儲明星公司Isilon)這些大公司無論是產品技術,還是市場銷售,都是當之無愧的翹楚。要想撬動分布式文件存儲的蛋糕,華為需要付出比常人更多的努力才行。
“在華為就是什么事情都敢去試一試。不懂分布式存儲沒關系,我就當它是‘二次創業’,努力學習和堅持就是了!”項飛最終橫下心去攻克分布式存儲這道難關。
于是接下來,項飛開始忙著招人、調整研發團隊結構。“最難的是人,我花了很多時間去面試全球各種人才,找到合適的骨干人才,才能帶領團隊不斷前進。”項飛如是說,“整個團隊很多人讓我很感動,像設計部很多人都是搞電信軟件的專家,他們全都打散到各個新團隊之中,這次大家又重新開始,全部回到編碼崗位,基本都是邊學邊干把分布式文件系統研發出來的。”
做出分布式文件存儲不算很難,但做出有市場競爭力的分布式文件存儲卻不是件容易的事情。因為市場上的標桿已經足夠高,像Isilon的全分布式對稱橫向擴展架構,元數據和數據均是分布在所有節點上,擁有極大的技術難度。華為的分布式存儲也采用的是全分布式對稱橫向擴展架構,那它的成色到底如何呢?
全對稱分布式架構非常具有挑戰性,因為元數據全部動態分布式所有節點上,需要保證各種情況下元數據可用。在華為分布式存儲的研發過程中,最大的難點也就是跟元數據相關的問題,“當時團隊專家不分日夜排查出各種問題,保證了產品能夠順利推出。”
到了2014年,經過兩年多努力,華為正式推出了采用全對稱分布式架構的分布式文件存儲OceanStor 9000,成為業內為數不多能夠采用此架構的存儲公司。并且,OceanStor 9000無論是性能、擴展能力、穩定低時延、自動分層能力都豎立了業界的新標桿。
華為OceanStor 9000
接下來幾年中,華為OceanStor 9000就開始了它在市場中的精彩表演。先是在國內市場,OceanStor 9000大舉進入到媒資、科研、石油能源勘探等領域,憑借出色的產品力捕獲了一大批客戶。不僅如此,OceanStor 9000還在海外市場展現出非凡的戰斗力,在亞太、歐洲、中東等地區市場迅速獲得認可。
一時間,存儲老大EMC發現Isilon出現了一個最為強勁的對手。以至于EMC后來在官網專門發布了一段視頻“懟”了一把OceanStor 9000,這恐怕是中國存儲廠商第一次享受到存儲巨頭的高“待遇”。
用戶永遠是最好的老師,因為它能夠最直白地讓你洞悉出業務真實應用需求、自身的差距甚至競爭對手的優缺點。
2014年,張國彬遠赴歐洲,成為華為存儲市場一線中的一員,每天穿梭于各種展會、演講之中。聽說德國一家知名的電信公司正在招標,需要采購一批存儲產品。張國彬決定和同事一起去接觸和拜訪該公司的架構師,爭取把這家大客戶一舉拿下。
見面之后,該公司架構師非常實在,還沒等張國彬口若懸河介紹華為存儲產品各種優勢,拿出一份標書表格,要求華為存儲將產品性能能夠達到多少、各種工具生態對接情況、可靠性情況等一一列舉出來,“第一次遇見如此嚴謹和專業的用戶,一下明白了我們離用戶的差距還有點遠,需要改進的地方還非常之多。”
2017年華為正式推出了OceanStor存儲Dorado系列 V3產品。此刻的張國彬再見到這家電信公司架構師時,已經是底氣十足、自信滿滿,將V3產品的存儲特性、性能、可靠性、易用性、工具與功能一一講解,以極佳的專業性順利打動客戶之后,華為存儲產品又順利通過了POC測試,該家客戶也一次性采購了華為存儲多套高端存儲產品。
2015年,瑞典一家世界級的機械制造公司開始加大自動駕駛在產品中的應用,由于機器學習和深度學習需要不斷對數據進行訓練,并且數據是千億級的海量小圖片、小視頻,傳統分布式存儲通常是大文件、大帶寬的,很難適合像自動駕駛這種AI訓練場景,該公司架構師在與華為存儲團隊交流中吐槽,因為不同場景的需求,多套不同存儲來跑不同的應用,又開始產生了數據煙囪。
對此,該公司架構師與華為存儲討論,能不能通過一套分布式存儲來支撐數據湖,除了自動駕駛業務之外,還能滿足車聯網、傳統CAD與CAE等應用。于是,華為存儲決定與該客戶進行聯合創新,研發一套分布式存儲支撐所有應用集成。
接下來,華為存儲與該客戶緊密合作,跟客戶探討每一個功能如何設計、參數如何設計,并且在每個場景中進行測試、部署與應用。瑞典這家公司直接讓華為理解了新業務場景所帶來的挑戰以及需求。“面向新的應用場景,華為存儲必須走的快,而且需要與用戶一起做,不能閉門造車。”
回歸華為之后,華為存儲在海內外與各個行業的頭部頂級客戶聯合創新日益增多,涉及到金融、電信、能源、媒資等多個領域,對于頭部客戶數據中心存儲需求和痛點有著極為深入的理解,也為日后產品創新和產品力的大幅提升奠定了堅實基礎。
從2015年開始,海內外包括金融、運營商、能源等多個行業的頭部客戶在與華為存儲交流的過程中,都提到了分布式,用戶們渴望在主數據中心的核心中部署分布式存儲,讓核心應用也能夠享受到分布式存儲的好處。
“像荷蘭的一家電信公司,數據量當時都超過300PB了,非常渴望向分布式的云架構轉型。”張國彬表示,“他們希望分布式可以承載數據庫、虛擬機這些核心業務,也能夠承載大數據、AI這些新應用。”
這些客戶的需求直接促成了華為打造新一代智能分布式存儲—OceanStor分布式存儲。2016年,華為存儲迅速集結了集中式領域和分布式領域最優秀的架構師,一起攻關如何將分布式存儲和集中存儲融合在一個產品之中。
“這時候華為存儲平臺化的戰略優勢就顯現出來了。華為研發的大部分力量都在平臺產品上,可以充分調動資源進行攻關。”張國彬透露,“這是其他公司很難去實現的,因為按照他們那種模式,投入的成本和時間極其大。”
同樣經過兩年多的研發,華為存儲在2019年正式發布了新一代智能分布式存儲-OceanStor分布式存儲。華為北京、上海、深圳、成都等地的存儲研發團隊跨地域緊密協同,設計出一套全新的存儲架構,進行了數千萬行代碼開發,并先后進行了近十個版本的迭代,反復打磨、優化的成果。
華為OceanStor分布式存儲產品不僅實現分布式存儲性能全球第一,單節點性能高端16.8萬 IOPS和1毫秒以內時延,在業界標準SPC-1測試中排名第一;還首次在一套存儲中實現了同時支持塊、文件、對象、HDFS協議;并且,率先將人工智能技術融入到存儲全生命周期管理。
在OceanStor分布式存儲為用戶數據中心提供一套簡單卻功能強大的存儲背后,其實是研發團隊反復打磨與優化的成果。比如,為解決性能波動的“隱形瓶頸”,華為存儲研發團隊動用了全球研發體系內的操作系統調度專家、網絡專家,讓性能波動徹底解決,實現了非ARM節點14萬IOPS、ARM節點16.8萬IOPS的穩定性能。
分布式存儲有三大難,其一是數據不一致情況如何解決,由于數據打散在各個節點上,很容易出現數據不一致的情況,尤其是在高性能、大并發的數據讀寫情況下如何保持數據一致性。這需要華為存儲在并發機制上做到精準無比。為此,華為存儲研發團隊研發出一套新的日志機制與工具,在海量數據中去追蹤和查看IO異常,實現了上千個節點不同場景下的數據不一致情況檢驗。
其二是分布式存儲功能與性能如何平衡,像重復數據刪除功能對存儲性能影響很大。為此,華為存儲研發團隊專門開發出一種加權算法,讓重刪功能實現自適應調整,為用戶減去了過去需要不斷手動配置的復雜性,呈現出極為簡單的易用性。
最后則是如何防范數據丟失。通常,分布式存儲所承載的應用場景是多樣化和復雜化,這也直接促使了數據丟失潛在因素的增多。針對這種情況OceanStor分布式存儲在只有64個字節的可靠性校驗的空間容納了30多個場景的預防方案,每個預防方案的“植入”需要精準到每個比特位,堪稱手術刀般精準。
這是一個真實的用戶故事。
某家世界級的物流公司,一套高端存儲上跑了4000臺服務器,按照傳統高端存儲的架構,如果做系統軟件升級,為防止前端多路徑運行不正常,必須在升級之前將4000多臺服務器的多路徑檢查一遍。客戶每次做升級,都猶如面臨世界末日般,處于崩潰邊緣。
這家公司的情況真實反映出很多用戶的囧境:應用越來越多、業務越來越靈活,應用環境正在快速變化,高端存儲需要有能力在數據中心承載起更多的業務,過去只承載幾種業務的情況已經一去不復返。
如今,高端存儲該進行變革啦。有人說,科技這個行業不尊重過去,只尊重創新,你不創新就只有等死。此時的華為,在全閃存技術、高端存儲架構上的積累已經完成,是時候打造出一款面向未來、滿足用戶數據中心極致需求的產品,讓高端存儲重新煥發新生機。
眾所周知,閃存對于存儲產業有著革命性的影響,全閃存存儲被認為是大勢所趨。而傳統高端存儲恰恰是基于傳統硬盤時代的產品,哪怕后來有廠商在高端存儲中加入閃存,也僅僅是一種優化的妥協選擇。
全閃存,這是一條全新的賽道。在新賽道意味著你有機會實現對競爭對手的追趕,尤其是高端全閃存領域,將會是一次軟硬件架構、功能堆棧的全面重塑。而華為在閃存領域已經擁有深厚的積累。
其次,華為存儲在SmartMatrix高端存儲架構上的經驗,推動了下一代高端存儲在架構上的進一步突破。華為存儲開始將Scale-Up和Scale-Out進行融合,采用了模塊化橫向擴展、所有關鍵部件全解耦全共享架構,并且融入了多項智能化技術。
2019年發布OceanStor Dorado V6新一代全閃存產品
2019年7月,歷時近三年的華為全新一代OceanStor Dorado V6系列產品正式亮相:擁有業界最高的2000萬IOPS極致性能,業界最低0.1ms的穩定時延、控制器8壞7的極端情況依然工作、基于AI算法的全生命周期智能運維,并且可以實現故障0感知、業務0影響、升級0影響,真正保障用戶業務永久在線。
如果說華為存儲過去一直都算跟隨的話,那么OceanStor Dorado V6產品的驚艷亮相則標志著華為存儲開始引領,它是華為存儲多年技術積累與創新的一次爆發,讓大家看到了華為存儲走出了一條不一樣、具有開創性價值之路。
存儲產品是數據的最終目的地,除了性能和效率之外,數據可用性和持久度、產品的可靠性等要求極為嚴格。做存儲的開發有時候就像打造一件復雜的藝術品,需要技術研發人員不斷的雕琢與打磨,追求完美的狀態。
“存儲對于工程師的匠心文化要求很高。因為代碼一不小心,可能整個盒子就崩了,會給用戶帶來災難性的后果。”華為存儲首席架構師黃克驥如是說。
經過長期積累,華為存儲軟件已經達到幾千萬行代碼的規模,存儲研發團隊依然對每一行代碼都是高標準的質量要求。例如,在重復數據刪除與壓縮領域,作為降低存儲成本、提升存儲效率最為有效的技術,重刪壓縮被認為是衡量存儲產品水平的重要標志,但是重刪壓縮功能一旦出現問題,造成數據損壞或者丟失,其給用戶帶來的后果是極為嚴重。因此,華為對于重刪壓縮測試極為嚴格,嚴防有Bug遺漏,不斷打磨代碼,做到萬無一失。
在硬件層面,華為存儲有專門的可靠性團隊和專業的可靠性實驗室對各種硬件組件進行測試,尋找可能存在的漏洞,在可靠性方面不停的精益求精。
“華為存儲研發一線有很多低調、才華橫溢的人才。”黃克驥介紹到。
比如有這么一位癡迷于代碼的技術大咖,融合存儲文件系統是他編寫的、復制核心模塊是他編寫的、全閃存架構核心模塊是他編寫的、重復數據刪除模塊也是他編寫的,這位代碼大神從華為歷史上企業級到分布式核心模塊都寫過。“他表達方式就是代碼,我們都說他是個掃地僧,普華務實的外表下藏著萬丈光芒。”
“除了專注之外,華為非常看重研發人才的全棧能力。何為全棧能力,就是技能全棧化和業務全棧化。”項飛介紹道。在技能全棧化方面,華為要求開發必須懂測試,測試必須懂產品設計、后端維護,通過崗位輪換讓研發人員把這些技能拉通,從而變得更加全面;又比如,在產品架構內,華為會通過讓員工在不同子系統研發的方式讓員工盡可能多掌握技術;此外,華為還會讓研發定期去前端支持銷售和后端支持服務等等。
以存儲架構師為例,在華為存儲有不成文的規定:架構師也需要寫代碼。有些架構師,從RAID 2.0功能到華為OceanStor存儲Dorado系列V3、V6兩代產品都是自己做架構、寫代碼,長期保持這種狀態。以至于華為存儲內部人打趣道:“不會寫代碼的存儲架構師不是好的存儲售前。”
一抹丹青色,最是匠人心——用來詮釋華為存儲的匠心精神再恰當不過。
如今,存儲產業又站在下一個變革的十字路口。
人工智能技術的不斷成熟與應用,正在深刻影響著存儲產業。融入人工智能技術的智能存儲被認為是重要的趨勢,它希望本質上解決過去存儲操作、運維復雜化的情況,讓存儲變得更加簡單化。
“智能會成為存儲的基礎能力。”華為數據存儲與機器視覺產品線總裁周躍峰表示:“未來的存儲首先需要Storage for AI,能夠幫助用戶更好地利用智能技術,滿足像AI訓練、應用的需求;其次是AI in Storage,就是將AI技術融入到存儲全生命周期,讓存儲管理、性能、效率、維護更加出色。”
華為在智能存儲的探索上一直走在業界的最前沿。華為OceanStor存儲Dorado V6產品是業界首個AI加持的高端存儲系統,并且在重刪壓縮算法、智能存儲運維等方面大量運用了機器學習的方式,通過AI+智能算法實現了存儲系統的智能自調優,可以讓存儲可以越用越好。
但智能存儲依然有很長的路要走,現階段智能存儲主要是解決了故障定位與業務管理等運維優化工作,以及一些基于AI的智能Cache算法、重刪壓縮算法等等,讓一些專業化的存儲操作變成自動化。未來,存儲也會類似自動駕駛那樣,會根據不同的負載情況和業務場景來智能化選擇相應的存儲功能與技術。
除此之外,在數據成為數字經濟最關鍵的生產要素時,存儲作為數據基礎設施重要的一環,依然存在著非常多的挑戰。幫助企業實現數據“存得下、流得動、用得好”,需要包括華為存儲在內的所有存儲廠商繼續探索。
“我們的征途似星辰大海,從此只顧風雨兼程。”——華為存儲一直在路上。
尾記:《華為存儲成人禮:我們的征途似星辰大海》四篇連載已經結束。雖是萬字長文,但亦無法將華為存儲十八年歷程一一展示。謹以此文向中國存儲產業從業者致敬,望大家不忘初心,砥礪前行!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。