您好,登錄后才能下訂單哦!
本文長度為 3032 字,預計讀完需 1.1MB 流量,建議閱讀 8 分鐘。
前面兩篇《 分布式系統關注點——初識「高可用」 》、《 分布式系統關注點——僅需這一篇,吃透「負載均衡」妥妥的 》看完后,相信大家對實現高可用的思路和負載均衡的策略有了一些了解。這篇主要闡述一下在實施的時候主流的一些解決方案。
再翻出第一篇中放出的一張圖來回顧一下。
之前也有的小伙伴問到,為什么沒有列出DNS?我認為,DNS的本質是解決「domain name --> ip」的問題。雖然DNS除了在公網運用的之外,還會運用于做內網的自定義domain name解析,但是在程序里單靠它來做負載均衡的話,還是太勉強了。
當然,基于DNS“智能解析”功能可以做到IP的動態返回,也算起到了負載均衡的作用。但是,由于其本身是一個工作在L3(網絡層)的解決方案,所以無法對“端口”進行工作。而一般我們程序之間的通訊很多都會涉及到端口,因此我們本篇先不討論DNS~
在清楚了我們應該在哪些環節考慮做負載均衡之后,接下去就是思考如何能夠循序漸進的進行。
古時候軍隊打仗的時候一般都是拿盾的抗在前面,頂住攻擊。而負載均衡解決方案從某種角度來說也是一個類似盾一般的防御性設施,因為前提就是要能承載上游過來的流量。因此,越往“前”做負載均衡解決方案,效果肯定會越好,因為受保護的應用范圍越廣。
如果說,系統之前沒有運用過負載均衡,現在開始第一次做,該如何選擇呢?小Z根據心目當中的優先級來和大家聊一下。
硬件這塊名氣最大的還屬F5(根據ZOL的數據,其在市場占有率51.44%),大大蓋過了其它幾家硬件商的風頭。此類硬件負載均衡器的特點是“壕”,畢竟是純商業化的東西,投入的資源和精力自然是眾多開源軟件負載均衡所無法比擬的,所以功能非常強大。包含訪問加速、壓縮、安全等等負載均衡之外的許多附加功能。
題外話 :如果用F5組網的話,有兩種結構,串行結構和并行結構,也稱為直連模式和旁路模式。前者的優勢在對硬件產生壓力較小、且天然安全性高,而后者對原網絡架構的改動較小、且擴展性較好。大家在實際的使用中結合自身情況來部署。
“壕”物能夠同時支持L2~L7的轉發,所以上圖中的每一個標注點都可以用硬件來做負載均衡。因此,如果在經濟允許的情況下,直接上F5能解決很多原本需要花更多時間去解決的問題。所以當“時間”的重要度大于“金錢”的時候,建議優先采用硬件方案。
當“金錢”的重要程度大于“時間”的時候,我們可以通過軟件來達到我們要的效果。相應的,也增加了一些運維成本。
一般情況下,只要對數據庫不濫用,往往我們從「單應用 + 單庫」組合最先需要突破的是應用,變成「多應用 + 單庫」。那么針對Web應用的L7負載均衡,比較主流的產品是2個Nginx、HAProxy。在L7做負載均衡,最大的特點就是靈活,請求的URL、Header都是我們可以去掌控的,所以我們可以利用其中的任何信息為負載均衡策略所用。
這一類就是前面圖中的「反向代理」。作為「客戶端」和「Web應用」、「前端」和「后端」之間的橋梁。實際操作中主要做2步:
1. 在公網的域名解析中,配置解析到「反向代理」。記錄類型是「A」,記錄值是「反向代理」的IP。
2. 配置真實提供服務的Web應用IP和端口,和負載均衡均衡策略。上圖中的配置是Nginx中的示例,負載均衡策略的缺省值是輪詢。
當「Web應用」所依賴的TCP協議的「服務」需要橫向擴展,或者需要做「數據庫」、「分布式緩存」的多主、主從集群時,那么就需要一個支持L4的負載均衡軟件。這里最知名的就屬LVS了,1998年5月由章文嵩博士建立,2004年底被納入Lunix內核。也正因為它是內核態的程序,所以相比用Nginx、HAProxy來做L4的負載均衡,在性能、資源的消耗上會更優一些。
實際運用中的操作步驟主要也是2步:
1. 在LVS中添加一個IP虛擬服務(IPVS),并指定它的IP、端口和負載均衡策略。
2. 將IP虛擬服務關聯到真實的服務上,并指定模式和權重的信息。(做L4的負載均衡可以使用NAT或者FULLNAT模式)
題外話 :LVS的模式一共有四種,除了NAT和FULLNAT(NAT的增強版)模式外,它的TUN模式可以在L3做負載均衡,DR模式可以在L2做負載均衡,到這個層面其實就和做硬件同處于一個層次了。并且,隨著層次的深入,雖然對功能性上有所弱化,但是如果不考慮端口的話,單從IP層面的負載均衡來說,用DR模式做,則對數據包的加工介入度會降到最低,因此也是通過軟件做負載均衡能夠達到的性能極致。
另外,LVS中運用的虛擬IP概念,本質上和Nginx中的“server”概念一樣,定義了一個統一入口,作用上并沒有差別。將Nginx中的upstream關聯到server,就如LVS操作步驟第2點中的關聯一般。
這些每個具體的解決方案的使用教程網上比較多,就不展開了,大家實際用到的時候自行查閱一下,當然盡量優先看官方的。
做了一個苦差事,把所有同類型的產品都整合了一下優缺點和使用場景。不過,其中有不少是我沒用過的,所以僅供大家參考。順手將一些網上到處充斥的一些過時結論做了更新,如:Nginx不支持session sticky等。
我們可以看到,不同的解決方案有不同的側重點。因此在單個解決方案已經無法滿足的情況下,我們可以組合使用,各盡所長。
負載均衡這個領域還是以高可用和性能為2個最重要因素,下面是小Z推薦的一種組合方式,也是在系統量級達到每小時上億PV之后最被廣泛使用的一種。理論上,利用第一步DNS的域名解析所帶的負載均衡效果,只要復制多套LVS主備出來,綁上多個不同的虛IP,可以做到無限橫向擴展,以支撐不斷增長的流量。
用到的3個軟件目前都是開源產品,LVS+Keepalived負責做Nginx的負載均衡,而Nginx負責分發到實際的請求到Http和Tcp協議的應用上。
關于LVS的模式選擇,如果在同網段內的話優先使用DR模式進行L2轉發,性能最好。否則使用TUN模式進行L3分發。與此同時,在L4、L7的分發上使用Nginx來做,可以發揮其靈活易擴展的特點以及其它的一些額外特性如緩存等,也算是物盡其用。
云時代,service mesh風興起。以sidecar模式為核心的后起之秀Linkerd、Conduit、NginMesh、Istio等軟件除了滿足負載均衡之外,還為高可用相關的做了眾多的考量,后續有機會小Z和大家一起來梳理一下。很久之前寫過一篇調研服務治理框架的文章,里面順帶有提到一下,有興趣的小伙伴們可以跳過去看看:《 分布式系統中的必備良藥 —— 服務治理 》。
有些事,并不需要做到一步到位,做技術也是這樣。其實大部分情況下,在以上方案中選擇一個,做一層轉發就夠了。行遠自邇,避免給自己添不必要的麻煩。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。