您好,登錄后才能下訂單哦!
這篇文章主要介紹了大型電商分布式架構是怎樣的的相關知識,內容詳細易懂,操作簡單快捷,具有一定借鑒價值,相信大家閱讀完這篇大型電商分布式架構是怎樣的文章都會有所收獲,下面我們一起來看看吧。
用戶多,分布廣泛
大流量,高并發
海量數據,服務高可用
安全環境惡劣,易受網絡攻擊
功能多,變更快,頻繁發布
從小到大,漸進發展
以用戶為中心
免費服務,付費體驗
高性能:提供快速的訪問體驗。
高可用:網站服務一直可以正常訪問。
可伸縮:通過硬件增加/減少,提高/降低處理能力。
安全性:提供網站安全訪問和數據加密,安全存儲等策略。
擴展性:方便的通過新增/移除方式,增加/減少新的功能/模塊。
敏捷性:隨需應變,快速響應;
分層:一般可分為,應用層,服務層,數據層,管理層,分析層;
分割:一般按照業務/模塊/功能特點進行劃分,比如應用層分為首頁,用戶中心。
分布式:將應用分開部署(比如多臺物理機),通過遠程調用協同工作。
集群:一個應用/模塊/功能部署多份(如:多臺物理機),通過負載均衡共同提供對外訪問。
緩存:將數據放在距離應用或用戶最近的位置,加快訪問速度。
異步:將同步的操作異步化。客戶端發出請求,不等待服務端響應,等服務端處理完畢后,使用通知或輪詢的方式告知請求方。一般指:請求——響應——通知 模式。
冗余:增加副本,提高可用性,安全性,性能。
安全:對已知問題有有效的解決方案,對未知/潛在問題建立發現和防御機制。
自動化:將重復的,不需要人工參與的事情,通過工具的方式,使用機器完成。
敏捷性:積極接受需求變更,快速響應業務發展需求。
以用戶為中心,提供快速的網頁訪問體驗。主要參數有較短的響應時間,較大的并發處理能力,較高的吞吐量,穩定的性能參數。
可分為前端優化,應用層優化,代碼層優化,存儲層優化。
前端優化:網站業務邏輯之前的部分;
瀏覽器優化:減少 Http 請求數,使用瀏覽器緩存,啟用壓縮,Css Js 位置,Js 異步,減少 Cookie 傳輸;
CDN 加速,反向代理;
應用層優化:處理網站業務的服務器。使用緩存,異步,集群
代碼優化:合理的架構,多線程,資源復用(對象池,線程池等),良好的數據結構,JVM 調優,單例,Cache 等;
存儲優化:緩存,固態硬盤,光纖傳輸,優化讀寫,磁盤冗余,分布式存儲(HDFS),NOSQL 等;
大型網站應該在任何時候都可以正常訪問。正常提供對外服務。因為大型網站的復雜性,分布式,廉價服務器,開源數據庫,操作系統等特點。要保證高可用是很困難的,也就是說網站的故障是不可避免的。
如何提高可用性,就是需要迫切解決的問題。首先,需要從架構級別,在規劃的時候,就考慮可用性。行業內一般用幾個 9 表示可用性指標。比如四個 9(99.99),一年內允許的不可用時間是 53 分鐘。
不同層級使用的策略不同,一般采用冗余備份和失效轉移解決高可用問題。
應用層:一般設計為無狀態的,對于每次請求,使用哪一臺服務器處理是沒有影響的。一般使用負載均衡技術(需要解決 Session 同步問題),實現高可用。
服務層:負載均衡,分級管理,快速失敗(超時設置),異步調用,服務降級,冪等設計等。
數據層:冗余備份(冷,熱備[同步,異步],溫備),失效轉移(確認,轉移,恢復)。數據高可用方面著名的理論基礎是 CAP 理論(持久性,可用性,數據一致性[強一致,用戶一致,最終一致])
伸縮性是指在不改變原有架構設計的基礎上,通過添加/減少硬件(服務器)的方式,提高/降低系統的處理能力。
應用層:對應用進行垂直或水平切分。然后針對單一功能進行負載均衡(DNS,HTTP[反向代理],IP,鏈路層)。
服務層:與應用層類似;
數據層:分庫,分表,NOSQL 等;常用算法 Hash,一致性 Hash。
可以方便的進行功能模塊的新增/移除,提供代碼/模塊級別良好的可擴展性。
模塊化,組件化:高內聚,內耦合,提高復用性,擴展性。
穩定接口:定義穩定的接口,在接口不變的情況下,內部結構可以“隨意”變化。
設計模式:應用面向對象思想,原則,使用設計模式,進行代碼層面的設計。
消息隊列:模塊化的系統,通過消息隊列進行交互,使模塊之間的依賴解耦。
分布式服務:公用模塊服務化,提供其他系統使用,提高可重用性,擴展性。
對已知問題有有效的解決方案,對未知/潛在問題建立發現和防御機制。對于安全問題,首先要提高安全意識,建立一個安全的有效機制,從政策層面,組織層面進行保障。比如服務器密碼不能泄露,密碼每月更新,并且三次內不能重復;每周安全掃描等。以制度化的方式,加強安全體系的建設。同時,需要注意與安全有關的各個環節。安全問題不容忽視。包括基礎設施安全,應用系統安全,數據保密安全等。
基礎設施安全:硬件采購,操作系統,網絡環境方面的安全。一般采用,正規渠道購買高質量的產品,選擇安全的操作系統,及時修補漏洞,安裝殺毒軟件防火墻。防范病毒,后門。設置防火墻策略,建立 DDOS 防御系統,使用攻擊檢測系統,進行 子網隔離等手段。
應用系統安全:在程序開發時,對已知常用問題,使用正確的方式,在代碼層面解決掉。防止跨站腳本攻擊(XSS),注入攻擊,跨站請求偽造(CSRF),錯誤信息,HTML 注釋,文件上傳,路徑遍歷等。還可以使用 Web 應用防火墻(比如:ModSecurity),進行安全漏洞掃描等措施,加強應用級別的安全。
數據保密安全:存儲安全(存在在可靠的設備,實時,定時備份),保存安全(重要的信息加密保存,選擇合適的人員復雜保存和檢測等),傳輸安全(防止數據竊取和數據篡改);
常用的加解密算法(單項散列加密[MD5,SHA],對稱加密[DES,3DES,RC]),非對稱加密[RSA]等。
網站的架構設計,運維管理要適應變化,提供高伸縮性,高擴展性。方便的應對快速的業務發展,突增高流量訪問等要求。
除上面介紹的架構要素外,還需要引入敏捷管理,敏捷開發的思想。使業務,產品,技術,運維統一起來,隨需應變,快速響應。
以上采用七層邏輯架構,第一層客戶層,第二層前端優化層,第三層應用層,第四層服務層,第五層數據存儲層,第六層大數據存儲層,第七層大數據處理層。
客戶層:支持 PC 瀏覽器和手機 APP。差別是手機 APP 可以直接訪問通過 IP 訪問,反向代理服務器。
前端層:使用 DNS 負載均衡,CDN 本地加速以及反向代理服務;
應用層:網站應用集群;按照業務進行垂直拆分,比如商品應用,會員中心等;
服務層:提供公用服務,比如用戶服務,訂單服務,支付服務等;
數據層:支持關系型數據庫集群(支持讀寫分離),NOSQL 集群,分布式文件系統集群;以及分布式 Cache;
大數據存儲層:支持應用層和服務層的日志數據收集,關系數據庫和 NOSQL 數據庫的結構化和半結構化數據收集;
大數據處理層:通過 Mapreduce 進行離線數據分析或 Storm 實時數據分析,并將處理后的數據存入關系型數據庫。(實際使用中,離線數據和實時數據會按照業務要求進行分類處理,并存入不同的數據庫中,供應用層或服務層使用)。
一般網站,剛開始的做法,是三臺服務器,一臺部署應用,一臺部署數據庫,一臺部署 NFS 文件系統。
這是前幾年比較傳統的做法,之前見到一個網站 10 萬多會員,垂直服裝設計門戶,N 多圖片。使用了一臺服務器部署了應用,數據庫以及圖片存儲。出現了很多性能問題。
如下圖:
但是,目前主流的網站架構已經發生了翻天覆地的變化。一般都會采用集群的方式,進行高可用設計。至少是下面這個樣子。
(1) 使用集群對應用服務器進行冗余,實現高可用;(負載均衡設備可與應用一塊部署)
使用數據庫主備模式,實現數據備份和高可用;
預估步驟:
(1) 注冊用戶數-日均 UV 量-每日的 PV 量-每天的并發量;
(2) 峰值預估:平常量的 2~3 倍;
(3) 根據并發量(并發,事務數),存儲容量計算系統容量。
客戶需求:3~5 年用戶數達到 1000 萬注冊用戶;
每秒并發數預估:
(1) 每天的 UV 為 200 萬(二八原則);
(2) 每日每天點擊瀏覽 30 次;
(3) PV 量:200*30=6000 萬;
(4) 集中訪問量:240.2=4.8 小時會有 6000 萬0.8=4800 萬(二八原則);
(5) 每分并發量:4.8*60=288 分鐘,每分鐘訪問 4800/288=16.7 萬(約等于);
(6) 每秒并發量:16.7 萬/60=2780(約等于);
(7) 假設:高峰期為平常值的三倍,則每秒的并發數可以達到 8340 次。
(8) 1 毫秒=1.3 次訪問;
沒好好學數學后悔了吧?!(不知道以上算是否有錯誤,呵呵~~)
服務器預估:(以 tomcat 服務器舉例)
(1) 按一臺 web 服務器,支持每秒 300 個并發計算。平常需要 10 臺服務器(約等于);[tomcat 默認配置是 150]
(2) 高峰期:需要 30 臺服務器;
容量預估:70/90 原則
系統 CPU 一般維持在 70%左右的水平,高峰期達到 90%的水平,是不浪費資源,并比較穩定的。內存,IO 類似。
以上預估僅供參考,因為服務器配置,業務邏輯復雜度等都有影響。在此 CPU,硬盤,網絡等不再進行評估。
根據以上預估,有幾個問題:
需要部署大量的服務器,高峰期計算,可能要部署 30 臺 Web 服務器。并且這三十臺服務器,只有秒殺,活動時才會用到,存在大量的浪費。
所有的應用部署在同一臺服務器,應用之間耦合嚴重。需要進行垂直切分和水平切分。
大量應用存在冗余代碼
服務器 SESSION 同步耗費大量內存和網絡帶寬
數據需要頻繁訪問數據庫,數據庫訪問壓力巨大。
大型網站一般需要做以下架構優化(優化是架構設計時,就要考慮的,一般從架構/代碼級別解決,調優主要是簡單參數的調整,比如 JVM 調優;如果調優涉及大量代碼改造,就不是調優了,屬于重構):
業務拆分
應用集群部署(分布式部署,集群部署和負載均衡)
多級緩存
單點登錄(分布式 Session)
數據庫集群(讀寫分離,分庫分表)
服務化
消息隊列
其他技術
根據業務屬性進行垂直切分,劃分為產品子系統,購物子系統,支付子系統,評論子系統,客服子系統,接口子系統(對接如進銷存,短信等外部系統)。
根據業務子系統進行等級定義,可分為核心系統和非核心系統。核心系統:產品子系統,購物子系統,支付子系統;非核心:評論子系統,客服子系統,接口子系統。
業務拆分作用:提升為子系統可由專門的團隊和部門負責,專業的人做專業的事,解決模塊之間耦合以及擴展性問題;每個子系統單獨部署,避免集中部署導致一個應用掛了,全部應用不可用的問題。
等級定義作用:用于流量突發時,對關鍵應用進行保護,實現優雅降級;保護關鍵應用不受到影響。
拆分后的架構圖:
參考部署方案 2
(1) 如上圖每個應用單獨部署
(2) 核心系統和非核心系統組合部署
分布式部署:將業務拆分后的應用單獨部署,應用直接通過 RPC 進行遠程通信;
集群部署:電商網站的高可用要求,每個應用至少部署兩臺服務器進行集群部署;
負載均衡:是高可用系統必須的,一般應用通過負載均衡實現高可用,分布式服務通過內置的負載均衡實現高可用,關系型數據庫通過主備方式實現高可用。
集群部署后架構圖:
緩存按照存放的位置一般可分為兩類:本地緩存和分布式緩存。本案例采用二級緩存的方式,進行緩存的設計。一級緩存為本地緩存,二級緩存為分布式緩存。(還有頁面緩存,片段緩存等,那是更細粒度的劃分)
一級緩存,緩存數據字典,和常用熱點數據等基本不可變/有規則變化的信息,二級緩存緩存需要的所有緩存。當一級緩存過期或不可用時,訪問二級緩存的數據。如果二級緩存也沒有,則訪問數據庫。
緩存的比例,一般 1:4,即可考慮使用緩存。(理論上是 1:2 即可)。
根據業務特性可使用以下緩存過期策略:
(1) 緩存自動過期;
(2) 緩存觸發過期;
系統分割為多個子系統,獨立部署后,不可避免的會遇到會話管理的問題。一般可采用 Session 同步,Cookies,分布式 Session 方式。電商網站一般采用分布式 Session 實現。
再進一步可以根據分布式 Session,建立完善的單點登錄或賬戶管理系統。
流程說明
(1) 用戶第一次登錄時,將會話信息(用戶 Id 和用戶信息),比如以用戶 Id 為 Key,寫入分布式 Session;
(2) 用戶再次登錄時,獲取分布式 Session,是否有會話信息,如果沒有則調到登錄頁;
(3) 一般采用 Cache 中間件實現,建議使用 Redis,因為它有持久化功能,方便分布式 Session 宕機后,可以從持久化存儲中加載會話信息;
(4) 存入會話時,可以設置會話保持的時間,比如 15 分鐘,超過后自動超時;
結合 Cache 中間件,實現的分布式 Session,可以很好的模擬 Session 會話。
大型網站需要存儲海量的數據,為達到海量數據存儲,高可用,高性能一般采用冗余的方式進行系統設計。一般有兩種方式讀寫分離和分庫分表。
讀寫分離:一般解決讀比例遠大于寫比例的場景,可采用一主一備,一主多備或多主多備方式。
本案例在業務拆分的基礎上,結合分庫分表和讀寫分離。如下圖:
(1) 業務拆分后:每個子系統需要單獨的庫;
(2) 如果單獨的庫太大,可以根據業務特性,進行再次分庫,比如商品分類庫,產品庫;
(3) 分庫后,如果表中有數據量很大的,則進行分表,一般可以按照 Id,時間等進行分表;(高級的用法是一致性 Hash)
(4) 在分庫,分表的基礎上,進行讀寫分離;
相關中間件可參考 Cobar(阿里,目前已不在維護),TDDL(阿里),Atlas(奇虎 360),MyCat(在 Cobar 基礎上,國內很多牛人,號稱國內第一開源項目)。
分庫分表后序列的問題,JOIN,事務的問題,會在分庫分表主題分享中,介紹。
將多個子系統公用的功能/模塊,進行抽取,作為公用服務使用。比如本案例的會員子系統就可以抽取為公用的服務。
消息隊列可以解決子系統/模塊之間的耦合,實現異步,高可用,高性能的系統。是分布式系統的標準配置。本案例中,消息隊列主要應用在購物,配送環節。
(1) 用戶下單后,寫入消息隊列,后直接返回客戶端;
(2) 庫存子系統:讀取消息隊列信息,完成減庫存;
(3) 配送子系統:讀取消息隊列信息,進行配送;
目前使用較多的 MQ 有 Active MQ,Rabbit MQ,Zero MQ,MS MQ 等,需要根據具體的業務場景進行選擇。建議可以研究下 Rabbit MQ。
除了以上介紹的業務拆分,應用集群,多級緩存,單點登錄,數據庫集群,服務化,消息隊列外。還有 CDN,反向代理,分布式文件系統,大數據處理等系統。
此處不詳細介紹,大家可以問度娘/Google,有機會的話也可以分享給大家。
關于“大型電商分布式架構是怎樣的”這篇文章的內容就介紹到這里,感謝各位的閱讀!相信大家對“大型電商分布式架構是怎樣的”知識都有一定的了解,大家如果還想學習更多知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。