您好,登錄后才能下訂單哦!
一、問題現象
最近在某客戶由于假期出現核心CISCO 6509硬件故障當機問題,進而發現F5發布的3個應用訪問問題,出現一部分人訪問應用出現不可用的問題,時好時壞,內網使用F5 GTM+LTM進行域名雙活,內部同城雙活DC通過三層路由使用CISCO的大二層技術OTV+LISP技術構建;
F5上面檢查應用不管是VS還是pool member都是正常,health check or monitor算法采用TCP;通過將LTM雙機上面對端DC業務member 進行offline,GSLB的跨DC member disable解析只導流到主DC,此時業務訪問正常,形成單活進行排查
問題表象是跨DC訪問后業務就訪問異常,但是神奇的是只有部分vlan有問題,大部分跨DC的vlan沒有問題!
通過初步排查,應用人員表示應用無問題,網絡人員表示網絡無問題(可以從主中心ping通備中心應用IP,可以跨DCtelnet通業務應用端口,而且其它vlan沒有問題),F5人員也表示F5日志各方面正常,無異常日志!
二、問題原因
F5人員建議對跨DC訪問的443端口進行直接訪問(不經過F5負載)測試與抓包,檢查數據包通信情況
通過抓包,發現TCP三次握手正常,但是SSL協議握手異常,客戶端發送了client hello之后,服務器端回送了一個1050byte左右的ssl data(非server hello)包且提示前導段丟失!然后接著客戶端FIN掉了連接!
再通過對本DC正常應用訪問抓包,明確SSL協商正常,SSL握手包最多幾百byte,所以這是應用層面的異常問題,并不是簡單的網絡層面的問題
但是否是應用的問題呢,讓應用人員更換一個vlan后,訪問正常!證明并不是應用層面的配置異常問題!很可能是網絡影響應用的一個問題!
鑒于硬件故障當機,路徑變化,應用ssl協議交互數據包大小異常,并提示previos fragment前導段丟失等網絡問題,F5人員建議檢查MTU設置,然后客戶管理人員以及網絡人員才說出之前也出現過MTU問題,讓CISCO TAC進行檢查,通過幾個小時檢查,終于確認是由于CISCO 6509當機導致部分VLAN OTV路徑變換,MTU沒有改為9216字節的MTU導致!
更改后業務訪問正常!
三、解決方法
更換路徑中的OTV MTU后解決,F5相關配置還原,應用測試正常!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。