您好,登錄后才能下訂單哦!
本篇內容介紹了“TCP全連接隊列是什么”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
今天有個小伙伴跑過來告訴我有個奇怪的問題需要協助下,問題確實也很奇怪。客戶端調用RT比較高并伴隨著間歇性異常Connection reset出現,而服務端CPU 、線程棧等看起來貌似都很正常,而且服務端的RT很短。
這里先說下結果: 因為TCP全連接隊列太小導致的連接被丟棄,因為項目使用Spring Boot 內置的Tomcat,而默認accept-count是100,而這個參數在這里就代表了全連接隊列大小。所以在請求波峰的時候全連接隊列被打滿導致有連接丟棄。所以我們調整server.tomcat.accept-count這個參數解決了問題。
好了為了知其然知其所以然,從異常信息來看可能是TCP連接出現了什么問題,其中重點就是半連接隊列和全連接隊列。下面就來看看什么是TCP 半連接隊列和全連接隊列,其為什么會出現這種奇怪的現象。
TCP三次握手時,Linux內核會維護兩個隊列:
半連接隊列,被稱為SYN隊列
全連接隊列,被稱為 accept隊列
老生常談,還要從大家都熟悉TCP三次握手說起,來看一張圖:
1、客戶端發送SYN包,并進入SYN_SENT狀態
2、服務端接收到數據包將相關信息放入半連接隊列(SYN 隊列),并返回SYC+ACK包給客戶端。
3、服務端接收客戶端ACK數據包,這時如果全連接隊列(accept 隊列)沒滿,就會從半連接隊列里面將數據取出來放入全連接隊列,等待應用使用,當隊列已滿就會跟據tcp_abort_on_overflow配置執行策略。
這里半連接隊列(SYN 隊列)和全連接隊列(accept 隊列)就是重點了。
當查詢問題的時候,我們就需要查看全連接隊列的狀態。服務端我們可以使用 ss 命令進行查看,ss 命令獲取數據又分為LISTEN 狀態,和非LISTEN 狀態。
LISTEN 狀態下數據:
# -l 顯示正在Listener 的socket # -n 不解析服務名稱 # -t 只顯示tcp # Recv-Q 完成三次握手并等待服務端 accept() 的 TCP 全連接總數, # Send-Q 全連接隊列大小 [root@server ~]# ss -lnt |grep 6080 State Recv-Q Send-Q Local Address:Port Peer Address:Port LISTEN 0 100 :::6080 :::*
非LISTEN 狀態下數據:
# Recv-Q 已收到但未被應用進程讀取的字節數 # Send-Q 已發送但未收到確認的字節數 [root@server ~]# ss -nt |grep 6080 State Recv-Q Send-Q Local Address:Port Peer Address:Port ESTAB 0 433 :::6080 :::*
當有大量請求進入,如果TCP全連接隊列過小的話就會出現全連接隊列溢出,當出現全連接隊列溢出現象的時候,后續的請求就會被丟棄,就會出現服務請求數量上不去的現象。
前面提到在TCP三次握手的最后一步,當全連接隊列已滿就會根據tcp_abort_on_overflow策略進行處理。Linux 可通過 /proc/sys/net/ipv4/tcp_abort_on_overflow 進行配置。
當tcp_abort_on_overflow=0,服務accept 隊列滿了,客戶端發來ack,服務端直接丟棄該ACK,此時服務端處于【syn_rcvd】的狀態,客戶端處于【established】的狀態。在該狀態下會有一個定時器重傳服務端 SYN/ACK 給客戶端(不超過 /proc/sys/net/ipv4/tcp_synack_retries 指定的次數,Linux下默認5)。超過后,服務器不在重傳,后續也不會有任何動作。如果此時客戶端發送數據過來,服務端會返回RST。(這也就是我們的異常原因了)
當tcp_abort_on_overflow=1,服務端accept隊列滿了,客戶端發來ack,服務端直接返回RST通知client,表示廢掉這個握手過程和這個連接,client會報connection reset by peer。
命令查詢,我們可以根據TCP 的握手特性來看:
[root@server ~] netstat -s | egrep "listen|LISTEN" 7102 times the listen queue of a socket overflowed 全連接隊列溢出的次數 7102 SYNs to LISTEN sockets ignored 表示半連接隊列溢出次數 710 2times表示全連接隊列溢出的次數,隔幾秒查詢一次,如果這個數字一直在遞增,說明全連接隊列出現了溢出的狀態
全連接隊列大小取決于backlog 和somaxconn 的最小值,也就是 min(backlog,somaxconn)
somaxconn 是Linux內核參數,默認128,可通過/proc/sys/net/core/somaxconn進行配置
backlog是 listen(int sockfd,int backlog)函數中的參數backlog,Tomcat 默認100,Nginx 默認511.
半連接隊列的長度可以通過 /proc/sys/net/ipv4/tcp_max_syn_backlog來設置.os層面,只能設一個,由所有程序共享)
半連接,也就是服務端處于SYN_RECV狀態的TCP連接,這種狀態的都在半連接隊列,因此可以使用如下命令進行計算:
#查看半連接隊列 [root@server ~] netstat -natp | grep SYN_RECV | wc -l 233 #表示半連接狀態的TCP連接有233個
“TCP全連接隊列是什么”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。