您好,登錄后才能下訂單哦!
如何解決定位服務器數據丟棄包問題,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
當某個服務器發生數據丟包時,它們肯定是由于某種原因。我們如何來分析為什么數據包丟失。
以下是我們想要了解的情況:
一個數據包進入您計算機的網絡堆棧( RX )(例如在端口 8000 上)。 在端口 8000 對應的應用程序接收之前被丟。
發送一個數據包( TX )。 在它從您的機器發出之前被丟。
本文不關注“數據包在網絡傳輸過程丟了,讓我們用 traceroute / 通過計數 TCP 重傳進行診斷”(雖然這也很重要)!
怎么知道數據包是否被丟棄?
我在 Twitter 上提問,得到了非常有用的答案 “看 netstat -i !”這是我的筆記本電腦上運行得到的結果:
bork@kiwi~> sudo netstat -i Kernel Interface table Iface MTU Met RX-OK RX-ERR RX-DRP RX-OVR TX-OK TX-ERR TX-DRP TX-OVR Flg docker0 1500 0 0 0 0 0 0 0 0 0 BMU enp0s25 1500 0 1235101 0 242 0 745760 0 0 0 BMRU lo 65536 0 21558 0 0 0 21558 0 0 0 LRU nlmon0 3776 0 551262 0 0 0 0 0 0 0 ORU
看起來有一些收到的( RX )數據包在 enp0s25 (我的無線網卡)上丟失了。 但是沒有 TX 包丟失。
有人也告訴我,運行 ethtool -S 會有幫助,但是我的 ethtool 沒有 -S 選項。
怎么知道為什么數據包被丟棄
通過谷歌搜索,發現一個很酷的工具叫 dropwatch 。 沒有現成的 Ubuntu 安裝軟件包,但可以通過 github 下載:
https//github.com/pavel-odintsov/drop_watch
以下是我可以編譯的說明:
sudo apt-get install -y libnl-3-dev libnl-genl-3-dev binutils-dev libreadline6-dev git clone https://github.com/pavel-odintsov/drop_watch cd drop_watch/src vim Makefile # comment out the -Werror argument to gcc make
這里是輸出! 它告訴我哪個內核函數丟失數據包,酷!
sudo ./dropwatch -l kas Initalizing kallsyms db dropwatch> start Enabling monitoring... Kernel monitoring activated. Issue Ctrl-C to stop monitoring 1 drops at tcp_v4_do_rcv+cd (0xffffffff81799bad) 10 drops at tcp_v4_rcv+80 (0xffffffff8179a620) 1 drops at sk_stream_kill_queues+57 (0xffffffff81729ca7) 4 drops at unix_release_sock+20e (0xffffffff817dc94e) 1 drops at igmp_rcv+e1 (0xffffffff817b4c41) 1 drops at igmp_rcv+e1 (0xffffffff817b4c41)
用perf監控丟棄的數據包
還有另一個很酷的方法,用來調試發生什么。
thomas graf 告訴我,可以使用 perf 監視 kfree_skb 事件,這將告訴你什么時候丟棄數據包(內核堆棧發生的地方):
sudo perf record -g -a -e skb:kfree_skb sudo perf script
關于如何解決定位服務器數據丟棄包問題問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。