91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么在Linux系統上安裝slurm來監控網絡帶寬和控制節點

發布時間:2021-08-05 18:24:03 來源:億速云 閱讀:253 作者:chen 欄目:系統運維

這篇文章主要講解了“怎么在Linux系統上安裝slurm來監控網絡帶寬和控制節點”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“怎么在Linux系統上安裝slurm來監控網絡帶寬和控制節點”吧!

SLURM 是一個類似 Sun Grid Engine (SGE) 的開源分布式資源管理軟件,用于超級計算機和大型計算節點集群,可高度伸縮和容錯。SUN 被賣給 Oracle 后,好用的 SGE 變成 Oracle Grid Engine 并且從 6.2u6 版本開始成為商業軟件了(可以免費使用90天),所以我們不得不另尋其他的開源替代方案,SLURM 是上次在德班高性能會議的時候一位陌生人介紹的,聽上去不錯。
SLURM 通過一對冗余集群控制節點(冗余是可選的)來管理集群計算節點,是由一個名為 slurmctld 的管理守護程序實現的,slurmctld 提供了對計算資源的監視、分配和管理,并將進入的作業序列映射和分發到各個計算節點上。每個計算節點也有一個守護程序 slurmd,slurmd 管理在其上運行的節點,監視節點上運行的任務、接受來自控制節點的請求和工作、將工作映射到節點內部等等。圖示如下:
怎么在Linux系統上安裝slurm來監控網絡帶寬和控制節點

監控帶寬

代碼如下:


$ apt-get install slurm


它會用字符來顯示文本圖形。
例如:

代碼如下:


$ slurm -i <interface>
$ slurm -i eth2


怎么在Linux系統上安裝slurm來監控網絡帶寬和控制節點

選項
按 l 顯示 lx/tx 指示燈.
按 c 切換到經典模式.
按 r 刷新屏幕.
按 q 退出.

控制節點
在控制節點和計算結點分別安裝 slurm 包,這個包里面既含有控制節點需要的 slurmctld 也含有計算結點需要的 slurmd:

代碼如下:


# apt-get install slurm-llnl


控制節點和計算結點之間需要通信,通信就需要認證,slurm 支持兩種認證方式:Brent Chun&rsquo;s 的 authd 和 LLNL 的 MUNGE,MUNGE 是專為高性能集群計算打造的,這里我們選用 MUNGE,生成 key 后啟動 munge 認證服務:

代碼如下:


# /usr/sbin/create-munge-key
Generating a pseudo-random key using /dev/urandom completed.
# /etc/init.d/munge start


使用 SLURM Version 2.3 Configuration Tool 在線配置工具生成配置文件,然后把配置文件拷貝控制節點以及各個計算結點的 /etc/slurm-llnl/slurm.conf(是的,控制節點和計算結點使用同一個配置文件)。
有了配置文件和啟動了 munge 服務后就可以在控制節點啟動 slurmctld 服務了:

代碼如下:


# /etc/init.d/slurm-llnl start
* Starting slurm central management daemon slurmctld         [ OK ]


把控制節點生成的 munge.key 拷貝到各個計算結點:

代碼如下:


# scp /etc/munge/munge.key ubuntu@slurm01:/etc/munge/


登陸計算節點后啟動 munge 服務(注意需要改變 munge.key 的 owner 和 group 為 munge,否則會啟動失敗)和 slurmd 服務:

代碼如下:


# ssh ubuntu@slurm01
# chown munge:munge munge.key
# /etc/init.d/munge start
* Starting MUNGE munged                        [ OK ]
# slurmd


在控制節點上(slurm00)測試一下是否順利連接到計算結點(slurm01),并且簡單運行一個程序 /bin/hostname 看看效果吧:

代碼如下:


# sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
debug*       up   infinite      1   idle slurm01
# srun -N1 /bin/hostname
slurm01

感謝各位的閱讀,以上就是“怎么在Linux系統上安裝slurm來監控網絡帶寬和控制節點”的內容了,經過本文的學習后,相信大家對怎么在Linux系統上安裝slurm來監控網絡帶寬和控制節點這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

望奎县| 天峻县| 星座| 新绛县| 安吉县| 息烽县| 巴彦淖尔市| 古蔺县| 双柏县| 嘉禾县| 白城市| 太湖县| 子洲县| 濉溪县| 时尚| 漯河市| 石楼县| 金昌市| 常山县| 乌鲁木齐县| 济宁市| 辽阳县| 湘阴县| 梁河县| 集贤县| 永安市| 布拖县| 甘谷县| SHOW| 香港| 北票市| 麻城市| 新干县| 泰来县| 赤城县| 康保县| 岳池县| 襄樊市| 石城县| 迭部县| 政和县|