HPC– tag –
-
【Linux】 ClusterShellを導入して,クラスタ管理を楽にする
【ClusterShellとは】 ClusterShellとは,公式の言葉を借りる(訳す)と「LinuxやBSDで構築されたクラスタ管理を支援する軽量で統一されたコマンド実行用のPythonフレームワーク」です.簡単に説明すると,クラスタの管理を容易にするためのツールです. ... -
Slurmのトラブルシューティング
Slurmのインストールや運用では,しばしばエラーに遭遇します. その度に調査するのは時間がかかるため,遭遇したエラーとその解決内容をまとめておきます. 【トラブルシューティング具体例】 slurmd: error: Node configuration differs from hardware: ... -
【Linux】HPCクラスタにジョブ管理システム(Slurm)を導入
【Slurmとは】 Slurmは,複数のプログラムやタスク(ジョブ)の実行や停止,監視を行うためのソフトウェアであり,いわゆる「ジョブスケジューラ」です. オープンソースソフトウェアということもあり,多くのスパコンでもSlurmが採用されています. 正式...
1