HPC– tag –
-
Environment Modulesを導入しよう
Environment Modulesとは スパコンとかでよく使われているツールです。HPCのようなさまざまなアプリケーションがインストールされている環境では、実行時に使用するアプリケーションに適した環境変数を設定しないといけません。特に、機械学習系のTensorFl... -
【Linux】 ClusterShellを導入して,クラスタ管理を楽にする
ClusterShellとは ClusterShellとは,公式の言葉を借りる(訳す)と「LinuxやBSDで構築されたクラスタ管理を支援する軽量で統一されたコマンド実行用のPythonフレームワーク」です.簡単に説明すると,クラスタの管理を容易にするためのツールです. 複数... -
Slurmのトラブルシューティング
Slurmのインストールや運用では,しばしばエラーに遭遇します. その度に調査するのは時間がかかるため,遭遇したエラーとその解決内容をまとめておきます. トラブルシューティング具体例 slurmd: error: Node configuration differs from hardware: ... ... -
【Linux】HPCクラスタにジョブ管理システム(Slurm)を導入
Slurmとは Slurmは,複数のプログラムやタスク(ジョブ)の実行や停止,監視を行うためのソフトウェアであり,いわゆる「ジョブスケジューラ」です. オープンソースソフトウェアということもあり,多くのスパコンでもSlurmが採用されています. 正式名称...
1