皆さん、こんにちは! HPC環境において、Slurmは計算資源の管理に欠かせないツールですが、ジョブの投入が無秩序に行われると、システムの効率性や利用者間の公平性が損なわれることがあります。 今回は、このような問題を解消し、Slurmクラスターを最大限に…
皆さん、こんにちは! HPC環境において、Slurmは計算資源の管理に不可欠なツールですが、ジョブの投入が無制限に行われると、システムの安定性や利用者間の公平性が損なわれることがあります。 今回は、このような問題を未然に防ぎ、Slurmクラスターを効率的…
皆さん、こんにちは! 高性能計算(HPC)環境において、Slurmクラスタは多くの研究機関や企業で利用されています。 しかし、使用率が高いクラスタでは、ご自身のジョブがいつ実行開始されるか、また長時間かかるプログラムがいつ終了するのか、気になったこ…
皆さん、こんにちは! HPC環境で計算を行う際、「環境構築が大変」「依存関係の衝突に悩まされる」といった経験はありませんか? そんな悩みを解決してくれる強力なツールがコンテナです。 今回は、Slurm環境でコンテナ(ApptainerとDocker)をどのように活…
皆さん、こんにちは! Gitを使っていて「重たいファイル」の管理に困っていませんか?リポジトリが肥大化して、クローンやプッシュが遅い…そんな悩みを解決するのが「Git LFS(Large File Storage)」と「AWS S3連携」です。 Git LFSとは? Git LFSは、サイ…
皆さん、こんにちは! 前回は最新バージョンのSlurm 25.05のの環境構築をご紹介しました。 Slurm 25.05をソースからインストール(Rocky Linux 9.6 マルチノード構成) 今回は、Slurm 25 をRocky9のマルチノード環境にインストールした際のリソース制限の動…
皆さん、こんにちは! 今回は、最新バージョンのSlurm 25.05をRocky Linux 9.6環境にソースコードからインストールする手順をご紹介します。 コントローラー(Slurm Controller+DBD、以下CONTROLLER+DBD)と計算ノード(Slurm Computer、以下COMPUTER)か…