DGX Sparkを外部GPU計算資源として利用する検証

DGX Sparkを外部GPU計算資源として利用する検証

Slurm経由GROMACS計算の実測比較

はじめに

近年、分子動力学 (MD) や第一原理計算をはじめとする計算科学の分野では、GPU を利用した高速化が一般化しています。しかし、研究現場では計算需要が増え続ける一方で、「常に最大性能の計算機を手元に用意する」ことは、コスト・運用の両面で現実的でないケースも多くあります。

そのため、手元の計算環境とクラウド等の外部リソースを組み合わせて活用する方法が重要になります。

本記事では、AI 学習・推論用途として知られる NVIDIA DGX Spark を計算科学向けの外部 GPU 計算ノードとして利用するケースを取り上げます。別端末の Linux 環境から Slurm を介してジョブを投⼊し、分子動力学ソフトウェア GROMACS を用いた CPU/GPU 計算の挙動と性能を測定しました。

本検証を通じて、DGX Spark を研究用途の計算インフラとして組み込む際の可能性と制約を整理します。

検証の背景

NVIDIA DGX Spark は AI 学習・推論向けに設計されたシステムであり、分子動力学や第一原理計算など、いわゆる「計算科学用途」は想定されたターゲットではありません。しかし、GPU の高い並列演算性能を活用する点では両者に共通点があります。
そこで今回は、DGX Spark をあえて分子動力学計算に使用した場合の、

  • 実際の性能
  • 運用上の挙動
  • 外部 GPU ノードとしての扱いやすさ

を確認することを目的としました。
特に、Slurm を使ったジョブ投入によって、研究室の共有 GPU リソースとして運用できるかどうかも評価しました。

検証構成

管理ノード (仮想環境の Ubuntu) と、計算ノードとしての DGX Spark を用意し、Slurm でジョブ管理を行いました。GROMACS の標準ベンチマーク (water system) を対象に計算を実行しています。
比較条件は以下の 3 つです。

  • DGX Spark:CPU のみで計算
  • DGX Spark:GPU を利用した計算
  • RTX PRO 4000 ×2 搭載ワークステーションでの GPU 計算

いずれも同じ入力データ・ステップ数を使用し、Wall time と Performance (ns/day) を比較しました。

計算に用いたワークステーション構成

実測結果の概要

計算ログから得られた主な性能は以下の通りです。

  • DGX Spark (CPU計算)
    約 7.7 ns/day, Wall time 約 110 秒
  • DGX Spark (GPU計算)
    約 56 ns/day, Wall time 約 15 秒
  • RTX PRO 4000 ×2 (ワークステーション)
    約 99 ns/day, Wall time 約 9 秒

GROMACS の性能指標として重要な Performance (ns/day) は、「1 日あたりにどれだけのシミュレーション時間を進められるか」を示す指標で、この値が高いほど高速です。一方 Wall time は実行にかかった実時間で、値が短いほど処理が速いことを意味します。

今回の結果では、DGX Spark の GPU 計算は CPU 計算と比べて 7 倍以上高速 であり、計算時間も大幅に短縮されました。このことから、DGX Sparkにおいて、GPU 利用による分子動力学計算の実行効率が大きく改善されていることが確認できました。

また、RTX PRO 4000 を2枚搭載したGPU ワークステーションではさらに高い性能が得られ、複数 GPU と MPI 並列の組み合わせにより、単一 GPU を上回るスループットが達成されています。

結果の解釈

DGX Spark では GPU を利用することで、GROMACS 計算の処理速度が大きく向上しました。ログからも計算の進行速度が明らかに改善していることが確認できます。

一方、多 GPU 構成のワークステーションと比較すると、DGX Spark の性能はやや劣ります。これは GPU 数や並列化方式の違いによるものです。しかし、エントリークラスの計算では十分に実用的な性能を示しました。

さらに、Slurm を介したジョブ投入・実行は安定しており、DGX Spark を外部 GPU ノードとして運用できることも確認できました。既存環境への追加 GPU リソースとして組み込む運用は十分に可能です。

注意点と制約

今回の構成で特筆すべき点として、DGX Spark の CPU が ARM アーキテクチャ であることが挙げられます。研究用途で一般的な x86_64 (Intel/AMD) とは命令セットが異なるため、ARM 非対応のソフトウェアは実行できません。

そのため、DGX Spark を計算用途で使用する際は、対象ソフトウェアが ARM に対応しているかを事前に確認する必要があります。

今回は GROMACS の ARM 対応を確認したうえで検証を行いました。

まとめ

本検証により、NVIDIA DGX Spark は AI 向けに設計されたシステムでありながら、解析用途でも外部 GPU 計算資源として利用可能であることが確認できました。Slurm の管理下に組み込むことで、既存環境から柔軟に GPU 計算を実行できます。

主なポイントは以下の通りです。

  • DGX Spark を解析用途の GPU として利用しても、今回の条件下では十分な性能が得られる
  • Slurm を介したジョブ投入が可能で、GPU 共有リソースとして運用することでコスト削減が期待できる
  • この外部 GPU ノード構成は、解析だけでなく AI 学習・推論用途にも応用できる

テグシスでは、解析用途と AI 用途の両面を踏まえた GPU 計算環境の設計・構築を支援しています。
DGX Spark を含むシステム導入や運用方法についても、ご相談をいつでも承っていますので、お気軽にお問い合わせください。

関連情報

DGX Spark 導入支援サービス ロボティクス関連製品のご紹介 -NVIDIA Three Computers構想-
NVIDIA DGX Sparkのご紹介 Jetson AGX Thorの導入のご紹介

 

ワークステーション導入のご相談はお気軽に!

研究用・産業用PCの製作・販売サービス TEGSYS – テグシス

width="340"

お問い合わせ

このエントリーをはてなブックマークに追加