模倣学習におけるGPU性能と計算速度の比較

最近、注目されている模倣学習は、ロボットに人間の動きを教え込む手法です。
模倣学習のプロセスには、データ収集からモデル学習の実行まで膨大な時間を要し、学習スピードはPCスペックに大きく依存します。
とりわけ、GPUの性能が学習時間の短縮においてもっとも重要な要素です。
したがって、模倣学習の学習スピードを向上させるには、最適なPCスペックを選定することが不可欠といえます。

本記事では、GPU性能差が模倣学習の学習スピードに与える影響を検証するため、Trossen RoboticsのALOHA Kit を使った模倣学習において、「ノートPC (RTX 4060搭載) 」と「デスクトップPC (RTX 5090搭載) 」それぞれの学習速度を比較しました。

ALOHA Kitってなに?

Trossen Roboticsが開発した ALOHA Kit は、模倣学習を目的としたのロボットアームセットです。
人間がロボットを直接動かしてデータ (エピソード) を集め、そのデータを基にロボットがタスクを学習するという一連のプロセスを簡単に試すことができます。

このキットには、操作用の「リーダーアーム」と、模倣する「フォロワーアーム」、さらに2台のインテルRealSenseカメラ (High Camera、Wrist Camera) が付属しています。
 本記事では、ALOHA Solo に相当する組合せを使って検証を行いました。

 

◆ 関連情報:ALOHA ロボットシステムのカスタマイズ・組み立て・現地設置
ALOHA Kitの組み立て・カスタマイズ・現地設置サポートのサービス事例です。

◆ 関連情報:Stationary AI | Trossen 両手遠隔操作 オープンソース ALOHA
ALOHA Kitは弊社ユニポス事業部にて取り扱いがございます

検証内容

 使用機材 (共通環境)

  •  リーダーアーム ×1
  •  フォロワーアーム ×1
  •  D405カメラ ×2 (ハイカメラ×1、リストカメラ×1)
  •  収集エピソード数:50

 比較対象

以下のコンピュータを使い、模倣学習の学習速度を比較しました。

  1. System76製ノートPC …RTX 4060搭載 (GPU RAM:8GB)
  2. デスクトップPC…RTX 5090搭載 (GPU RAM:32GB)

System76社製ノートPCは、エンジニアリング、データサイエンス、ソフトウェア開発に理想的な開発環境を備えています。 最新のプロセッサ、グラフィックカード、ストレージオプションを搭載し、重い作業負荷でも快適に動作。 アルミニウムボディやバックライトキーボード、HiDPIディスプレイなどの高品質なデザインが特徴です。

参考:System76製ノートPC | 開発者向け 高性能ラップトップ  ※海外製品調達・コンサルテーションサービス ユニポスに飛びます

学習条件

  • 推奨パラメータを適用
  • 同一設定で学習時間を計測

※学習パラメータは下記の推奨値を使用しています

Policy Class KL Weight Chunk Size Batch Size Num of Epochs Leaning Rate
ACT 10 100 2 3000 1e-5

結果

学習時間

 System76製ノートPC (RTX 4060搭載) と比較して、デスクトップPC (RTX 5090搭載) では 約3倍 の速さで学習処理が完了しました。

各バッチサイズのGPUメモリ使用量

  • バッチサイズ2: 約4GB使用
  • バッチサイズ8: 約8GB使用
  • バッチサイズ16: 約14GB使用

考察

VRAMについて

バッチサイズを大きくすると、それに応じてGPUメモリ (VRAM) の使用量も増加します。
例えば、バッチサイズ16の場合、約14GBのメモリを消費します。

ただし、バッチサイズが同じでも、モデルの大きさや入力データの解像度、長さ、使用するオプティマイザ (学習の設定) によって必要なビデオメモリ量は変わります。
また、メモリに余裕があるからと言って、単純にバッチサイズを大きくすると、勾配ノイズの増加や学習率とのズレにより学習が不安定になったり、OOM (Out of Memory = メモリ不足) エラーで失敗するリスクがあります。そのため、まずはバッチサイズを小さめに設定 (例:4~8)し、メモリ使用量と学習の安定性を確認しながら徐々に増やして「ちょうどよい」値を見つけるのが理想的です。

 GPUの処理能力について

今回の検証では、ハイスペックなGPUを搭載したデスクトップPC (RTX 5090) が、ローエンドなノートPC (RTX 4060) に比べて圧倒的に速く学習処理を完了しました。学習時間のみを見た場合、GPUの性能差が学習速度に直結すると考えられます。

特にRTX 5090は、単精度演算性能、CUDAコア数、VRAM容量など、すべての面でRTX 4060に対して大きなアドバンテージを持っています。機械学習やデータ解析における、ハイスペックGPUを搭載したデスクトップPCの効果を示しています。

模倣学習をはじめとして、高度な演算が必要となる領域では、GPU性能の重要性がますます大きくなることでしょう。

 ノートPCを選ぶメリット

一方、ノートPCは「持ち運び可能」という大きな利点があります。
例えば、移動を前提としたロボット (例:Mobile ALOHA) に学習処理を組み込みたい場合、デスクトップよりもノートPCが実用的です。
そのため、すべてのシーンにおいて「高性能なデスクトップPCが最適」ではなく、用途や運用スタイルに応じて適したコンピュータを選択しましょう。

まとめ

模倣学習における計算環境選びでは、以下の3点のバランスを考慮することが重要です。

  • 計算速度
  • GPUメモリ容量
  • ポータビリティ (携帯性)

エピソードの収集用PCと、学習用ワークステーションを分けて運用することもあり、お客様それぞれの運用方法や付随する条件に応じて柔軟に検討・判断する必要があります。

テガラ株式会社では、模倣学習・機械学習用途に応じた最適なPC構成をご提案可能です。
 ご希望やご予算に合わせたカスタマイズも承りますので、ぜひお気軽にご相談ください!

このエントリーをはてなブックマークに追加