【特集記事】科学技術力を支える研究開発用「コンピュータ」の選び方のハウツー

日本が今後も世界の中で生き残るうえで科学技術力の強化は最も重要な課題とされており、先日発表された来年度(令和4年度)の科学技術関係予算の概算要求額増加からもその必要性の高さがうかがい知れます。

科学技術といっても実にさまざまな分野に分かれておりますが、日本で最も重要とされている分野は大きく8つ、「ライフサイエンス、情報通信、環境、ナノテクノロジー・材料」の科学技術の重点推進4分野と、「エネルギー、製造技術、社会基盤、フロンティア」の科学技術の推進4分野です。そしてこれらのなかに重要な研究開発の課題273と、戦略重点科学技術の課題62が存在し、そのほとんどが私たちの生活に関わっているといえます。

主な研究課題(内閣府)
https://www8.cao.go.jp/cstp/kihon3/kenkyu.html

さてこういった科学技術の課題を解決するためには、研究開発が盛んに行われる環境(土壌)が整っていることが重要です。またこれらの科学技術力を支えるツールのひとつに、頭脳ともいえる「コンピュータ」が必要となるのではないでしょうか。

今回は弊社の 研究用・産業用PCの製作・販売サービス テグシス にお問い合わせをいただく様々な用途のPCの中でも、科学技術用途のPCを選択するうえでのポイントをご紹介したいと思います。

[toc]

 

コンピュータの選定の前に

コンピュータといっても世界に誇る最速のスーパーコンピュータ(以下スパコン)から、標準的なデスクトップやラップトップ、ワークステーション、またはタブレットまで多種多様です。

スパコンといえば3期連続で計算能力が世界一と認められたスパコン「富岳」が紙面を賑わせましたが、理学研究所のホームページでは「普通で高性能」という表現で富岳の特長を説明しています。この「普通で高性能」というのは並大抵ではないことの証明ともいえるのではないでしょうか。特定の用途に対してのみ特化した性能を発揮するのであれば、それのみを追求し続ければいいかもしれませんが、どのようなことに対しても最高パフォーマンスでの成果を出し続けるということはなかなか難しいものです。富岳は臨機応変なオールラウンド型のスパコン、つまり幅広い分野での活用が期待できる強者といえます。

富岳の設計が「普通で高性能」を目指したように、研究開発に必要となるコンピュータの設計の際にも、何をしたいか(どういった結果をどのくらいで得たいか)、どういった処理を行いたいか、または研究開発にかけられる予算はいくらか、といった複合的な課題を慎重かつ柔軟に整理する必要があります。

 

コンピュータの選び方って?

例えば専門的なソフトウェアには動作に必要な条件(※メモリの容量や、ハイエンドなビデオカードの搭載など)がありますが、研究開発においてはそのソフト単独で成果を出したい場合、あるいは別のプログラムを走らせる必要性があるかなど複合的な要素が絡み合うため、一つのソフトウェアの動作要件のみがクリアであればよいという場合ばかりではありません。

まず以下のような項目について情報を整理するとよいでしょう。

コンピュータの設計に必要な情報

  • ご用途、処理内容、ご予算
  • ご要望(高速化、静音性、画質、長時間稼働、今現在のご不満に感じていることなど)
  • 使用ソフトウェア・OS(複数の場合は何を重要視するか)
  • ハードウェア構成のご希望
  • 欲しい機能や性能・インターフェース   など

※弊社はこのような条件に合致したコンピュータを探す手間を省略し、その動作に最適なコンピュータをご提供することを得意としております。

 

コンピュータの設計って?

処理速度(速さ)の面からみますと、CPU、メモリ、ストレージ、ビデオカードなどのいくつかのパーツに着目する必要性があります。ただしそれぞれの性能が複合的に関わってきますし、設置場所や温度などへの配慮も必要となりますので、単体のパーツ単位に目を向けるのではなく、全体のバランスを考えることが重要となります。いくつかの事例をご紹介します。

 

CPUのクロック

intel、AMDといったメーカーを基準としたり、ソフトの仕様面からクロック、コア数などに注意を払う必要があります。

例えば「AMD Threadripper PRO 3995WX 」と「Ryzen Threadripper 3990X」は、CPUコア数は同じ64コアですが、動作クロックを最優先という目的の場合3990Xの選定となります。ただし3995WXの方がメモリチャネル(メモリ帯域)と最大メモリの上限は上位となりますので、メモリを重要視するかしないかでどちらのCPUを選定するかが変わります。

仕様 AMD Threadripper PRO 3995WX Ryzen Threadripper 3990X
CPUコア数 64 64
スレッド数 128 128
基本クロック 2.7GHz 2.9GHz
最大ブースト・クロック 4.2GHz 4.3GHz
メモリチャネル(メモリ帯域) 8ch / DDR4 / Up To 3200MHz 4ch / DDR4 / Up To 3200MHz

またCPUの選定におきまして「コア数をどれだけ確保するか」次第ではありますが、コア数を増やさない方がシングルコア(単コア)の動作速度は速くなる場合もございます。

参考としまして、右図(Adobe Lightroomというソフトウェアのベンチマーク)を一例にあげますと、同アーキテクチャでも64コアより24コアの方がベンチマークが高い事が見てとれます。シングルコア(単コア)が早いRyzen9などは64コアの下にありますので、ある程度コア数が有効であることも示しております。

※詳細はAdobe Lightroom のベンチマークの傾向をご参照ください(こちら)。

 

 

CPUのコア数

バイオインフォマティクス解析、 熱流体解析用、地理情報システム解析、CFD解析、ディープラーニング、深層学習用のコンピュータのご相談をいただく際、「CPUのコア数を多くしたい」といったご要望をいただくことがございます。

コア数重視の場合、並列化によって処理速度を向上させたいという考え方が基本になります。前述の通り、コア数の多いCPUはクロック数が低い傾向にあるため、コア数を優先した結果、かえって処理速度が遅くなってしまう場合があります。そのため、ご希望のコア数に近いCPUの中から、最もクロック数の高いCPUを採用するなど、バランスを考慮したご提案を行っております。

CFD解析用PCのお問い合わせに対してのご提案:

一般的にCFD解析はマルチコアCPUが有効なことが多いため、よりコア数の多いCPUを選択します。

例えば「Xeonを採用し、予算内でできるだけコア数を多くしたい」というご要望に際し、1CPUの性能やクロックを可能な限り高く確保する、CPUのメモリ帯域差による動作影響を考慮したコア数、そのほか計算に影響を及ぼす可能性のあるメモリ容量の最適化や将来の拡張性、コア数が多くなることで心配となる消費電力なども考慮しております。仕様によっては、比較のためいくつかの構成パターンを提示いたします。

なおシングルの計算の場合など、クロック重視で設計いたしますのでご安心ください。

解析用ソフトウェアによって、ライセンス形態によるコア数制限がある場合がございます。マルチコアCPUをご検討の場合は、使用予定のソフトウェア情報をお知らせください。
このほか、コア数の選定に対してご不明な点がございましたらご質問ください。

2006年9月15日(15年前)、弊社ではテガラニュースというメルマガを配信しており、当時の掲載記事「今週のカスタムPC」では、AMD Opteron Dual CPUサーバーを紹介しておりました。この際のCPU選定につきましてもお客様からの「とにかく速いサーバーが欲しい」とのご依頼にお応えしすべくAMD Opteronを利用したDual CPUサーバーをご提案しております。

ちょうどそのころ大手メーカーでも採用が増えOpteron のシェアはかなり伸びており、アーキテクチャ的にSMP仕様向けの設計である、Opteronコアのポリシーが先読みのペナルティを嫌った仕様である、かつ全般的にスピードの落ちにくい設計であるといった点を選定のポイントとしました。

速度の点では当時最新のIntel Coreアーキテクチャも十分に対抗できる能力があるのですが、FB-DIMMの安定度の問題と、サーバーとしてはできるだけ枯れた部分も必要との判断もあり、AMD Opteronとなりました。

かねてより弊社ではお客様のご要望、パーツの評価などを複合的に判断し、マシン設計を行っております。

 

メモリについて

ここ数年の傾向としまして「メモリの大容量化」を求められるケースも増えており、研究開発向けに2TB、3TBものメモリを搭載するマシンのご提案実績もございます。大容量化を希望されるコンピュータの用途は、有限要素法シミュレーション(Comsol)計算用、Synopsys Rsoft FullWave並列計算用マシン、CAE(マルチフィジックス)用マシン、画像処理・画像解析、ディープラーニング用途など幅広いです。

■Comsolの例

Comsolは、科学技術イノベーションを加速する設計、プロセスおよびデバイスをモデル化するためのシミュレーションツールです。構造力学、音響、流体力学、電磁気、熱伝達、化学工学など、多岐に渡る物理的現象を最新の数値解析法に基づいて解を求めますが、それらの計算を素早く行うために最も重要となるスペックはメモリとなります。

What hardware do you recommend for COMSOL Multiphysics
https://www.comsol.jp/support/knowledgebase/866

メモリ選定時にはCPUやマザーボードの選定(物理的に搭載できるメモリ数)にも配慮が必要ですが、搭載するCPUのメモリチャンネルを考慮した構成であったり、ご希望のメモリ容量からCPUを選定したり、あるいはコア数の面で優位となる構成(弊社製Massive Core EX)でのご提案など、お客様の条件にあわせて仕様を決定いたします。

RADIC 2CPUとTEGSTAR Massive Core EXのどちらが速い?(COMSOLの場合)

弊社製PCのベースモデル  Xeon搭載ワークステーション RADIC の「RADIC 2CPU」 と スタンダードPC TEGSTAR の「TEGSTAR Massive Core EX」でCOMSOLを動作させた場合、単純な比較であれば TEGSTAR Massive Core EX のほうが速いです。

ただしご予算100万円となりますと事情が変わります。RADICは構成によってメモリチャネル面で最速にはなっておらず、2CPUの利点であるそれぞれのメモリバスを生かせておりません。メモリチャネルを最大化した場合、後々の物理メモリの増設ができないため、容量を増やす場合にはメモリ交換が必要となります。
このようにメモリ帯域や将来の拡張性についても考慮してまいりますので、ご相談いただければと思います。

■PC-9207 有限要素法シミュレーション用マシン

この他の例としまして、解析に使用するソルバーによってはメモリに対する負荷が高いものがありますので、コンピュータ選定時の絶対条件に「メモリ容量が計算サイズを決めてしまう」といった制限がある場合は、それを大前提としたうえでメモリ容量を選定することになります。
またディープラーニング用途においてビデオメモリ容量以上のメインメモリ容量を確保することを推奨しています。

 

ストレージについて

データを保存するエリアになりますので、取り扱うデータ量で容量を、書き込みや読み込みの速度を求める場合などを考慮しながら選定いたします。
例えば、NGS(次世代シーケンサー)の場合、大量のデータの取り扱いが前提となるため、必然的にストレージの容量はテラ単位と非常に大きな容量を求められることがございます。ストレージ搭載量に物理的な制限が発生する場合もございますため、事前に扱うデータの大きさを設計上で想定することが重要となります。

■ArcGISProやMetashapeの例

ArcGISPro と Metashape の要求スペックは似ています。UAVで撮影した写真など、扱うデータ量は多くなりますし、データ解析も必要となりますのでストレージ速度も重要と考えます。このような場合には速度と容量の両方に配慮し、M.2 SSD(NVMe仕様) を採用しています。

■PC-8962A RTX3090搭載 Metashape用マシン

■海外製品最適化PCの製作サービス – Metashape の例

 

この他の例としまして、画像サイズ自体は大きいものでなくとも、大量の画像を取り扱う(毎日のアクセスが頻繁)場合などは、ランダム性能や書き込み耐性も重要となりますので、U.2接続のNVMe対応製品を選択肢にいれております。マルチタスク時の読み込みや書き込み速度の向上についてもNVMe対応のSSDをご提案しております。

 

ビデオカードについて

ビデオカードの性能が格段に向上したことにより、ビデオカードに重点をおかれるケースも増えております。推論処理用、AI、シミュレーション、ディープラーニング、画像処理、インタラクション機能の研究などで必要とされております。
Quadro、NVIDIA RTX シリーズも定評がございます。またNVIDIA社のTESLAや、AシリーズなどはAIとHPCでも高い人気を誇っております。

なおビデオカードの選定の際には、ビデオカードの種類によって物理的に搭載できる枚数が異なったり、排気の違いがあったり(内排気と外排気モデル)、またパワーがあればその分消費電力も必要となったりと、配慮すべきポイントがいくつかございます。
また昨今の半導体不足の影響もありビデオカードの入手性が不安定な状況にございますし、機種によっては長期供給が難しいものもございます(GeForce はゲーミング用の立ち位置となりますため流通に限りがございます)。選定に迷う場合は、是非お気軽にお問い合わせください。

■LightningChart JSの例

チャートの描画にGPUアクセラレーションが利用されるため、ビデオカードへの依存が大きくなることが考えられます。以下のモデルはチャートの開発からGPUアクセラレーションを含めた動作テストまでを一貫して行えるNVIDIA RTX シリーズ搭載モデルです。

■PC-9033A RTX3080 搭載 LightningChart JS 用マシン

■PC-9033B RTX3060 搭載 LightningChart JS 用マシン

 

この他の例としまして、配信系のZoomやTeamsをご利用なられる際には、GPUアクセラレーションを利用するためGPU負荷がある程度が発生することが考えられますので、ある程度の性能を加味しビデオカードを選定しております。

 

まとめ

【特集記事】STI for SDGsで切り開く国際社会の未来 でもご紹介した通り、これからの社会では科学技術イノベーションが経済再生の原動力となり、科学技術によって未来の社会がよりよく変わる、広がっていくと考えます。そして社会の変化に合わせるかのように研究開発に必要となるコンピュータ事情も進化し続けることでしょう。

ここまでパーツの選定についていくつかのポイントを例にあげましたが、このようにして設計された最適なコンピュータによって研究開発が加速することを切に願っております。
また弊社はオーダーメイドPCの製作サービス「テグシス」のみならず、 研究開発者向け海外製品調達・コンサルティングサービス「ユニポス」というサービスを提供しております。テガラだからこそ可能な、「R&D向け海外製品の購入とその利用に最適化したカスタムPCの製作」というワンストップサービスも展開しております。

弊社では研究開発を加速するお手伝いができるよう、日々コンピュータの設計製造の技術を磨いております。コンピュータの選定のお困りごとがございましたら、ぜひお気軽にご相談ください。

このエントリーをはてなブックマークに追加