バイオインフォマティクス向け マシン選定のポイント

バイオインフォマティクスとは

バイオインフォマティクスは、生命科学データをコンピュータ科学と結びつけて解析する専門分野です。
遺伝子、タンパク質、ゲノムなどの生物学的情報を取り扱い、高度な計算手法やアルゴリズムを活用して生物の進化、機能、相互作用、疾患のメカニズムなどの研究に貢献しています。具体的には、医療、農業、環境科学など様々な分野で応用されており、治療法の開発や新たな生物の発見などに繋がっています。

主な解析手法

バイオインフォマティクスには様々な解析手法が存在します。特に注目されるものとしては、タンパク質構造解析とゲノム解析が有名です。どちらも、生物の基本的な機能や相互作用を理解し、疾患メカニズムや進化の仕組みの研究などで利用されています。
タンパク質構造解析は、タンパク質の立体構造を明らかにする手法で、機能や相互作用の研究に用いられます。一方のゲノム解析は、遺伝子配列や遺伝子発現のパターンを解析し、生物の遺伝情報を明らかにすることで、種の関係や遺伝的な特徴の解明などで活用されています。
それぞれの手法における成果は、医療、環境保護、バイオテクノロジーなど多方面での研究開発に貢献しています。

タンパク質構造解析

タンパク質構造解析では、複雑な計算を処理するためにコア数の多いCPUが推奨されます。また、大容量のメモリや大量の解析データの読み書きに対応した高速ストレージ (SSD) の利用も押さえておきたいポイントです。その他、GPU計算に適したビデオカード選定も重要なポイントです。

手法 概要
X線結晶構造解析 結晶化したタンパク質のX線回折データを解析し、構造を決定
NMR (核磁気共鳴) スペクトロスコピー 原子核の共鳴を利用して、タンパク質の構造を解析
コンピューターシミュレーション (モデリング) タンパク質の構造をコンピュータ上でシミュレーション
Cryo-EM (電子顕微鏡法) 冷凍電子顕微鏡を使用してタンパク質の構造を可視化

ゲノム解析

ゲノム解析は非常に多くのデータを処理するため、ハイエンドな多コアCPUの採用が理想です。また、大規模なデータセットを扱う場合には、メモリ容量にも配慮が必要となります。加えて、ゲノムデータは容量が大きいため、ストレージの速度も重要な検討ポイントです。GPU計算は比較ゲノム解析など一部のタスクで利用できる場合がありますので、実施する処理内容や扱うソフトウェアに合わせてご検討ください。

手法 概要
ゲノムシーケンシング DNAの塩基配列を決定する手法
RNA-Seq (トランスクリプトーム解析) RNAの発現量やスプライシングバリアントを解析
チップシーケンス (ChIP-Seq) DNAと結合するタンパク質やエピジェネティック修飾を解析
メタゲノム解析 環境中から採取した微生物のゲノムを解析
比較ゲノム解析 異なる種のゲノムを比較して進化的な特徴を解析

テグシスならソフトウェアのプリインストールもOK!

テグシスなら,ソフトウェアをプリインストールした状態での出荷もOK︕
お客様指定の初期設定作業も承っていますので,お気軽にご相談ください。
以下はソフトウェアに合わせたPC構成の提案事例です。掲載の無いソフトウェアについてもご相談を承っておりますので,
お気軽にお問い合わせください。

代表的なソフトウェアごとのPC提案事例

◆Cell Ranger
事例No.PC-11793 | Cell Ranger・QuPath用ワークステーション

◆QIIME 2
事例No.PC-11132|NGSデータ処理とマルチオミクス解析用マシン

◆QuPath
事例No.PC-11089 | シングルセルRNA-seq解析用マシン (2023年07月版)

◆HISAT2
事例No.PC-10539 | Nextseq2000システムで取得したNGSデータを解析するためのマシン

◆Guppy
事例No.PC-11752 | NVIDIA Geforce RTX4070 Super搭載 ナノポアシーケンサー解析用マシン
事例No.PC-10816 | NGS解析&ナノポアシーケンサー解析用マシン・QuPath

◆AlphaFold2
事例No.PC-10825 | タンパク質結合解析用マシン

Cell Ranger

事例No.PC-11089 | シングルセルRNA-seq解析用マシン (2023年07月版)
使用ソフトウェア Cell Ranger
スペック Core i9-13900KS(8コア+16コア)、メモリ128GB、2TB SSD M.2、16TB HDD S-ATA、NVIDIA T400 4GB MiniDisplayPort x3、タワー型筐体+850W、Ubuntu22.04

参考価格

600,600円

ポイント

ご予算内でのUbuntuマシンをご提案した事例です。メモリは128GBで、用途面での必要性を想定し、SSD+大容量HDDを搭載した構成としています。

Cell Ranger側の推奨スペックは、CPU 16コア+メモリ128GBです。 本構成のメモリ容量は仕様上最大ですので、より多くのメモリが必要となる可能性がある場合にはご相談ください。

QIIME 2

事例No.PC-11132|NGSデータ処理とマルチオミクス解析用マシン
使用ソフトウェア Rパッケージ (WGCNA、 lavaan、 ggplot、 arules、 imagerなど) やigraph、QIIME2
スペック Xeon W5-2465(16コア)、メモリ128GB、500GB SSD M.2、NVIDIA T400 4GB、タワー型筐体+1000W、OSなし

参考価格

779,900円

ポイント 2023年10月時点で最新のXeon W-2400シリーズを搭載した構成です。
メモリ搭載量は128GBとしていますが、空きスロットが4スロットあるため、今後メモリを増設することも可能です。
またお客様の扱うデータ量では、それほど高いGPU性能は要求されないため、ビデオカードはワークステーション向けのエントリーモデルであるNVIDIA T400 4GBを選択しています。GPUはご希望に応じて変更可能です。

QuPath

事例No.PC-11793 | Cell Ranger・QuPath用ワークステーション
使用ソフトウェア Cell Ranger、QuPath
スペック AMD Ryzen Threadripper 7960X(24コア)、メモリ256GB、2TB SSD M.2、NVIDIA T400 4GB MiniDisplayPort x3、タワー型筐体+1000W、Ubuntu22.04、Cell Ranger&QuPathインストール

参考価格

1,029,600円

ポイント

2024年5月時点で最新のAMD Ryzen Threadripper 7000 シリーズの24コアモデルを搭載した構成です。ご提案の時点ではCell RangerとQuPathのGPUアクセラレートへの対応は限定的なため、GPUアクセラレートを使用しない場合は、エントリークラスのビデオカードでも動作に支障はないと考えられます。そのため、ご予算を重視し、GPUアクセラレートの使用は考慮せず、エントリークラスのワークステーション向けビデオカード NVIDIA T400 4GBを選定しています。

HISAT2

事例No.PC-10539 | Nextseq2000システムで取得したNGSデータを解析するためのマシン
使用ソフトウェア HISAT2、Bowtie2、samtools、BLAST、Velvet
スペック Xeon Gold 6338(32コア)、メモリ512GB、2TB SSD M.2、onboardビデオ(VGA x1)、タワー型筐体+850W、Ubuntu22.04

参考価格

2,015,200円

ポイント Nextseq2000システムで取得したNGSデータを解析するためのマシン構成例です。お客様の希望される「Intel Xeon 24コア以上x2基」のCPUコア数を満たす構成でご提案しています。第3世代Xeon Scalableは、メモリチャンネルが8ですので、ご要望の768GBを超える容量で最適な構成とした場合、1TBを選択する必要があります。しかし、その場合には予算を大幅に超過してしまうため、ひとまずご希望よりも少ない容量でモジュール構成を最適化した512GBをご提案し、スペックと価格感をご確認いただく流れとしました。

Guppy

事例No.PC-11752 | NVIDIA Geforce RTX4070 Super搭載 ナノポアシーケンサー解析用マシン
使用ソフトウェア MiniKNOW、Guppy
スペック Xeon W5-2445(10コア)、メモリ64GB、2TB SSD S-ATAx2、Geforce RTX4070 super、ミドルタワー+850W、Windows 11+Ubuntu20.04(デュアルブート設定)

参考価格

806,300円

ポイント MinION Mk1Bを使用して名のポアシーケンサー解析を行うためのマシン構成です。
MinION Mk1Bのシステム要件はメーカー公式サイトで公開されているため、ご予算の範囲内で推奨要件を満たす構成をご提案しました。MinION Mk1Bでの計算上重要となるビデオカードは、2024/1/17に発売された新製品のNVIDIA Geforce RTX4070 Superとしています。7,168基のCUDAコア、56基のRTコア、および224基のTensorコアを搭載し、ご予算内に収まるビデオカードの中では高いコストパフォーマンスが期待できます。
事例No.PC-10816 | NGS解析&ナノポアシーケンサー解析用マシン
使用ソフトウェア Guppy、MaSuRCA
スペック AMD Ryzen9 7950X(16コア)、メモリ64GB、2TB SSD S-ATA、Geforce RTX3060、ミドルタワー+850W、Ubuntu20.04

参考価格

520,410円

ポイント MaSuRCAの公式リポジトリに掲載された動作要件のBacteriaとInsectの中間程度のスペックとして提案した構成です。OSはUbuntu20.04のみをインストールする想定ですが、お客様からはWSL2(Windows Subsystem for Linux2)でのUbuntu利用をご相談をご相談をいただいています。WSLは仮想マシンであるため、仮想化によるオーバーヘッドが生じます。Windowsを用意しなければならない理由が他にない場合は、Ubuntuをネイディ部に動作させる形を推奨することをお伝えしています。また、別の選択肢として、WindowsとUbuntuのデュアルブート環境についてもご提案しました。

AlphaFold2

事例No.PC-10825 | タンパク質結合解析用マシン
使用ソフトウェア

構造予測…AlphaFold2
ドッキング…autodock (GNINA) / ucsf-dock
量子計算…GAMESS / firefly
MD…GROMACS 2022.4

スペック Xeon Gold 6326 (16コア) x2、メモリ256GB、2TB SSD S-ATA、4TB SSD M.2、Geforce RTX4080 x2、タワー型+1600W、なし

参考価格

2,196,700円

ポイント

GAMESS以外は何らかの形でGPUを利用することができますが、CPUで処理を行う部分も相応にあるため、CPUとGPUのバランスを考える必要があります。

AlphaFold2はGPUを必要とするソフトウェアで、かつ2.2TBほどの巨大なデータベースを参照するため、ストレージ性能がパフォーマンスに大きく影響します。2ndストレージとして搭載している大容量のSSDはAlphaFold2のデータベース保存を想定したものです。

なお、AlphaFold2とそれ以外のソフトウェアでは、GPUの使われ方が異なり、AlphaFold2はTensorflowを基盤としたDeepLearningになりますが、他のソフトはGPUをコアプロセッサとした科学計算です。
科学計算ではGPGPUに倍精度小数点演算 (fp64) を求められることがありますが、非常に高額で専用筐体が必要になります。 利用を想定しているソフトウェアは、いずれもfp64が必須ではなくCUDAに対応したNVIDIA製GPUであれば利用可能とされているため、搭載GPUはディスプレイ出力を兼ねたビデオカードを選択しています。