バイオインフォマティクス向け マシン選定のポイント

バイオインフォマティクスとは

バイオインフォマティクスは、生命科学データをコンピュータ科学と結びつけて解析する専門分野です。
遺伝子、タンパク質、ゲノムなどの生物学的情報を取り扱い、高度な計算手法やアルゴリズムを活用して生物の進化、機能、相互作用、疾患のメカニズムなどの研究に貢献しています。具体的には、医療、農業、環境科学など様々な分野で応用されており、治療法の開発や新たな生物の発見などに繋がっています。

主な解析手法

バイオインフォマティクスには様々な解析手法が存在します。特に注目されるものとしては、タンパク質構造解析とゲノム解析が有名です。どちらも、生物の基本的な機能や相互作用を理解し、疾患メカニズムや進化の仕組みの研究などで利用されています。
タンパク質構造解析は、タンパク質の立体構造を明らかにする手法で、機能や相互作用の研究に用いられます。一方のゲノム解析は、遺伝子配列や遺伝子発現のパターンを解析し、生物の遺伝情報を明らかにすることで、種の関係や遺伝的な特徴の解明などで活用されています。
それぞれの手法における成果は、医療、環境保護、バイオテクノロジーなど多方面での研究開発に貢献しています。

タンパク質構造解析

タンパク質構造解析では、複雑な計算を処理するためにコア数の多いCPUが推奨されます。また、大容量のメモリや大量の解析データの読み書きに対応した高速ストレージ (SSD) の利用も押さえておきたいポイントです。その他、GPU計算に適したビデオカード選定も重要なポイントです。

手法 概要
X線結晶構造解析 結晶化したタンパク質のX線回折データを解析し、構造を決定
NMR (核磁気共鳴) スペクトロスコピー 原子核の共鳴を利用して、タンパク質の構造を解析
コンピューターシミュレーション (モデリング) タンパク質の構造をコンピュータ上でシミュレーション
Cryo-EM (電子顕微鏡法) 冷凍電子顕微鏡を使用してタンパク質の構造を可視化

ゲノム解析

ゲノム解析は非常に多くのデータを処理するため、ハイエンドな多コアCPUの採用が理想です。また、大規模なデータセットを扱う場合には、メモリ容量にも配慮が必要となります。加えて、ゲノムデータは容量が大きいため、ストレージの速度も重要な検討ポイントです。GPU計算は比較ゲノム解析など一部のタスクで利用できる場合がありますので、実施する処理内容や扱うソフトウェアに合わせてご検討ください。

手法 概要
ゲノムシーケンシング DNAの塩基配列を決定する手法
RNA-Seq (トランスクリプトーム解析) RNAの発現量やスプライシングバリアントを解析
チップシーケンス (ChIP-Seq) DNAと結合するタンパク質やエピジェネティック修飾を解析
メタゲノム解析 環境中から採取した微生物のゲノムを解析
比較ゲノム解析 異なる種のゲノムを比較して進化的な特徴を解析

主要ソフトウェアと求められるPCスペック

バイオインフォマティクス解析に用いるPCやワークステーションは、一般的に一定以上のスペック水準が要求されます。
解析に用いられる各手法は複雑な計算を必要とする場合が多いため、並列計算に優位性のある多コアCPUが有利です。また、ゲノムアセンブリやメタゲノム解析などでは大規模なデータセットを扱うことも珍しくありませんので、データの一時保持や高速処理に対応できる大容量のメモリも選定ポイントの1つでしょう。その他、タンパク質構造解析や一部のソフトウェアにおいては、GPUを用いた高速計算も視野に入ります。

以下はバイオインフォマティクス解析で利用される主要なソフトウェアとPCスペックの目安です。実際の計算内容やソフトウェアのバージョン等によって必要なPCスペックは変動しますので、ご注意ください。

タンパク質構造解析の主要ソフトウェア

ソフトウェア 用途 推奨PCスペック

AlphaFold2

タンパク質構造の予測 高性能CPU、GPU(NVIDIA)

ColabFold

タンパク質構造の予測(クラウド) インターネット接続、GPU

RoseTTAFold

タンパク質構造の予測 高性能CPU、GPU(NVIDIA)

MODELLER

タンパク質モデリング 中程度のCPU、メモリ

PyMOL

タンパク質構造の可視化 中程度のCPU、グラフィックス

ゲノム解析の主要ソフトウェア

ソフトウェア 用途 推奨PCスペック
Guppy ゲノムシーケンシングデータのベースコール 中程度のCPU、メモリ
HMMER 配列相同性検索 中程度のCPU、メモリ

MetaWRAP

メタゲノム解析 高性能CPU、メモリ

BLAST

配列相同性検索 中程度のCPU、メモリ

BWA

ゲノムアラインメント 中程度のCPU、メモリ

HISAT2

RNA-Seqデータのアラインメント 中程度のCPU、メモリ

テグシスの提案事例 -バイオインフォマティクス解析-

テグシスではバイオインフォマティクス解析を用いた研究開発に携わるお客様へ、多数のPC構成をご提案した実績がございます。
以下はその代表的な事例ですが、WEBに掲載のない用途・構成でもお気軽にご相談ください。
長年の実績から、最適な構成をご提案します。

PC-11089
シングルセルRNA-seq解析用マシン (2023年07月版)
予算60万円
Cell Rangerの利用を目的とした解析マシンの構成例。予算60万円の範囲で、ご希望条件の「メモリ128GB以上」を実現しつつ、用途面での必要性を考慮してSSD+大容量HDDをご提案。
PC-11009
Omics解析用マシン
予算65万円
Omics解析専用PCとしての構成例。CPUでの処理を前提に、コア数やTurboBoost値を考慮してCore i9-13900Kを採用。
PC-10347A
ナノポアシーケンサー解析用マシン (2CPU仕様)
予算100万円

ナノポアシーケンサー解析を目的としたマシン構成例。2CPU構成の利点を生かした並列処理性能が特長。また、最大で2TBまでのメモリ搭載に対応。

PC-10803
ショットガンメタゲノム解析用マシン
予算150万円
ショットガンメタゲノム解析とAIを用いたMRI画像解析を目的としたマシンの構成例。CPUコア数を重視したスペック。
PC-11005
ナノポアシーケンサー解析用マシン (2023年05月版)
予算150万円
ナノポアシーケンサー解析の他、DeepVariantの利用を想定した構成例。CPUには、コア数とクロックの性能が高いAMD Ryzen ThreadripperPROを採用。
PC-10825
タンパク質結合解析用マシン
予算220万円
アカデミックフリーのツールを用いたタンパク質・低分子化合物の結合解析を行うマシンの構成例。AlphaFold2をローカルで構築できるスペックとしてのご提案。