- 事例No.PC-11242
-
参考価格:
2,528,900円生物学向け大規模言語モデルの学習用マシン
用途:生物学向け大規模言語モデル (ProteinBERT、 ChemBERTa、 HyenaDNAなど) の学習お客さまからのご相談内容
生物学向け大規模言語モデルの学習用マシンの導入を検討している。
ProteinBERT、 ChemBERTa、 HyenaDNAといった生物学で用いられる大規模言語モデルを事前学習から実行したいと考えている。ProteinBERTはNvidia Quadro RTX 5000、ChemBERTaはNVIDIA Tesla T4、HyenaDNAはNVIDIA A100をそれぞれ学習に使用したとの情報があるため、GPUの性能を重視したい。
予算300万円以内で、上記の用途における計算処理を最も高速化できる構成を提案してほしい。
また、設置場所の制限があるため、筐体サイズはミドルタワー程度で、100V環境で使用可能な構成が望ましい。
希望する条件は以下の通り。
・GPU:性能重視
・電源:100V環境に対応
・筐体:ミドルタワー程度
・予算:300万円以内テガラからのご提案
お客さまご希望の条件に沿った構成をご提案しました。
ご予算・利用環境を踏まえたうえで、GPU性能を重視した構成です。GPUの選定について
GPUはNVIDIA RTX A6000 x2枚を搭載しています。
ProteinBERT開発元の公式サイトによると、学習済みモデルの構築にはNVIDIA RTX5000を用いて1か月ほど要したと記載されています。
A6000はRTX5000より世代が新しく、ラインナップ上でも上位モデルにあたる製品のため、RTX5000よりも高い処理性能が期待できます。例として挙げていただいたNVIDIA Tesla T4は、推論向けとして利用されることが多い製品です。そのため、本構成ではNVIDIA TeslaT4よりも単体性能が高いA6000を採用しています。
NVIDIA A100とRTX A6000の違い
また、NVIDIA A100は、A6000とは異なり、GPGPU専用カードです。
高いfp64性能を持ち科学計算に適した製品ですが、今回のようなDeepLearning用途ではfp64性能が利用されることはほとんどありません。
あわせて、価格に関してもA6000と比較して非常に高額で、かつ専用の筐体でなければ利用できないことから、今回の利用条件や用途におけるマッチングが高くないと判断しました。ストレージに関しては、ProteinBERTの開発元よりユーザー自らモデルの学習を行う場合は1TB以上のストレージ容量を確保することが推奨されているため、2TBのシステムディスク、4TBのデータディスクを搭載しています。
なお、学習中に頻繁なデータアクセスが発生することを想定して、ストレージはすべてSSDとしています。OSはWindows 11を選択しています。
ご使用予定の言語モデルは基本的にはPythonパッケージで提供されているもののため、Pythonを使用可能なOSであれば、ご希望に応じて変更も可能です。本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
いただいた条件に合わせて柔軟にマシンをご提案いたしますので、掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。主な仕様
CPU Intel Xeon W5-2455X (3.20GHz 12コア) メモリ 128GB REG ECC ストレージ1 2TB SSD M.2 ストレージ2 4TB SSD S-ATA ビデオ NVIDIA RTX A6000 48GB x2 ネットワーク on board (1GbE x1 /10GbE x1) 筐体+電源 ミドルタワー型筐体 + 1500W OS Microsoft Windows 11 Professional 64bit ■キーワード
・DeepLearningとは
DeepLearningは機械学習の一種であり、多層のニューラルネットワークを用いて高度なパターン認識や予測を行う手法。一般的に大量のデータを必要とするため、データが豊富な場合に効果的な手法とされている。 また、DeepLeanigは画像認識や音声認識、自然言語処理などの分野で広く用いられている。複雑な特徴や関係性を学習することができるため、従来の機械学習手法よりも高い精度を発揮することができる。・Pythonとは
Pythonは、Python Software Foundation (PSF) が著作権を保持する、オブジェクト指向プログラミング言語。プログラミングの構文がシンプルなため可読性が高く、目的に応じたライブラリやフレームワークといったコンポーネントが豊富に揃っていることも特徴。プログラミングの初学者から上級者に至るまで人気の言語。・BERTとは
BERT (Bidirectional Encoder Representations from Transformers) は、Googleが開発した自然言語処理 (NLP) モデル。与えられた文脈に基づいて単語を理解することができ、言語処理における幅広いタスクに適用される。
また、BERTは事前学習とファインチューニングの2つのフェーズで構成されている。事前学習では、大規模なコーパスから学習された汎用的な言語モデルが作成される。ファインチューニングでは、特定のタスクに適用するために、小規模なデータセットから学習されたモデルが調整される。
従来のNLPモデルに比べて高い精度を示し、複雑なタスクにも対応できることが特徴で、テキスト生成、質問応答、文書分類、言語翻訳などに応用されており、NLPの分野で最も有名なモデルの1つとして広く使われている。・ProteinBERTとは
ProteinBERTは、BERTをベースにしたタンパク質言語モデル。 UniRef90データベース上の最大1億600万のタンパク質で事前学習されており、非常に長いタンパク質配列を含む、ほぼあらゆる長さのタンパク質配列を処理することが可能。・ChemBERTaとは
ChemBERTaは、RoBERTa (BERTの亜種) を用いた、化学構造の表記方法であるSMILES記法の大規模言語モデル。 医薬品設計、化学モデリング、特性予測などに用いられている。・HyenaDNAとは
HyenaDNAは、ヒトゲノムを100万トークンの塩基配列として事前学習した大規模言語モデル。 単一ヌクレオチド単位 (ATGC) でのトークン化により、ヌクレオチド単位での解析が可能。事例追加日:2023/11/09
- 事例No.PC-11239
-
参考価格:
907,500円Stata/MPデータ解析用マシン
用途:Stata/MP (12コア) 、 R、 Pythonなどを用いたデータ解析お客さまからのご相談内容
Stata/MP (12コア) 、 R、 Python等でのデータ解析・シミュレーション用マシンの導入を検討している。将来的には機械学習を行うことも考えている。
予算100万円程度で、用途に適した構成を提案してほしい。解析等に用いるデータや生成物はすべて外付けのメディアに保存するため、大容量ストレージを搭載する必要はない。
また、解析のために1日以上継続してマシンを稼働させることがあるが、頻繁に長時間稼働させることはない。
ワークステーションではないマシンでもこのような運用を行うことができれば、コンシューマー向けの構成を希望する。加えて、12コアライセンスのStataを使用予定だが、どの程度のコア数のCPUが適しているかを教えてほしい。
その他の希望条件は以下を想定している。
・CPU:12コア以上
・メモリ:128GB
・ストレージ:1TB S-ATA SSD x2枚
・OS:Windows 11 Pro
・使用するソフトウェア:Stata/MP (12コア) 、 R、 Pythonなど
・予算:100万円程度テガラからのご提案
お客さまのご希望条件に合わせて構成を検討しました。
計算用途におけるコンシューマー向け構成の利用
ご予定の運用方法を踏まえて、コンシューマー向けの構成にてご提案しています。
コンシューマー向けの構成を1日連続稼働させると直ちに故障するといったことはありませんが、長時間の計算を頻繁に行う場合には、ECCメモリに対応したワークステーションを利用することで信頼性を高めることができます。
反対に、最長で24時間程度しか連続稼働させない場合には、コストパフォーマンスを重視してワークステーション向けではない構成を利用することも有用な選択肢です。ライセンスの契約コア数とCPUコア数の選び方
CPUはRyzen 7000シリーズのRyzen9 7950X (16コア) を選択しています。
12コアしか搭載していないCPU において、ライセンス上の最大数である12コア全てでStataを稼働させた場合、CPUのリソースを使い切ることになり、並行して別の作業を行う際に影響が出る可能性があります。
そのため、16コアモデルのCPUを選択し、リソースに余裕を持たせていますが、Stataの稼働中に他の操作を行わない場合は12コアモデルに変更することも可能です。また、機械学習での利用予定がある点を踏まえて、ビデオカードはCUDAを使用する想定でハイエンドのワークステーション向けグラフィックボード NVIDIA RTX A5000を選定しています。ビデオカードはご希望に応じて変更できますので、気兼ねなくお申し付けください。
本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
いただいた条件に合わせて柔軟にマシンをご提案いたしますので、掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。主な仕様
CPU AMD Ryzen9 7950X (4.50GHz 16コア) メモリ 128GB ストレージ1 1TB SSD S-ATA ストレージ2 1TB SSD S-ATA ビデオ NVIDIA RTX A5000 24GB ネットワーク on board (2.5G x1 10/100/1000Base-T x1) Wi-Fi x1 筐体+電源 タワー型筐体 + 850W OS Microsoft Windows 11 Pro 64bit ■FAQ
・Stataとは
Stataは、データ分析やデータ管理、図表生成などの機能を備えた総合統計ソフトウェアパッケージ。
マウスによるGUI操作に加え、強力かつ直感的なコマンドシンタックスでの実行も可能で、使いやすくかつ高速で正確なのが特徴。参考:Stata ※弊社ユニポスの取扱商品ページに飛びます
・Rとは
Rとはオープンソース・フリーソフトウェアの統計解析向けプログラミング言語/開発実行環境。統計処理のための計算やグラフ化で利用される。
多くのライブラリが存在するため、ライブラリを呼び出すだけで複雑な手法を扱うことができる。・Pythonとは
Pythonは、Python Software Foundation (PSF) が著作権を保持する、オブジェクト指向プログラミング言語。プログラミングの構文がシンプルなため可読性が高く、目的に応じたライブラリやフレームワークといったコンポーネントが豊富に揃っていることも特徴。プログラミングの初学者から上級者に至るまで人気の言語。参考:【特集記事】プログラミング言語 Python その人気の理由は?- Python プログラミングを加速するツールたち ※弊社オウンドメディア「TEGAKARI」に飛びます
事例追加日:2023/11/08
- 事例No.PC-11212
-
参考価格:
1,084,600円プロテオミクス解析用PC
用途:DIA-NN、 MaxQuant、 FragPipe、 Skyline、 MS-DIALなどを用いたプロテオミクス解析お客さまからのご相談内容
事例No.PC-11089を見ての問い合わせ。
プロテオミクス解析用PCの導入を検討している。
使用するソフトウェアとしては、DIA-NN、 MaxQuant、 FragPipe、 Skyline、 MS-DIALなどを予定している。
また、NGS解析など、その他のOmics解析にも使用できると望ましい。
CPUの物理コア数は多い方が良いが、ソフトウェアによっては速度も必要になるのでバランスよく構成してもらいたい。
希望する条件は以下の通り。・CPU:コア数が多いほうが好ましいが、速度とのバランスが取れた製品を希望する
・メモリ:128GB以上
・OS:Ubuntu 22.04
・使用するソフトウェア:DIA-NN 1.8.1、 MaxQuant、 FragPipe、 Skyline、 MS-DIALなど
・予算:100万円程度テガラからのご提案
ご希望条件とご利用予定のソフトウェアに適した構成をご提案しました。
ご利用予定のソフトウェアのうち、SkylineはWindows専用ソフトウェアです。そのため、Windows 11 + Ubuntu 22.04のデュアルブート構成としていますが、ご要望にあわせたOS環境をご提案しますのでお知らせください。
CPUは、2023年10月時点で最新のXeon W-2400シリーズを搭載しています。
コア数と動作速度のバランスを考え、基本動作周波数2.60GHzの20コアモデル Intel Xeon W7-2475Xを選定しています。メモリ容量は128GBですが、増設に対応していますので、より大容量のメモリが必要な場合にはご相談ください。
ストレージ構成はデュアルブートOS用の2TB M.2 SSD x2枚および、データHDDとして16TB S-ATA HDDを搭載しています。ストレージの種類や容量、搭載数などの変更も可能です。
また、ご利用予定のソフトウェアはいずれも高度な描画機能を必要としないと考えられます。そのため、ビデオカードはエントリークラスのワークステーション向け製品である NVIDIA T400 4GBを選択しています。
本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
いただいた条件に合わせて柔軟にマシンをご提案いたしますので、掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。主な仕様
CPU Intel Xeon W7-2475X (2.60GHz 20コア) メモリ 128GB REG ECC ストレージ1 2TB SSD M.2 ストレージ2 2TB SSD M.2 ストレージ3 16TB HDD S-ATA ビデオ NVIDIA T400 4GB ネットワーク on board (2.5GbE x1, 10GbE x1) 筐体+電源 タワー型筐体 + 1000W OS Microsoft Windows 11 Pro for WS 64bit OS Ubuntu 22.04デュアルブート設定 ■キーワード
・Omics解析とは
Omics解析は、生物学や医学の分野で広く使用されるデータ駆動型のアプローチ。Omicsとはゲノミクス、プロテオミクス、トランスクリプトミクスなど、生物学的なデータを収集・解析するための技術の総称。
Omics解析では、高スループットの実験技術や次世代シーケンシングなどの先端技術が活用される。これにより生成される大量のデータは、統計学的な手法やデータマイニングの手法を用いて解析され、疾患のメカニズム解析や新たなバイオマーカーの同定、個別化医療への応用などが可能となる。・DIA-NNとは
DIA-NNはDIA(データ非依存的分析)プロテオミクスデータ処理のためのソフトウェア。ハイスループット実験メソッドを使用し、高信頼性・堅牢・定量的に正確な大規模実験を行うことが可能。
・MaxQuantとは
MaxQuantは定量的プロテオミクスのためのソフトウェアパッケージ。大規模な質量分析データセットを分析するために設計されている。高分解能質量分析データに主軸を置いているほか、いくつかの標識法やラベルフリー定量法に対応している。
・FragPipeとは
FragPipe は、質量分析ベースのプロテオミクスデータの包括的な分析を可能にするGUI(グラフィカルユーザーインターフェース)。質量分析ベースのプロテオミクスにおけるペプチド同定のための超高速データベース検索ツールであるMSFraggerおよび、ショットガンプロテオミクスデータ解析のためのツールキットであるPhilosopherを内蔵している。
参考:FragPipe | A complete proteomics pipeline with the MSFragger search engine at heart※外部サイトに飛びます
・Skylineとは
Skylineは、ターゲットプロテオミクスおよびメタボロミクスデータ分析のためのオープンソースソフトウェア。選択反応モニタリング(SRM)、多重反応モニタリング(MRM)、並列反応モニタリング(PRM)、データ非依存性解析(DIR/SWATH)などの手法に対応している。
・MS-DIALとは
MS-DIALは、理化学研究所とカリフォルニア大学デービス校のグループによる共同研究成果として発表されたノンターゲットプロテオミクスのためのソフトウェア。ガスクロマトグラフ質量分析計 (GC/MS)とデータ非依存的タンデム質量分析計(MS/MS)の双方においてスペクトルのデコンボリューションに対応している。
事例追加日:2023/10/31
- 事例No.PC-11132
-
参考価格:
779,900円NGSデータ処理とマルチオミクス解析用マシン
用途:アンプリコンシーケンス解析のデータ処理・マルチオミクスの統合解析お客さまからのご相談内容
アンプリコンシーケンス解析のデータ処理とマルチオミクスの統合解析用ワークステーションの導入を考えている。
Rパッケージ (WGCNA、 lavaan、 ggplot、 arules、 imagerなど) やigraph、QIIME2を使用する予定。
写真の解析も行う予定だが、データ量としては多くない (週に450MB程度) 。CPUで処理・解析を行うことを考えているため、CPUの性能を重視している。希望する条件は以下の通り。
・CPU:性能を重視
・メモリ:128GB以上
・ストレージ:512GB程度
・OS:なし
・使用するソフトウェア:Rパッケージ (WGCNA、 lavaan、 ggplot、 arules、 imagerなど) 、igraph、QIIME2
・予算:80万円程度テガラからのご提案
お客さまご希望の条件に沿った構成をご提案しました。
2023年10月時点で最新のXeon W-2400シリーズを搭載した構成です。
ご予算内に収まる製品の中で最も上位のモデルであるIntel Xeon W5-2465X (16コア) を選択しています。
なお、Rでマルチスレッド動作を行うためには、並列化パッケージを導入する必要があります。並列化パッケージ未導入の状態でRプログラムを実行した場合はシングルスレッド動作になるため、コア数を有効に活用することができませんのでご注意ください。メモリ搭載量は128GBとしていますが、空きスロットが4スロットあるため、今後メモリを増設することも可能です。
週に450MB程度の画像解析を行う場合、それほど高いGPU性能は要求されないと考えられます。
そのため、ビデオカードはワークステーション向けのエントリーモデルであるNVIDIA T400 4GBを選択していますが、ご希望に応じて変更も可能です。
本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
いただいた条件に合わせて柔軟にマシンをご提案いたしますので、掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。主な仕様
CPU Intel Xeon W5-2465X (3.10GHz 16コア) メモリ 128GB REG ECC ストレージ 500GB SSD M.2 ビデオ NVIDIA T400 4GB ネットワーク on board (2.5GbE x1, 10GbE x1) 筐体+電源 タワー型筐体 + 1000W OS なし ■キーワード
・アンプリコンシーケンス解析とは
アンプリコンシーケンス解析は、特定のDNAまたはRNA領域を高速にシーケンスする分子生物学手法。特定のプライマーを使って遺伝子、遺伝子領域、またはフラグメントをPCR反応で増幅し、次世代シーケンサーでシーケンスする。微生物学、遺伝学、生態学など多くの分野で使用され、遺伝子多型、微生物の同定、疾患関連の変異、環境の多様性の調査などに応用される。得られたデータをバイオインフォマティクスツールで解析し、生物学的情報を取得する。・Omics解析とは
Omics解析は、生物学や医学の分野で広く使用されるデータ駆動型のアプローチ。Omicsとはゲノミクス、プロテオミクス、トランスクリプトミクスなど、生物学的なデータを収集・解析するための技術の総称。
Omics解析では、高スループットの実験技術や次世代シーケンシングなどの先端技術が活用される。これにより生成される大量のデータは、統計学的な手法やデータマイニングの手法を用いて解析され、疾患のメカニズム解析や新たなバイオマーカーの同定、個別化医療への応用などが可能となる。・Rとは
Rとはオープンソース・フリーソフトウェアの統計解析向けプログラミング言語/開発実行環境。統計処理のための計算やグラフ化で利用される。
多くのライブラリが存在するため、ライブラリを呼び出すだけで複雑な手法を扱うことができる。・igraphとは
igraphはグラフの作成やネットワーク分析のためのオープンソースライブラリ。C/C++、 R、 Python、 Mathematicaでのプログラミングに対応している。・QIIME2とは
QIIME2は微生物叢分析のためのオープンソースのソフトウェアパッケージ。データと分析の透明性を重視しており、専用のwebサイト「QIIME2 View」から簡単に分析データを確認することができる。プラグインによって定期的に新たな機能が追加されている。事例追加日:2023/10/31
ご注文の流れ
![]() |
お問い合わせフォームよりご相談内容をお書き添えの上、 お問い合わせください。 (お電話でもご相談を承っております) |
![]() |
弊社より24時間以内にメールにてご連絡します。 |
![]() |
必要に応じてメールにて打ち合わせさせていただいた上で、 メール添付にてお見積書をお送りします。 |
![]() |
お見積もり内容にご納得いただけましたら、メールにてご注文ください。 ご注文確定後、必要な部材を手配し PCを組み立てます。 (掛売りの場合、最初に新規取引票のご記入をお願いしております) |
![]() |
動作チェックなどを行い、納期が確定いたしましたらご連絡いたします。 (納期は仕様や製造ラインの状況により異なります) |
![]() |
お客様のお手元にお届けいたします (ヤマト運輸/西濃運輸) |
お支払い方法
お支払い方法は、お見積もりメール・お見積書でもご案内しています。
法人掛売りのお客様 |
原則として、月末締、翌月末日払いの後払いとなります。 |
学校、公共機関、独立行政法人のお客様 |
納入と同時に書類三点セット(見積書、納品書、請求書)をお送りしますのでご請求金額を弊社銀行口座へ期日までにお振込み願います。 先に書面での正式見積書(社印、代表者印付)が必要な場合はお知らせください。 |
企業のお客様 |
納品時に、代表者印つきの正式書類(納品書、請求書)を添付いたします。 ご検収後、請求金額を弊社銀行口座へお支払い期日までにお振込み願います。 |
銀行振込(先振込み)のお客様 |
ご注文のご連絡をいただいた後、お振込みを確認した時点で注文の確定とさせていただきます。 |
修理のご依頼・サポートについて
弊社製PCの保証内容は、お見積もりメールでもご案内しています。
■お問合せ先
テガラの取り扱い製品に関する総合サポート受付のWEBサイトをご用意しております。
テガラ株式会社 サポートサイト
※お問い合わせの際には、「ご購入前」と「ご購入後」で受付フォームが分かれておりますので、ご注意ください。
メール | support@tegara.com |
電話 | 053-543-6688 |
■テグシスのサポートについて
保証期間内の修理について
保証期間内におけるハードウェアの故障や不具合につきましては、無償で修理いたします。
ただし、お客様による破損や、ソフトウェアに起因するトラブルなど保証規定にて定める項目に該当する場合は保証対象外となります。
保証期間経過後も、PCをお預かりしての初期診断は無料で実施しております。
無料メール相談
PCの運用やトラブルにつきまして、メールでのご相談を承ります。経験・知識の豊富な技術コンサルタントが無料でアドバイスいたします。
※調査や検証が必要な場合はお答えできなかったり、有償対応となることがあります
オプション保証サービス
「あんしん+」 もしもの時の延長保証サービス |
PCのご購入時にトータル5年までの延長保証をご選択いただけます。また、ご購入後にも延長保証を申し込むことができます。
|
HDD返却不要サービス |
保証期間内にPCのHDD(SSD)が故障した場合、通常、新品のHDDとの交換対応となり、故障したHDDはご返却いたしません。 ![]() |
オンサイト保守サポート | |
故障発生時、必要に応じエンジニアスタッフが現地へ訪問し、保守対応を行うサービスです。
|
「お客様だけのオーダーメイドPC」を製作しています。
用途に応じた細かなアドバイスや迅速な対応がテガラの強みです。
上記の仕様はテガラでお客様に提案したPC構成の一例です。
掲載内容は提案当時のものであり、また使用する部材の供給状況によっては、現在では提供がむずかしいものや、部材を変更してのご提案となる場合がございます。
参考価格については、提案当時の価格(送料込・税込)になります。
ご相談時期によっては価格が異なる場合がございますので、あらかじめご了承ください。