生成AIの急速な発達と浸透

DeepLearningの手法が普及してから、AIを利用したサービスは日常生活のレベルでも広く活用され始めています。
今日、AI分野のトレンドとして生成AIが大きな注目を集めています。
本記事では生成AIの概要や生成AIの研究開発に必要なハードウェアについて説明します。

生成AIとは

この数年で広く認知されサービスとして利用されているAIは画像や音声、文字の認識など、与えられた入力に対して何らかの判断を下すものが主でした。「与えられた画像に○○が映っているか」「入力された音声が何と言っているのか」「この文字はXかどうか」などをあらかじめ学習した情報から推論し、その結果を答えとして出力します。

一方、生成AIはこれらの認識を行うAIをさらに発展させた形態です。

生成AIは与えられた入力から何らかの結果を出力するという点は認識AIと同様ですが、出力する回答は「これは○○かどうか」「これはxxか」という形にとどまらず、より一般性が高い回答を提示する柔軟性を獲得したと言えます。
まるでこちらの質問や指示を理解、解釈しているように見えるチャットAIや、文章で提示した情景や状況に応じて対応した画像を生成する画像生成AIなどは、すべてこの生成AIによる成果です。

生成AIで利用されるモデル、アプリケーション

ここでは、これまでに弊社に寄せられたお問い合わせの中で名前が挙がった学習済みモデルやアプリケーションの一部を紹介いたします。現状では大規模言語モデルなどの全体を構築するためには膨大なハードウェアリソースを必要とするため、データセンター級の設備が必要になるのが実情です。
弊社お客さまの利用例としては、構築済みのモデルのファインチューニングや、モデルを含めた実行環境をローカルに構築するといった形が多く見られます。

FastChat
いわゆるチャットAIの実行環境。
オープンソースで開発されており、チャットの実行環境をローカルに構築することが可能です。
パラメーター数が異なる言語モデルがいくつか用意されており、それにより必要なハードウェアの性能も変わります。
比較的小規模なモデルであれば、ミドルクラスGPUでも実行が可能です。
Stable Diffusion
画像生成AI。
X (旧Twitter) などのSNSでも、Stable Diffusionで生成された画像を目にする機会が多くあります。
text to image (文章で与えた内容に沿った画像を生成する) 、image to image (画像を入力として与え、別の画像を生成する) に対応しており、ミドルクラスGPUでの稼働例もあります。
文章から画像を生成するという画期的なツールですが、意図した構図を生成しようとすると指示の与え方などに工夫が必要です。
Gaussian Splatting
NeRF (Neural Radiance Fields:限られた枚数の異なる視点の画像から、自由視点画像を生成するDeepLearningの適用技術) に近いものですが、NeRFとは異なる原理で自由視点画像を生成するプログラムです。
NeRFと比較し、レンダリング処理が軽快なことが特徴ですが、Gaussian Splattingもパラメータの学習が必要なため、DeepLearningを適用した一技術となります。
出力は通常3Dの360°画像であるため、高性能なGPUが求められます。

生成AI研究開発用マシンの構成に関する注意点

生成AIモデルの動作のためには、GPUのビデオメモリ容量が重要となります。

上記で紹介したプログラムでのシステム要件で推奨されているビデオメモリは以下の通りです。

FastChat

利用する言語モデルのサイズによって変わります。

Vicuna-7B:推奨されるビデオメモリ容量 14GB
Vicuna-13B:推奨されるビデオメモリ容量 28GB

※実行時オプションによりメモリ使用量を抑えることが可能ですが、推論の精度や実行速度が低下します。

Stable Diffusion

推奨されるビデオメモリ容量 10GB

※860M UNet and 123M text encoder利用の場合

Gaussian Splatting

推奨されるビデオメモリ容量 24GB

※生成した自由視点画像の閲覧は4GB程度のビデオメモリで可能。

Stable Diffusionは今日のミドルクラス製品でも現実的な利用が可能となりますが、基本的には大容量ビデオメモリを搭載したハイエンドクラスのGPUが必要となります。

おわりに

以上、生成AIの概要についてまとめました。
今回、この文章はすべて人間が考え、執筆していますが、いずれこのような文章もAIで生成できるようになるのでしょうか。
その日が来ることもそう遠くないと思われるほど、この分野の進化のスピードは目覚ましいものがあります。
お客さまにとってマシン選定の一助となりますと幸いです。