![](https://special.nikkeibp.co.jp/atclh/NXT/24/delltechnologies0412/h2bg.png)
まだ多くの企業が実験段階に
とどまっている生成AI活用
AIをどのように業務活用するかは、これまでも様々な形で議論されてきた。既にデータ分析系AIを活用し、成果を挙げている企業も少なくない。しかし2022年末に対話型生成AIサービスであるChatGPTが登場したことで、AI活用の主戦場は大きく変化した。既に現在では生成AIは単なるブームを超え、企業・団体の人手不足解消や競合他社に打ち勝つためのビジネス競争力の向上に寄与するものだと認識され、「生成AI活用を避けて通ることはできない」という論調が主流になりつつあるようだ。
既に生成AI活用に着手した企業も増えている。クラウド経由の生成AIサービスを活用すれば、まずはPoC(概念実証)を始める、といったことへのハードルもかなり低くなった。米IDCが全世界の890人を対象に2023年9月に実施した「企業向けGenerative AIガイド」によると、77%以上の組織が生成AIに投資または活用を模索中と答えている。
上記調査で「今後18カ月で生成AIが最も大きな影響を与える可能性があるビジネス分野」を聞くと、第1位が「ソフトウェア開発と設計」だった。生成AIは人間の自然言語とコンピュータ言語の橋渡しができるため能力を発揮しやすい。
しかし現在の生成AI活用は、まだほんの入口に立った段階に過ぎない。既に「生成AIを使っている」という企業や組織も、そのほとんどは実験的なPoCでの活用にとどまっている状況だ。今後は図1に示すように、明確な計画にもとづく利用へとシフトし、実際のオペレーションへの適用、より戦略的な活用、そしてビジネスモデルやプロセスなどの変革へと進展していくことになるだろう。
現在はほとんどの企業が「実験的」段階にあるが、今後は計画的、オペレーショナル、戦略的、変革的へと進んでいくことになる。
これをより速く遂行していくことが、企業競争力を大きく左右する要因になるだろう
それでは今後、本格的な生成AIプロジェクトを進め成功させていくには、何を意識すべきなのか。まず注目すべき重要なポイントが、大きく3つある。
![](https://special.nikkeibp.co.jp/atclh/NXT/24/delltechnologies0412/h2bg.png)
生成AIプロジェクト推進で重要なポイント
① ユースケースの明確化
ここでまず、生成AIプロジェクトのライフサイクルを俯瞰しておきたい。おそらくほとんどの生成AIプロジェクトは、図2のように進んでいくはずだ。
この中で最も重要なのが、ユースケースの選択・明確化だ。これによって使用すべきモデルが決まってしまうからである。
モデル選択を誤まってしまえば、その後のプロセスがムダになる危険性が高い
ここで注目したいのが、最初の段階でユースケースを選択し、生成AI活用の「スコープ」を決める必要があるという点だ。「まずは成功しやすい簡単なユースケースからスタートし、同じ生成AIを活用して段階的にユースケースを拡大していけばいいのではないか」と考える企業も多いのではないか。しかし現実はそうではない。実は生成AIのアーキテクチャには複数のバリエーションがあり、ユースケースの特性に応じて使い分ける必要があるからだ。
それでは実際に、どのようなユースケースが考えられるのか。
まず一般的な業務での汎用的な活用では、自然言語検索やコンテンツ作成、ドキュメント作成などが考えやすいだろう。例えば自然言語検索で使用した場合には、利用者が曖昧な指示を行った場合でも、ヒット率の高い検索を行うことが容易になる。生成AIを使ったチャット機能をフロントエンドにし、人間の自然言語による検索指示から関係性の高い検索キーワードを抽出した上で、実際の検索を実行できるからだ。
また「生成」という言葉が示すように、プロンプトによってコンテンツやドキュメントを生成することも、生成AIの得意領域である。例えばコンテンツ生成で活用した場合には、生成AIに複数の候補を生成させた上で、その中から人間が最適なものを選択することで、コンテンツ制作の効率を飛躍的に高めることができる。またドキュメント内容の要約、といった使い方も定番なユースケースの1つだ。
このような汎用的な活用ができる一方で、特定業務の支援を行うことも可能だ。例えばマーケティングの一環として、商品画像やキャッチコピーの組み合わせアイデアを複数出させるといったことはその1つ。また専門性の高いドキュメントの中から、人間が注目すべきポイントを見つけ出すといった使い方も考えられる。例えば契約書の中から、自社が不利になりそうな文言をハイライトし、それを修正する場合の候補を列挙する、といった使い方などが考えられる。
そして最もインパクトが大きいユースケースが、冒頭の調査結果でも触れているように、設計・データ生成・コード生成であろう。生成AIであれば、人間にとって分かりやすい抽象的なコメントを記述するだけで、それを実行するコードを生成できる。これとは逆に、既に記述済みのコードからコメントを生成し、人間による解読を助ける、といった使い方も可能だ。さらに、データ同士の関連性を可視化するためのデータベースの設計図であるER図や、データベースのデータ定義言語(DDL)ファイルを出力する、といった使い方も既に行われている。
このような潜在的なユースケースを、企業内の組織別に列挙したのが図3だ。生成AIの活用と一口にいっても、これだけ多岐にわたるユースケースが考えられ、それぞれに最適なLLM(大規模言語モデル)が存在するのである。
生成AIの活用と一口にいっても、これだけ多岐にわたるユースケースが考えられる
実際に、ゼロから生成AIを活用した業務システムを開発することになった場合には、最初の段階は次のようなステップを踏むことになるだろう。
多くの企業はLLMの選択・開発からではなく、事前学習済みモデルの採用からスタートすることになるだろうが、その場合でも「どのLLMをベースにした学習済みモデルなのか」を意識することが必要だ
もちろんほとんどの企業では、基本となるLLMの選択・開発からではなく、事前学習済みモデルからスタートし、カスタマイズモデルを構築することになるはずだ。しかしLLMのモデルの選択を間違えてしまえば、その後のプロジェクトは頓挫する可能性が高い。学習済みモデルを採用する際でも、どのようなLLMのモデルをベースにしているのかを、きちんと確認した上で意思決定すべきだろう。
![](https://special.nikkeibp.co.jp/atclh/NXT/24/delltechnologies0412/h2bg.png)
生成AIプロジェクト推進で重要なポイント
② データの収集・蓄積・管理
第2に重要なポイントとなるのが、データの収取・蓄積・管理を適切に行うことである。優れたアルゴリズムやユースケースに適したLLMを採用していても、学習すべきデータが不十分では、望む結果を得ることはできない。
生成AIで使用するデータに関しては、大きく3つのポイントに留意する必要がある。1つ目は「データ量」である。少ないデータ量では十分なトレーニング(学習)を行うことはできないからだ。
2つ目は「適切なデータ」であること。これは、目的とするユースケースを達成するために必要な情報が含まれていることを意味する。当然のことだが、法律関係のユースケースで使用したい場合に、プログラム開発関連のデータを用意しても意味がない。適用分野に関連するデータを、できるだけ幅広く集める必要がある。
そして3つ目が「データの質」である。これに関しても既に多く指摘されているが、バイアスのかかったデータからは、バイアスのかかった結果しか得られない。これは、倫理上の問題やコンプライアンスにかかわるユースケースでは、特に留意する必要がある。またこのような問題にかかわらないユースケースでも、特定の事象ばかり集中して学習させた場合には、生成AIが出す結果もその事象に引きずられやすくなるので注意が必要だ。
データマネジメントの方法も、従来の企業システムで行っているものとは大きく異なってくる。「単に多様なデータを収集・蓄積し、それをデータマートなどに切り出して分析する」というアプローチでは、生成AI活用にはあまり適さない。生成AIにどのようなデータを学習させるのか、プロンプトエンジニアリングではどのデータを適用するのかということを戦略的に考え、「質の高いデータ」を準備しなければならない。
単に「多様なデータを収集・蓄積し、それをデータマートなどに切り出して分析する」というアプローチは、生成AI活用にあまり適していない
![](https://special.nikkeibp.co.jp/atclh/NXT/24/delltechnologies0412/h2bg.png)
生成AIプロジェクト推進で重要なポイント
③ 生成AI基盤の構築方法
そしてもう1つ重要になるのが、「生成AI基盤をどのように構築するか」という点だ。
現在では「既に生成AIを活用している」という企業や組織の多くが、クラウドで提供されているSaaS型の生成AIを利用している。実験段階ではそれでも構わないが、顧客データや業務上の機微データを生成AIで活用する場合には、クラウドにデータを置きたくないケースも多くなる。また、大量のデータを生成AIに使用する場合、生成AIの演算を行う場所に大量のデータを移動させるコストにも配慮する必要があるだろう。将来的には、パブリッククラウドで提供されている生成AIサービスに加えて、オンプレミスまたはプライベートクラウドにも生成AI基盤を構築する、という形態が一般的になっていくだろう。
その際に注意すべきなのが、生成AIのワークロードがどのような特性を持っているか、ということである。LLMのモデルをベースにした生成AIは、いくつかの特性を持っている。
まずは「コンピューティング集中型(Compute-Intensive)」であること。つまり計算処理を集中的に行う傾向が強い。特に、新しいコンテンツのトレーニングを行う場合には、膨大な処理能力を必要とする。LLMは並列処理によってパフォーマンスを高められるという特性があるため、GPUなどの活用が効果的だ。
次に「大量のメモリーが必要」だという点だ。生成AIモデルには、モデルパラメーターと中間表現を保存するために、大量のメモリーが必要になる。特にLLMの場合には多くのレイヤーと、数億~数百億ものパラメーターが必要になる場合があるため、十分なGPUメモリーを用意することが重要になる。
最後に「大量のデータを使用する」こと。前述のように生成AIのトレーニングでは、データの量と質がモデルの精度に大きな影響を与える可能性がある。このようなデータセットを効率よく使うには、ストレージの性能も重要になる。
このほかにも生成AI基盤で留意すべきポイントは複数あるが、少なくともこれらの特性には十分に配慮した上で、基盤システムを構成すべきだ。
![](https://special.nikkeibp.co.jp/atclh/NXT/24/delltechnologies0412/h2bg.png)
実験的な段階からなるべく早く、次の一歩へと踏み出そう
本稿では生成AIプロジェクトを成功させる上で、最も重要だと考えられる3つのポイントについて解説してきた。もちろんこれらのほかにも、著作権への配慮、サステナビリティへの対応など、考慮すべきポイントは数多く存在する。しかしここまで述べてきた3つのポイントをおろそかにしてしまえば、次の段階である「計画的な生成AI活用・展開」も、ままならなくなる。
既に大方の議論が「生成AI活用は避けて通れない」に傾いていることでも分かるように、生成AI抜きで企業・団体の人手不足解消や、ビジネスの競争力を維持できなくなる時代は、もう目前に迫っている。実験的な段階からなるべく早く次の一歩を踏み出すためにも、これら3つのポイントを重視したプロジェクトに着手してほしい。
関連記事