(Translated by https://www.hiragana.jp/)
「投資の最適化」という観点で考える 生成AI導入への適切なアプローチとは - 日経クロステック Special
抽選ちゅうせんで50めいさまにAmazonギフトカード
7000えんぶんたる! アンケートを実施じっしちゅう
生成せいせいAI・AI活用かつようかんする調査ちょうさ
投資とうし最適さいてき」という観点かんてんかんがえる

生成せいせいAI導入どうにゅうへの

適切てきせつなアプローチとは

生成せいせいAIを社内しゃない導入どうにゅうし、業務ぎょうむ効率こうりつやビジネスの差別さべつ活用かつようしたい――。このようにかんがえている企業きぎょう組織そしきおおいはずだ。しかし、やみくもに生成せいせいAIを導入どうにゅうしても、成功せいこうはおぼつかない。とく初期しょき段階だんかいでの導入どうにゅうは、つぎのステップへと円滑えんかつすすむためにも、注意深ちゅういぶかおこな必要ひつようがある。そこでぜひっておきたいのが、「投資とうし最適さいてき」という観点かんてん生成せいせいAI導入どうにゅうにアプローチする方法ほうほうだ。ここではそのために必要ひつような2つのテーマについて解説かいせつしたい。

膨大ぼうだい存在そんざいする生成せいせいAIのユースケース

2022ねん11月にChatGPTが公開こうかいされたことで、ビジネスかいでもおおきな注目ちゅうもくあつめるようになった生成せいせいAI。ChatGPT以外いがいにも様々さまざま生成せいせいAIが登場とうじょうしており、その進化しんか現在げんざい急速きゅうそくすすんでいる。生成せいせいAIを業務ぎょうむ活用かつようしようといううごきもはじまっており、今後こんご生成せいせいAIきにビジネスをかたることはできなくなるといっても、けっして過言かごんではないだろう。一般いっぱん企業きぎょうによる生成せいせいAIへの投資とうしも、これからさらに本格ほんかくしていくはずだ。

それではなぜ生成せいせいAIが、これだけ注目ちゅうもくされるようになったのか。それは特定とくてい専門せんもん領域りょういきだけではなく、きわめて広範こうはんなビジネス領域りょういき活用かつようできる可能かのうせいめているからだ。しかしこうした特徴とくちょうは、投資とうし失敗しっぱい誘発ゆうはつする危険きけんせいたかい。やみくもに導入どうにゅうしていくことで投資とうし増大ぞうだいしてしまい、そのわりには効果こうかうすいユースケースが散見さんけんされることで、急速きゅうそくに「幻滅げんめつ」に突入とつにゅうする可能かのうせいがあるからだ。

実際じっさいに、生成せいせいAIで実現じつげんできるとかんがえられているユースケースは、じつ多様たようだ。そのいちれいしめしたのがしたひょうである。

幅広はばひろ領域りょういきじつすうおおくのユースケースがあることがかる。
これらにやみくもにんでしまうと、投資とうしばかりかさんでしまい、期待きたいしたほどの効果こうかられない危険きけんせいたか

事業じぎょう戦略せんりゃく運営うんえい管理かんり製品せいひん企画きかく研究けんきゅう開発かいはつ製造せいぞうやサプライチェーン、マーケティング・販売はんばい顧客こきゃくサービス、さらにはITや人事じんじ財務ざいむいたるまで、じつ多様たようなユースケースがげられている。これらすべてに生成せいせいAIを導入どうにゅうすることは、現実げんじつてきとはいえない。まずは、自社じしゃむべきユースケースをしぼみ、そこに投資とうし集中しゅうちゅうすべきだろう。

それでは生成せいせいAIのユースケースのしぼみを、どのようにおこなうべきなのか。ここで最初さいしょ提言ていげんしたいのが、まずユースケースをおおまかにカテゴライズし、それらのなか具体ぐたいてきなユースケースをリストアップしたうえで、2つのじく優先ゆうせん順位じゅんいめていくというアプローチだ。

ユースケースの優先ゆうせん順位じゅんいけをおこなうための方法ほうほうろん

まず生成せいせいAIの一般いっぱんてきなユースケースは、おおきく6種類しゅるいかんがえられる。「ドキュメントオートメーション」「コンテンツ生成せいせい」「デジタルアシスタント」「設計せっけいとデータ作成さくせい」「自然しぜん言語げんご検索けんさく」「コード生成せいせい」だ。

「ドキュメントオートメーション」は、すで存在そんざいする膨大ぼうだい情報じょうほう解釈かいしゃくし、その要約ようやく翻訳ほんやく解説かいせつおこなうというもの。生成せいせいAIを活用かつようした翻訳ほんやくすで一般いっぱんてきなものになっており、コールセンターでのやりりをテキストして要約ようやくするといったみも、すで複数ふくすう企業きぎょうはじまっている。

「コンテンツ生成せいせい」は、文書ぶんしょ画像がぞうなどを自動的じどうてき生成せいせいするというものだ。たとえば、メール文面ぶんめん企画きかくしょなどの作成さくせい支援しえんや、ホームページに掲載けいさいする文面ぶんめん画像がぞう自動じどう生成せいせいなどがかんがえられる。

「デジタルアシスタント」は、ユーザーからの質問しつもん回答かいとうする、過去かこ情報じょうほうから推奨すいしょう事項じこう提案ていあんする、といったものだ。企業きぎょうないでの利用りよう方法ほうほうとしては、社内しゃない各種かくしゅドキュメントの内容ないようをベースに、業務ぎょうむかんする質問しつもん回答かいとうする、といった使つかかたかんがえられる。また顧客こきゃくたいして生成せいせいAIによるチャットボットで支援しえんおこない、セルフサービスがたでの問題もんだい解決かいけつ容易よういにする、という使つかかたもあるだろう。

設計せっけいとデータ生成せいせい」は文字通もじどおり、設計せっけい業務ぎょうむとそれに付随ふずいするデータ生成せいせいおこなうというもの。たとえば、ゲノムにかんする知見ちけん活用かつようしたそうやくといった使つかかたかんがえられる。もちろんそのほかの設計せっけい領域りょういきでも、おおきな効果こうか発揮はっきすることが期待きたいされる。

自然しぜん言語げんご検索けんさく」も文字通もじどおり、生成せいせいAIによって検索けんさく自然しぜん言語げんごおこなえるようにすること。そして「コード生成せいせい」は、ソフトウエア開発かいはつ(プログラミング)に生成せいせいAIを活用かつようするというユースケースである。

これら6カテゴリーを視野しやれたうえで、自社じしゃかんがえられるユースケースをリストアップ。そのうえで、「実現じつげん可能かのうせい」と「事業じぎょう価値かち」という2つのじくで、優先ゆうせん順位じゅんいめていくわけだ。

まず「実現じつげん可能かのうせい」だが、これがひくければ実現じつげんまでの時間じかんやコストがかかりやすくなり、成功せいこうまでのみちのりがとおくなってしまう。最初さいしょ段階だんかいでこのようなユースケースに着手ちゃくしゅしてしまうと、つぎいちすすむことがむずかしくなり、生成せいせいAIへの全体ぜんたい頓挫とんざする危険きけんせいたかい。そのため「実現じつげん可能かのうせいたかい」ユースケースから着手ちゃくしゅすべきだ。

つぎに「事業じぎょう価値かち」については、当然とうぜんながら事業じぎょう価値かちたかいユースケースのほうが、投資とうし効果こうかおおきくなる。つまり「実現じつげん可能かのうせい」がたかく、「事業じぎょう価値かち」もたかいユースケースから着手ちゃくしゅすべきなのである。

まず一般いっぱんてき生成せいせいAIのユースケースのカテゴリーを視野しやれたうえで、それぞれのなかでどのようなユースケースがかんがえられるのかをリストアップする。
その、それらのユースケースを「実現じつげん可能かのうせい」と「事業じぎょう価値かち」の2じくでマッピングし、いずれもたかい「みぎじょうのもの」からんでいくとよいだろう

生成せいせいAIの4つの「導入どうにゅうパターン」から最適さいてきなものを選択せんたく

優先ゆうせんすべきユースケースがまったら、つぎはそれをどのように実現じつげんするかをかんがえる必要ひつようがある。つまり最適さいてきな「導入どうにゅうパターン」を選択せんたくする必要ひつようがあるわけだ。

生成せいせいAIの導入どうにゅうパターンは、おおきく4種類しゅるいある。「事前じぜんトレーニングされたモデル」をそのまま使つかうパターン、「モデルの拡張かくちょう」をおこなうパターン、「ファインチューニング」をおこなうパターン、そして「独自どくじモデルをトレーニング」するパターンだ。

ここでこれらの導入どうにゅうモデルがどのような特徴とくちょうっており、どのユースケースカテゴリーにてきしているのかをていこう。

まず「事前じぜんトレーニングされたモデル」の導入どうにゅうパターンは、文字通もじどお既存きそん生成せいせいAIモデル(だい規模きぼ言語げんごモデル:LLM)をそのまま使つかうというものだ。たとえば、ChatGPTをそのまま使つかう、といったケースがかんがえられる。

企業きぎょう固有こゆう専門せんもん知識ちしき必要ひつようなく、一般いっぱんてき知識ちしきだけで運用うんようできるのであれば、このパターンがもっと導入どうにゅうスピードがはやく、コストもかからない。またデータサイエンティストも必要ひつようなく、おおくの場合ばあいはシステム開発かいはつしゃ不要ふようだ。前述ぜんじゅつのユースケースカテゴリーでいえば「ドキュメントオートメーション」がこの導入どうにゅうパターンにてきしているといえるだろう。

一般いっぱんてき知識ちしきだけで運用うんようできるのであれば、このパターンがもっと導入どうにゅうスピードがはやく、コストもかからない

だい2は「モデルの拡張かくちょう」パターンだが、これはだい規模きぼ言語げんごモデルによるテキスト生成せいせい外部がいぶ情報じょうほう検索けんさくわせることで、回答かいとう精度せいどたかめるという方法ほうほうだ。このような方法ほうほう一般いっぱんに「RAG( Retrieval-Augmented Generation)」という。

データサイエンティストは必要ひつようないが、生成せいせいAIを社内しゃない検索けんさくシステムと連携れんけいさせるために、システム開発かいはつしゃ必要ひつようなケースがおおい。そのため「事前じぜんトレーニングされたモデル」をそのまま使つかうパターンにくらべて手間てまとコストがかかるが、企業きぎょう固有こゆう知識ちしき比較的ひかくてき短時間たんじかんむことができる。前述ぜんじゅつのユースケースカテゴリーでいえば、「コンテンツ生成せいせい」にてきしたアプローチだといえる。

だい規模きぼ言語げんごモデルと外部がいぶ情報じょうほう検索けんさくわせることで、比較的ひかくてき簡単かんたん回答かいとう精度せいどたかめられる。
データサイエンティストは必要ひつようないが、検索けんさくシステムとの連携れんけいのためにシステム開発かいはつしゃ必要ひつようになることがおお

だい3の「ファインチューニング」パターンは、事前じぜんトレーニングされたモデルをべつのデータセットを使つかって「さいトレーニング」することで、より正確せいかく結果けっかられるようにする、という方法ほうほうだ。生成せいせいAIの活用かつようでは、もっともらしいうそをつく「ハルシネーション」という現象げんしょう問題もんだいになることがすくなくないが、ファインチューニングをおこなうことでこの問題もんだい軽減けいげんできる。また、コンプライアンスじょう問題もんだい回避かいひするじょうでも、有力ゆうりょく選択肢せんたくしになるといえるだろう。

当然とうぜんながら、既存きそんだい規模きぼ言語げんごモデルをさいトレーニングするには、データサイエンティストの知見ちけん不可欠ふかけつだ。またさいトレーニングは継続けいぞくてきかえ必要ひつようがあることもわすれてはならない。そのため「モデルの拡張かくちょう」にくらべて手間てまやコストがかかるが、後述こうじゅつする「独自どくじモデルをトレーニング」にくらべれば負荷ふかちいさい。前述ぜんじゅつのユースケースカテゴリーでいえば「デジタルアシスタント」にいている。

すで存在そんざいするだい規模きぼ言語げんごモデルを「さいトレーニング」することで、より正確せいかく回答かいとうられるようになる。
当然とうぜんながらデータサイエンティスの参加さんか不可欠ふかけつ

そしてだい4の「独自どくじモデルをトレーニング」は、もっと高度こうど生成せいせいAIの導入どうにゅうパターンだといえる。「モデルの拡張かくちょう」や「ファインチューニング」をおこなっても正確せいかく回答かいとうられない場合ばあいには、このパターンを選択せんたくすることになるだろう。その企業きぎょうとくした「もっと差別さべつされた生成せいせいAI」をすことができる反面はんめん膨大ぼうだいなリソースが必要ひつようになる。ユースケースカテゴリーとしては「設計せっけいとデータ生成せいせい」にてきしているといえる。

もっと手間てま時間じかんがかかるが、企業きぎょう固有こゆう生成せいせいAIをつくりすことが可能かのうになる。
なお実際じっさいさいには、「ちいさなだい規模きぼ言語げんごモデル」にするというアプローチがてきしているといえるだろう

このパターンを採用さいようするさい注意ちゅういしたいのが、かならずしもChatGPTなどのような、だい規模きぼ言語げんごモデルにする必要ひつようはないということだ。だい規模きぼ言語げんごモデルの規模きぼはパラメーターすう表現ひょうげんされ、ChatGPT-3では1750おく、ChatGPT-4では非公開ひこうかいではあるもののやく5000おくといわれているが、これは汎用はんようてき利用りよう想定そうていしたものだということをわすれてはならない。特定とくてい業界ぎょうかいやビジネスにとくした「ドメイン固有こゆう」のだい規模きぼ言語げんごモデルであればすうひゃくおく企業きぎょう固有こゆう知識ちしき学習がくしゅうさせたものであればすうじゅうおく程度ていどのパラメーターでも、十分じゅうぶん価値かちのある生成せいせいAIをつくりせる可能かのうせいがある。

実際じっさい最近さいきんでは、ちいさなだい規模きぼ言語げんごモデル(small-LLM:sLLM)というかんがかた一般いっぱんしつつある。企業きぎょうない独自どくじモデルを作成さくせいするのであれば、このsLLMが最適さいてきなアプローチになるといえるだろう。

RAG以降いこうではデータマネジメントも不可欠ふかけつ

これらの4つの導入どうにゅうパターンのうち、現在げんざいではほとんどのユーザー企業きぎょうが「事前じぜんトレーニングされたモデル」をそのまま利用りようしており、一部いちぶのユーザー企業きぎょうが「モデルの拡張かくちょう(RAG)」にんでいる段階だんかいだといえる。今後こんごはRAGに企業きぎょう一気いっきえていくことになると予想よそうされる。

ここで重要じゅうようなことが、おおきく2てんある。1つは「RAGの目的もくてき明確めいかくにする」こと。目的もくてき期待きたいされる効果こうか明確めいかくでなければ、どのような外部がいぶ情報じょうほうわせるべきか、そのためにどの程度ていど投資とうしおこなうべきなのか、判断はんだんむずかしいからだ。もう1つは、そのためにどのようなデータが社内しゃない利用りようできるのかを明確めいかくにすることである。そのさいには、データの適合てきごうせい品質ひんしつ十分じゅうぶんりょうのデータが確保かくほできるのか、といったことに留意りゅういしたい。

また、データマネジメントをどのように実現じつげんするのか、そのためのシステムをいかにして構築こうちくするかも、考慮こうりょすべきだといえるだろう。なおデータマネジメントは、「ファインチューニング」や「独自どくじモデルをトレーニング」をおこなさいにも不可欠ふかけつになるため、長期ちょうきてき視野しやにもとづいて検討けんとうするといいだろう。

以上いじょう生成せいせいAIを導入どうにゅうするさいのユースケースの選定せんていと、それを実現じつげんするための「導入どうにゅうパターン」について解説かいせつしてきた。これらをしっかり意識いしきすることで、生成せいせいAI導入どうにゅう投資とうし効果こうかたかめることが可能かのうになり、つぎのステップにもすすみやすくなるはずだ。

関連かんれん記事きじ

わせ

デル・テクノロジーズ株式会社かぶしきがいしゃ

WEBサイトはこちら