大だい流行りゅうこうの画像がぞう生成せいせいAI、「Stable Diffusion」をはじめ代表だいひょう的てきな3つの特徴とくちょうを知しる

新里にいさと祐ゆう教きょう

2023.09.19

全ぜん2157文字もじ

テキストを入力にゅうりょくすると画像がぞうが生成せいせいされる「画像がぞう生成せいせいAI」に注目ちゅうもくが集あつまっている。その仕組しくみや使つかい方かたについて解説かいせつしていこう。

　本稿ほんこうの内容ないようは2023年ねん7月がつ上旬じょうじゅん時点じてんでの情報じょうほうに基もとづいています。生成せいせいAIは進歩しんぽが速はやいため、紹介しょうかいしているサンプルコードはライブラリのバージョンアップなどによって今後こんご動作どうさしなくなる可能かのう性せいがあります。ご了承りょうしょうください。

　昨年さくねん（2022年ねん）から、「画像がぞう生成せいせいAI」に対たいする注目ちゅうもく度どが一気いっきに高たかまっています。画像がぞう生成せいせいAIとは、テキストを入力にゅうりょくすることで画像がぞうを生成せいせいするAIです（図ず1）。

図1●大流行している画像生成AI（画像は筆者がDALL·E 2を使って出力したもの）

図ず1●大だい流行りゅうこうしている画像がぞう生成せいせいAI（画像がぞうは筆者ひっしゃがDALL·E 2を使つかって出力しゅつりょくしたもの）

[画像がぞうのクリックで拡大かくだい表示ひょうじ]

　簡単かんたんなテキストから詳細しょうさいな長ながい文章ぶんしょうまで、さまざまな文章ぶんしょうを入力にゅうりょくに用もちいることができ、その出力しゅつりょくとして画像がぞうが得えられるというAIです。出力しゅつりょくされる画像がぞうは、写真しゃしんのような写実しゃじつ的てきなものから、イラストや絵画かいが風ふうのものまで生成せいせいできます。

　Webサービスとして提供ていきょうされているので手軽てがるに利用りようでき、インターネットで活躍かつやくしている「絵師えし」やそのファンの人ひとたちからも大おおいに注目ちゅうもくされています。ちなみに、こうした画像がぞう生成せいせいAIだけでなく、音楽おんがくや文章ぶんしょう、プログラムのソースコードを生成せいせいするAIなどもあります。これらのAIは、生成せいせいAI（Generative AI）と呼よばれます。話題わだいの「ChatGPT」も生成せいせいAIの1つです。

大だい流行りゅうこうの画像がぞう生成せいせいAI

　画像がぞう生成せいせいAIでは、「DALL·E 2」「Midjourney」「Stable Diffusion」といったものがよく知しられています（表ひょう1）。

表ひょう1●主おもな画像がぞう生成せいせいAI

[画像がぞうのクリックで拡大かくだい表示ひょうじ]

DALL·E 2
https://openai.com/product/dall-e-2

Midjourney
https://www.midjourney.com/

Stable Diffusion
https://stablediffusionweb.com/

　DALL·E 2を開発かいはつしているOpenAIは、AIの研究けんきゅう・開発かいはつを行おこなっている企業きぎょうです。OpenAIはChatGPT（https://openai.com/blog/chatgpt）でも多おおくの話題わだいを集あつめています。

　Midjourneyは2022年ねん7月がつ12日にちにサービスを開始かいししており、2023年ねん初頭しょとうで870万まん人にん以上いじょうものメンバーが「Discode」で参加さんかしています。Discodeとは、無料むりょうのチャット／コミュニティツールです。Midjourneyの画像がぞう生成せいせいは、Discord上じょうのチャット形式けいしきで画像がぞうを生成せいせいするのが特徴とくちょうです。プロンプト（文章ぶんしょう）を入力にゅうりょくすると、チャットルーム上じょうに画像がぞうが生成せいせいされるのです。