(Translated by https://www.hiragana.jp/)
ELYZA、高精度の文章要約AI「ELYZA DIGEST」を一般公開 : - ASCII STARTUP

メルマガはこちらから

PAGE
TOP

ELYZA、こう精度せいど文章ぶんしょう要約ようやくAI「ELYZA DIGEST」を一般いっぱん公開こうかい

NLP技術ぎじゅつもちいてホワイトカラーのDX推進すいしん目指めざ

要約ようやくAI「ELYZA DIGEST」

 東京大学とうきょうだいがく松尾まつおけんはつ・AIスタートアップ、ELYZA(イライザ)は8がつ26にち日本語にほんごにおける生成せいせいがた要約ようやくモデルの開発かいはつ成功せいこうしたと発表はっぴょう同日どうじつより、ほんモデルをもちいた要約ようやくAI「ELYZA DIGEST」(イライザ ダイジェスト)をデモサイトとして一般いっぱん公開こうかいした。

 ELYZA DIGESTは、入力にゅうりょくしたテキストデータを3ぎょう要約ようやくするAI。だい規模きぼ言語げんごモデルをもちいた「生成せいせいがた」の要約ようやくモデルであり、んだテキストをもとにAIがいちから要約ようやくぶん生成せいせいする。書籍しょせき小説しょうせつ・ニュース記事きじのような誤字ごじ脱字だつじすくない綺麗きれい文章ぶんしょうだけでなく、議事ぎじろく対話たいわテキストのような乱雑らんざつ文章ぶんしょう文字もじれつであっても対応たいおう可能かのうとしている。テキストの直接ちょくせつ入力にゅうりょく以外いがいにもURLをけることで該当がいとうページないぜんテキストから要約ようやくぶん作成さくせいできる。

 ほんAIモデルは、NLP(自然しぜん言語げんご処理しょり)の最先端さいせんたん技術ぎじゅつ活用かつよう開発かいはつされ、医療いりょうにおけるカルテ入力にゅうりょく弁護士べんごし業務ぎょうむにおける契約けいやく書類しょるい判例はんれい読解どっかい、コールセンターにおけるオペレーターの対話たいわメモ作成さくせい、メディアにおける記事きじ原稿げんこう作成さくせいなど、あらゆるホワイトカラー業務ぎょうむ発生はっせいする議事ぎじろくづくりなど多数たすうのユースケースでの活用かつよう想定そうていされている。

 ELYZAでは、「対話たいわテキストの要約ようやく」の実用じつようにも挑戦ちょうせん。ニュース記事きじ比較ひかくし、対話たいわテキストの要約ようやくおも下記かきの4つの要因よういんから難易なんいたかいとされる。

1 口語こうごのため、ぶん構造こうぞうおおきくくずれていることがおお
2 音声おんせい認識にんしき失敗しっぱいによる誤字ごじ脱字だつじ存在そんざい
3 話者わしゃ複数ふくすう存在そんざい
4 対話たいわトピックが多様たよう

 AIをもちいた要約ようやくには従来じゅうらいから複数ふくすうのアプローチがあるが、対話たいわテキストの要約ようやくにおいて、文中ぶんちゅうから一部いちぶす「抽出ちゅうしゅつがた」や「圧縮あっしゅくがた」、もともと用意よういしたテンプレートの一部いちぶえる「テンプレートがた」では、上記じょうき要因よういん障壁しょうへきとなり精度せいどたか要約ようやくむずかしいという。一方いっぽうで、ELYZA DIGESTで採用さいようしている「生成せいせいがた」のアプローチでは、いちから柔軟じゅうなん要約ようやくぶん生成せいせいできるため、これらの課題かだい解決かいけつできる可能かのうせいがある。

 下図したず実際じっさいにELYZA DIGESTをもちいて対話たいわテキストを要約ようやくしたれいで、口語こうご特有とくゆうの「あのー」「えーと」などの間投詞かんとうしや、音声おんせい認識にんしきのミスがあっても、妥当だとう要約ようやくぶん生成せいせいできていることがわかる。

煩雑はんざつ難易なんいたかい「対話たいわテキストの要約ようやく」に挑戦ちょうせん

 さらに同社どうしゃは、ELYZA DIGESTによる要約ようやく精度せいど評価ひょうかおこなうために、人間にんげん作成さくせいした要約ようやくぶんとの比較ひかく検証けんしょう実施じっしした。

ニュース記事きじについて、ELYZA DIGESTと人間にんげん要約ようやくぶん比較ひかくした結果けっか数値すうち対象たいしょうのニュース記事きじのうち、かく評価ひょうか項目こうもくたいして問題もんだいない要約ようやくぶん作成さくせいできた割合わりあい(%)をあらわ

 「正確せいかくせい」の観点かんてんでは、ELYZA DIGESTは全体ぜんたいの90%の記事きじたいして問題もんだいない出力しゅつりょくができており、人間にんげん匹敵ひってきする精度せいど要約ようやくぶん生成せいせいできているという結果けっかとなった。一方いっぽう、「流暢りゅうちょうせい」の観点かんてんでは、人間にんげん要約ようやくくらべるとなんらかのミスがある出力しゅつりょくをする割合わりあいおお結果けっかとなった。その内訳うちわけとしては、いわゆる文法ぶんぽうのミスにくわえ、日本語にほんごによくある原文げんぶんでの主語しゅご省略しょうりゃくたいして、要約ようやくぶん適切てきせつ主語しゅご補完ほかんできていないことにより、ぶんすこみにくくなっているような箇所かしょ見受みうけられた。これらのてんについては、改善かいぜん必要ひつようとしている。

 また、要約ようやく効率こうりつせいについては、今回こんかい検証けんしょうもちいた記事きじ平均へいきん900程度ていどだったが、ELYZA DIGESTでは1記事きじあたり10びょう以下いか要約ようやくできる一方いっぽう人間にんげん場合ばあいは5ふん程度ていど時間じかんようした。このことから、精度せいど十分じゅうぶんであれば、要約ようやくAIを活用かつようすることで大幅おおはば業務ぎょうむ効率こうりつ期待きたいできるという。

要約ようやく所要しょよう時間じかん比較ひかく

 同社どうしゃは、「対話たいわテキストの要約ようやく」を実用じつようするための第一歩だいいっぽとして、SOMPOホールディングスと提携ていけいし、グループ会社かいしゃ損害そんがい保険ほけんジャパンのカスタマーセンターにおける対話たいわ要約ようやく作成さくせい業務ぎょうむ支援しえんし、音声おんせい認識にんしき対話たいわテキストから要約ようやくするAIの開発かいはつんでいる。

関連かんれんサイト

「ASCII STARTUPウィークリーレビュー」配信はいしんのご案内あんない

ASCII STARTUPでは、「ASCII STARTUPウィークリーレビュー」とだいしたメールマガジンにて、国内こくない最先端さいせんたんのスタートアップ情報じょうほう、イベントレポート、関連かんれんするエコシステム識者しきしゃなどの取材しゅざい成果せいか毎週まいしゅう月曜げつよう配信はいしんしています。興味きょうみがあるほうは、以下いか登録とうろくフォームボタンをクリックいただき、メールアドレスの設定せっていをおねがいいたします。

わせてみたい編集へんしゅうしゃオススメ記事きじ