(Translated by https://www.hiragana.jp/)
ROUGE (評価指標) - Wikipedia コンテンツにスキップ

ROUGE (評価ひょうか指標しひょう)

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

ROUGEえい: Recall-Oriented Understudy for Gisting Evaluation[1]は、自然しぜん言語げんご処理しょりにおいて自動じどう要約ようやく機械きかい翻訳ほんやく評価ひょうかするために使用しようされる指標しひょう。システムにより自動じどう生成せいせいされた要約ようやく翻訳ほんやくと、人間にんげん作成さくせいした要約ようやく翻訳ほんやく比較ひかくし、そのしつ評価ひょうかする。

指標しひょう種類しゅるい

[編集へんしゅう]

おも以下いかの5つの評価ひょうか指標しひょう利用りようされる。

  • ROUGE-N:システムと参照さんしょう要約ようやくあいだn-gram [2]
    • ROUGE-1は、システム要約ようやく正解せいかい要約ようやくあいだ1-gram単語たんご)の共起きょうき評価ひょうかする。
    • ROUGE-2は、システム要約ようやく正解せいかい要約ようやくあいだ2-gram共起きょうき評価ひょうかする。
  • ROUGE-L:最長さいちょう共通きょうつう分列ぶんれつ(LCS) [3]ベースの評価ひょうか。システム要約ようやく正解せいかい要約ようやくあいだぶん順番じゅんばん沿って共起きょうきしている単語たんご個数こすう評価ひょうかするため、ぶん単位たんい類似るいじせい自然しぜん評価ひょうかできる。
  • ROUGE-W:おもけされたLCSベースの指標しひょう
  • ROUGE-S:Skip-bigram[3]ベースの共起きょうき指標しひょう
  • ROUGE-SU:Skip-bigramと1-gramベースの共起きょうき指標しひょう

脚注きゃくちゅう

[編集へんしゅう]

関連かんれん項目こうもく

[編集へんしゅう]
  • BLEU
  • F
  • METEOR
  • NIST(評価ひょうか指標しひょう
  • 単語たんごあやまりつ(WER)

参考さんこう文献ぶんけん

[編集へんしゅう]