音声・音響信号処理の国際学会で論文採択
追加学習不要!LINE WORKSが専門・社内用語の音声認識を向上させる技術を開発
2024年07月31日 17時30分更新
文● ASCII
LINE WORKSは、2024年7月31日、音声・音響信号処理における世界最大規模の国際学会「INTERSPEECH 2024」にて新技術「InterBiasing」を考案した論文が採択されたことを発表した。
同技術は、人名、業界特有の専門用語、社内用語といった、“学習データに存在しない”単語やフレーズを高精度で音声認識できるというもの。追加学習を必要とせず、事前にキーワードリストを与えるだけで、音声認識の精度を向上させる。
同技術では、複数のニューラルネットワーク層からなるEnd-to-End音声認識モデルの中間層に、認識させたいキーワードを条件付け、後続の層では与えられたキーワードを参考にしながら発話内容を推定する。これにより、End-to-End音声認識モデルが出力するトークンの事後確率分布を認識させたいキーワードが高い値を持つようにバイアスすることができ、追加学習なしでキーワードの認識精度を向上させる。
「InterBiasing」の概要図、2つのステップで構成される
LINE WORKSは、本技術をさらに発展させていき、音声認識技術の可能性を広げると共に、コミュニケーションツール「LINE WORKS」やAI製品への適用、新たな機能・サービスの創出を進めていく。