ビタビアルゴリズム

ビタビアルゴリズム（英えい: Viterbi algorithm）は、観測かんそくされた事象じしょう系列けいれつを結果けっかとして生しょうじる隠かくされた状態じょうたいの最もっとも尤もっともらしい並ならび（ビタビ経路けいろと呼よぶ）を探さがす動的どうてき計画けいかく法ほうアルゴリズムの一種いっしゅであり、特とくに隠かくれマルコフモデルに基もとづいている。観測かんそくされた事象じしょう系列けいれつの確かく率りつ計算けいさんのアルゴリズムである 前向まえむきアルゴリズム（英えい: forward algorithm）も密接みっせつに関連かんれんしている。これらのアルゴリズムは情報じょうほう理論りろんの一部いちぶである。

このアルゴリズムには、いくつかの前提ぜんてい条件じょうけんがある。まず、観測かんそくされた事象じしょうと隠かくされている事象じしょうは1つの系列けいれつ上じょうに並ならんでいる。この系列けいれつは多おおくの場合ばあい時どき系列けいれつである。次つぎに、これら2つの並ならびには一対一いちたいいちの対応たいおうがあり、1つの観測かんそくされた事象じしょうは正確せいかくに1つの隠かくされている事象じしょうに対応たいおうしている。第だい三さんに、時点じてん $t$ での最もっとも尤もっともらしい隠かくされている事象じしょうの計算けいさんは、 $t$ での観測かんそくされた事象じしょうと $t-1$ での最もっとも尤もっともらしい隠かくされた事象じしょうの系列けいれつのみに依存いぞんしている。これらの前提ぜんてい条件じょうけんは、全すべて一いち次じ隠がくれマルコフモデルで満みたされている。

「ビタビ経路けいろ英えい: Viterbi path」および「ビタビアルゴリズム」という用語ようごは、観測かんそく結果けっかについて1つの最もっとも尤もっともらしい説明せつめいを与あたえる動的どうてき計画けいかく法ほうのアルゴリズムに関かんして使つかわれる。例たとえば、動的どうてき計画けいかく法ほうのアルゴリズムを使つかった統計とうけい的てき構文こうぶん解析かいせきは、文字もじ列れつについて1つの最もっとも尤もっともらしい解析かいせき結果けっかを生しょうじる。そのため、これを「ビタビ構文こうぶん解析かいせき英えい: Viterbi parse」と呼よぶこともある。

ビタビアルゴリズムは、アンドリュー・ビタビがノイズのあるデジタル通信つうしん経路けいろにおける誤あやまり検出けんしゅつ訂正ていせい手法しゅほうとして生うみ出だしたものである。CDMAやGSMといったデジタル携帯けいたい電話でんわ、ダイヤルアップ接続せつぞく用ようモデム、通信つうしん衛星えいせい、宇宙うちゅう探査たんさでの通信つうしん、IEEE 802.11 無線むせんLAN などの畳たたみ込こみ符号ふごうの復号ふくごうに広ひろく利用りようされている。また、音声おんせい認識にんしき、自然しぜん言語げんご処理しょり、計算けいさん言語げんご学がく、バイオインフォマティクスなどにも使つかわれている。例たとえば、音声おんせい認識にんしきでは、音声おんせい信号しんごうを観測かんそくされた事象じしょうの系列けいれつとして扱あつかい、それを文字もじに変換へんかんしたものがその音声おんせい信号しんごうに対応たいおうした「隠かくされた原因げんいん」と見みなされる。ビタビアルゴリズムは、与あたえられた音声おんせい信号しんごうから最もっとも尤もっともらしい文字もじ列れつを見みつけ出だす。

概要がいよう

まず、上述じょうじゅつの前提ぜんてい条件じょうけんについて詳くわしく解説かいせつする。ビタビアルゴリズムは状態じょうたい機械きかいを仮定かていして動作どうさする。すなわち、モデルとしたシステムは任意にんいの時点じてんで何なんらかの状態じょうたいを持もつ。状態じょうたい数すうは膨大ぼうだいであっても有限ゆうげんであり、リストアップ可能かのうである。各かく状態じょうたいがノードとして表あらわされる。与あたえられた状態じょうたいに対応たいおうする状態じょうたいの系列けいれつ（経路けいろ）が複数ふくすう考かんがえられるとしても、最もっとも尤もっともらしい状態じょうたい経路けいろが1つあり、これを「生存せいぞん者しゃ経路けいろ英えい: survivor path」と呼よぶ。これがこのアルゴリズムの基本きほん的てきな前提ぜんていである。このアルゴリズムは、ある状態じょうたいに到達とうたつするあらゆる経路けいろを調しらべ、最もっとも尤もっともらしい経路けいろを選えらぶ。これを状態じょうたいの並ならびに対たいして順次じゅんじ適用てきようするため、あらゆる経路けいろを保持ほじしておく必要ひつようはなく、状態じょうたい1つにつき1つの経路けいろだけを保持ほじする。

第だい二にの重要じゅうような前提ぜんていは、ある状態じょうたいから別べつの状態じょうたいへの遷移せんいについて増分ぞうぶん（通常つうじょう、数かず）を付与ふよする点てんである。この遷移せんいは事象じしょうから求もとめられる。

第だい三さんの重要じゅうような前提ぜんていは、事象じしょうは一般いっぱんに加算かさん的てきな意味いみで経路けいろ上じょうで累積るいせきするとされる。従したがって、このアルゴリズムの急所きゅうしょは、各かく状態じょうたいについての数かずを保持ほじする点てんである。ある事象じしょうが起おきたとき、このアルゴリズムではこれまでの状態じょうたい経路けいろの持もつ値ねと新あらたな遷移せんいにおける増分ぞうぶんを考慮こうりょし、最もっとも良よいものを選択せんたくする。事象じしょうに対応たいおうした増分ぞうぶんは、ある状態じょうたいから別べつの状態じょうたいへの遷移せんい確かく率りつに依存いぞんして決定けっていされる。例たとえばデでータ通信たつうしんにおいて、シンボルの半分はんぶんを奇数きすうの状態じょうたいのときに送おくり、残のこる半分はんぶんを偶数ぐうすうの状態じょうたいのときに送おくるということも可能かのうである。さらに、多おおくの場合ばあい、状態じょうたい遷移せんい図ずは完全かんぜんに連結れんけつされてはいない。単純たんじゅんな例れいとして、自動車じどうしゃは、前進ぜんしん、停止ていし、後退こうたいという3つの状態じょうたいを持もつとしたとき、前進ぜんしんから後退こうたいへの直接ちょくせつの遷移せんいは不可能ふかのうであり、常つねに一旦いったんは停止ていし状態じょうたいになる必要ひつようがある。増分ぞうぶんと状態じょうたい値ちの組合くみあわせを計算けいさんすると、最良さいりょう値ちのみが残のこり、他たの経路けいろは捨すてられる。基本きほんアルゴリズムの変形へんけいとして、後方こうほう探索たんさくだけでなく前方ぜんぽう探索たんさくも許ゆるすものもある。

経路けいろ履歴りれきを記録きろくする必要ひつようがある。エンコーダの開始かいし時じの状態じょうたいが既知きちの状態じょうたいで、全ぜん経路けいろを保持ほじできるだけのメモリがあるなら、経路けいろ履歴りれきは有限ゆうげんである。そうでない場合ばあい、リソースが限かぎられているため、何なんらかのプログラム上じょうの解決かいけつ策さくを必要ひつようとする。1つの例れいとして畳たたみ込こみ符号ふごう化かがある。その場合ばあい、性能せいのうを許容きょよう可能かのうなレベルに維持いじしつつ、デコーダの履歴りれきの深ふかさを制限せいげんできる。ビタビアルゴリズムは非常ひじょうに効率こうりつ的てきだが、さらに計算けいさん負荷ふかを削減さくげんする変形へんけい版ばんも存在そんざいする。メモリ使用しよう量りょうは一定いっていとなる傾向けいこうがある。

具体ぐたい例れい

遠とおく離はなれた地ちに友人ゆうじんがいて、毎日まいにちその友人ゆうじんと電話でんわをして彼かれがその日ひ何なにをしたかを聞きくものとする。その友人ゆうじんは、公園こうえんを散歩さんぽすること、買かい物ものをすること、部屋へやを掃除そうじすることという3つのことにしか興味きょうみが無ない。ある日ひにどれをするかは、その日ひの天気てんきだけに依存いぞんする。その友人ゆうじんが住すんでいる地ちの天気てんきに関かんする具体ぐたい的てき情報じょうほうは、別べつ経路けいろでは全まったく得えられないが、一般いっぱん的てき傾向けいこうはわかっている。彼かれが電話でんわで話はなした毎日まいにちの行動こうどうに基もとづいて、その場所ばしょの天気てんきを推測すいそくしてみよう。天気てんきの変動へんどうは離散りさんマルコフ連鎖れんさになっているものとする。状態じょうたいとしては「雨あめ; Rainy」と「晴はれ; Sunny」の2つだけだが、直接ちょくせつ観測かんそくすることはできないので、我々われわれにとってはそれが「隠かくされた」状態じょうたいである。毎日まいにち、友人ゆうじんは「散歩さんぽ; walk」、「買かい物もの; shop」、「掃除そうじ; clean」のいずれかを行おこなう可能かのう性せいがある。彼かれは何なにをしたかを電話でんわ連絡れんらくしてくるので、それが「観測かんそくされた」状態じょうたいとなる。システム全体ぜんたいとしては、隠かくれマルコフモデル (HMM) となる。

その地域ちいきの天気てんきの傾向けいこうはわかっていて、平均へいきん的てきにその友人ゆうじんが何なにをする傾向けいこうがあるかもわかっている。い換いかえれば、HMM のパラメータは既知きちである。これを Python で書かくと次つぎのようになる。

states = ('Rainy', 'Sunny')
 
observations = ('walk', 'shop', 'clean')
 
start_probability = {'Rainy': 0.6, 'Sunny': 0.4}
 
transition_probability = {
    'Rainy' : {'Rainy': 0.7, 'Sunny': 0.3},
    'Sunny' : {'Rainy': 0.4, 'Sunny': 0.6},
    }
 
emission_probability = {
    'Rainy' : {'walk': 0.1, 'shop': 0.4, 'clean': 0.5},
    'Sunny' : {'walk': 0.6, 'shop': 0.3, 'clean': 0.1},
    }

このコードにおいて、start_probability は最初さいしょに友人ゆうじんが電話でんわしてきたときに HMM がどの状態じょうたいにあるかを表あらわしている（つまり、雨あめの可能かのう性せいがやや高たかいということしか知しらない）。ここで使つかわれている確かく率りつ分布ぶんぷは定常ていじょう時じのものではない（定常ていじょう時じの確かく率りつ分布ぶんぷはだいたい {'Rainy': 0.571, 'Sunny': 0.429} である）。transition_probability は、このマルコフ連鎖れんさでの天気てんきの変化へんかを表あらわしている。この例れいでは、今日きょうが雨あめだった場合ばあいに翌日よくじつが晴はれとなる可能かのう性せいは 30% しかない。emission_probability は、友人ゆうじんがある活動かつどうを行おこなう確かく率りつを示しめしている。雨あめだった場合ばあい、50% の確かく率りつで部屋へやを掃除そうじする。晴はれだった場合ばあい、60% の確かく率りつで外そとを散歩さんぽする。

友人ゆうじんと三さん日間にちかん続つづけて話はなしをしたところ、初日しょにちは散歩さんぽ、二日ふつか目めは買かい物もの、三日みっか目めは掃除そうじをしたという。ここで2つの疑問ぎもんが生しょうじる。この観測かんそくされたシーケンスの全体ぜんたいとしての確かく率りつはどうなるか? そして、この観測かんそく結果けっかを説明せつめいする最もっとも尤もっともらしい天気てんきのシーケンスはどうなるか? 第だい一いちの疑問ぎもんには前向まえむきアルゴリズムで答こたえられる。第だい二にの疑問ぎもんにはビタビアルゴリズムで答こたえられる。これら2つのアルゴリズムは構造こうぞう的てきに非常ひじょうに近ちかいので（実際じっさい、これらは同おなじ抽象ちゅうしょうアルゴリズムのインスタンスである）、1つの関数かんすうとして次つぎのように実装じっそうできる。

 def forward_viterbi(y, X, sp, tp, ep):
    T = {}
    for state in X:
        ##          prob.      V. path  V. prob.
        T[state] = (sp[state], [state], sp[state])
    for output in y:
        U = {}
        for next_state in X:
            total = 0
            argmax = None
            valmax = 0
            for source_state in X:
                (prob, v_path, v_prob) = T[source_state]
                p = ep[source_state][output] * tp[source_state][next_state]
                prob *= p
                v_prob *= p
                total += prob
                if v_prob > valmax:
                    argmax = v_path + [next_state]
                    valmax = v_prob
            U[next_state] = (total, argmax, valmax)
        T = U
    ## apply sum/max to the final states:
    total = 0
    argmax = None
    valmax = 0
    for state in X:
        (prob, v_path, v_prob) = T[state]
        total += prob
        if v_prob > valmax:
            argmax = v_path
            valmax = v_prob
    return (total, argmax, valmax)

関数かんすう forward_viterbi は、次つぎのような引数ひきすうをとる。y は観測かんそくシーケンスであり、例れいでは ('walk', 'shop', 'clean') となる。X は隠かくされた状態じょうたいの集合しゅうごうである（例れいでは states）。sp は初期しょきの確かく率りつである（例れいでは start_probability）。tp は遷移せんい確かく率りつである（例れいでは transition_probability）。ep は隠かくされた状態じょうたいから観測かんそくされた状態じょうたいへの対応たいおう確かく率りつである（例れいでは emission_probability）。

このアルゴリズムは、T と U というマッピングを使つかう。これらは、状態じょうたいから3つ組くみ (prob, v_path, v_prob) へのマッピングであり、prob は初期しょき状態じょうたいから現在げんざい状態じょうたいまでの全ぜん経路けいろの確かく率りつ、v_path は現在げんざい状態じょうたいまでのビタビ経路けいろ、v_prob は現在げんざい状態じょうたいまでのビタビ経路けいろの確かく率りつである。マッピング T は与あたえられた時点じてん $t$ についてのこの情報じょうほうを保持ほじし、メインループで構築こうちくする U は $t+1$ の時点じてんについての同様どうようの情報じょうほうを保持ほじする。マルコフ性せいがあるため、 $t$ 以前いぜんの時点じてんに関かんする情報じょうほうは不要ふようである。

このアルゴリズムでは、まず $T$ を初期しょきの確かく率りつで初期しょき化かする。ある状態じょうたいの全体ぜんたい確かく率りつは単たんにその状態じょうたいの初期しょきの確かく率りつとなる。初期しょき状態じょうたいへのビタビ経路けいろは、その状態じょうたいのみを含ふくむシングルトン経路けいろである。ビタビ経路けいろの確かく率りつは、初期しょきの確かく率りつと等ひとしい。

メインループでは、y から順じゅんに観測かんそく結果けっかを取とり出だす。T はそこまでの時点じてんでの正ただしい情報じょうほうを含ふくむが、現在げんざいの観測かんそく時点じてんに関かんする情報じょうほうは含ふくまない。このアルゴリズムでは次つぎに、考かんがえられる次つぎの状態じょうたいについての3つ組くみ (prob, v_path, v_prob) を計算けいさんする。与あたえられた次つぎの状態じょうたいの全体ぜんたい確かく率りつ total は、その状態じょうたいに到達とうたつする全ぜん経路けいろの確かく率りつの総和そうわによって得えられる。より正確せいかくに言いえば、このアルゴリズムは考かんがえられる全すべての元もとの状態じょうたいについて繰くり返かえしている。それぞれの元もとの状態じょうたいについて T は、その状態じょうたいに到達とうたつする全ぜん経路けいろの全体ぜんたい確かく率りつを保持ほじしている。この確かく率りつに、その状態じょうたいで現在げんざいの観測かんそく値ちが得えられる確かく率りつと次つぎの状態じょうたいに遷移せんいする確かく率りつをかける。それによって得えられる確かく率りつ prob を total に加算かさんする。ビタビ経路けいろの確かく率りつも同様どうように求もとめられるが、その場合ばあいは全ぜん経路けいろの総和そうわを計算けいさんするのではなく、最大さいだい値ちを持もつ経路けいろを選択せんたくする。初期しょき状態じょうたいでは、最大さいだい値ち valmax はゼロに設定せっていされている。元もとの状態じょうたいについて、その状態じょうたいまでのビタビ経路けいろの確かく率りつは既知きちである。この場合ばあいも同様どうように、その状態じょうたいで現在げんざいの観測かんそく値ちが得えられる確かく率りつと次つぎの状態じょうたいに遷移せんいする確かく率りつをその時点じてんまでのビタビ経路けいろの確かく率りつにかけ、それが valmax の現在げんざい値ちよりも大おおきい場合ばあいは valmax を置おき換かえる。ビタビ経路けいろそのものは、最大さいだい値ちに対応たいおうした状態じょうたい系列けいれつを argmax として保持ほじする。このように計算けいさんされた3つ組くみ (prob, v_path, v_prob) が U に格納かくのうされ、全すべての可能かのうな次つぎの状態じょうたいについて U の計算けいさんが完了かんりょうした時点じてんで、それを T に代入だいにゅうする。

最後さいごに総和そうわと最大さいだいをとる（最後さいごの実際じっさいの観測かんそく結果けっかを処理しょりした後のちに仮想かそう的てきな観測かんそく結果けっかを処理しょりするようにすれば、メインループ内ないでもできる）。

当初とうしょの例れいにこのアルゴリズムを適用てきようする場合ばあい、次つぎのようになる。

def example():
    return forward_viterbi(observations,
                           states,
                           start_probability,
                           transition_probability,
                           emission_probability)
print example()

これにより、['walk', 'shop', 'clean'] という並ならびの全体ぜんたい確かく率りつは 0.033612、ビタビ経路けいろは ['Sunny', 'Rainy', 'Rainy', 'Rainy'] となる。3つ目めの観測かんそく結果けっかから3つ目めの状態じょうたいと4つ目めの状態じょうたいへの遷移せんいが求もとめられるので、ビタビ経路けいろには4つ目めの状態じょうたいも含ふくまれている。つまり、与あたえられた観測かんそく結果けっかから、友人ゆうじんが散歩さんぽに出でた初日しょにちは晴はれだったが、その後ご雨あめが降ふり続つづいている可能かのう性せいが最もっとも高たかいと言いえる。

このアルゴリズムを実装じっそうする際さい、多おおくの言語げんごでは浮動ふどう小数点しょうすうてん数すうを使つかうと思おもわれるが、p が小ちいさいと結果けっかとしてアンダーフローを生しょうじる危険きけん性せいがある。これを防ふせぐ技法ぎほうとして、確かく率りつの対数たいすうをとり、計算けいさんを全すべてその対たい数値すうちで行おこなう方法ほうほうがある。最終さいしゅう的てきな値ねが対数たいすうで得えられたら、それに適切てきせつな指数しすう関数かんすうを適用てきようすれば、真しんの値ねが求もとめられる。

拡張かくちょう

反復はんぷくビタビ復号ふくごうと呼よばれるアルゴリズムでは、与あたえられた HMM に最もっともよくマッチする観測かんそく結果けっか内ないの部分ぶぶん系列けいれつを探さがし出だす。反復はんぷくビタビ復号ふくごうは、評価ひょうかが収束しゅうそくするまで繰くり返かえしビタビアルゴリズム（の変形へんけいしたもの）を呼よび出だす。

別べつのアルゴリズムとして遅延ちえんビタビアルゴリズムが提案ていあんされている。これは本当ほんとうに必要ひつようになるまでノードを展開てんかいしない方式ほうしきで、ソフトウェアでは通常つうじょうのビタビアルゴリズムよりも少すくない手順てじゅん数すうで同おなじ結果けっかが得えられる。しかし、これをハードウェアで並列へいれつ化かするのは容易よういではない。

参考さんこう文献ぶんけん

Andrew J. Viterbi. Error bounds for convolutional codes and an asymptotically optimum decoding algorithm, IEEE Transactions on Information Theory 13(2):260–269, April 1967. （ビタビアルゴリズムは section IV にある）
G. D. Forney. The Viterbi algorithm. Proceedings of the IEEE 61(3):268–278, March 1973.
L. R. Rabiner. A tutorial on hidden Markov models and selected applications in speech recognition. Proceedings of the IEEE 77(2):257–286, February 1989.
J Feldman, I Abou-Faycal and M Frigo. A Fast Maximum-Likelihood Decoder for Convolutional Codes.

外部がいぶリンク

アンドリュー・ビタビへのインタビュービタビアルゴリズム発見はっけんに関かんする背景はいけいが語かたられている。
Perl によるビタビアルゴリズムの実装じっそう例れい
Python によるビタビアルゴリズムの実装じっそう例れい

概要がいよう

具体ぐたい例れい

拡張かくちょう

参考さんこう文献ぶんけん

関連かんれん項目こうもく

外部がいぶリンク