条件じょうけん確率かくりつじょう

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

条件じょうけん確率かくりつじょう(じょうけんつきかくりつば、英語えいご: Conditional random field、略称りゃくしょう: CRF)はむかいグラフにより表現ひょうげんされるかくりつてきグラフィカルモデルひとつであり、識別しきべつモデルである。これは自然しぜん言語げんご処理しょり生体せいたい情報じょうほう工学こうがくコンピュータビジョンなどの分野ぶんや連続れんぞくデータの解析かいせきなどによく利用りようされる。とくにCRFは形態素けいたいそ解析かいせき固有こゆう表現ひょうげん抽出ちゅうしゅつゲノミクス応用おうようされ、かくれマルコフモデル関連かんれんするような問題もんだいにおいて、わりとしてももちいることができる。コンピュータビジョンにおいては、物体ぶったい認識にんしき画像がぞう領域りょういき分割ぶんかつ(セグメンテーション)などに使用しようされる。

概要がいよう[編集へんしゅう]

CRFは向性こうせいのグラフィカルモデルであり、それぞれの頂点ちょうてん分布ぶんぷ推論すいろんされるべきかくりつ変数へんすう表現ひょうげんする。あたりかくりつ変数へんすうあいだ依存いぞんせい表現ひょうげんする。詳細しょうさいグラフィカルモデルこう参照さんしょうのこと。モデルにおいては、かくりつ変数へんすうあいだたいでの依存いぞんせいのみがモデルされる。一般いっぱんてき場合ばあいは、高次こうじCRFs参照さんしょうのこと。かくノードやモデル全体ぜんたい指数しすう分布ぶんぷぞくとなることがおおい。この分布ぶんぷギブス分布ぶんぷにあるようにエネルギーこう記述きじゅつする。おおよそ興味きょうみある分布ぶんぷ相当そうとうするグラフ構造こうぞう既知きちであると仮定かていされる。一方いっぽう分布ぶんぷのパラメータは学習がくしゅうされる。CRFのパラメータの学習がくしゅう基本きほんてき前提ぜんていは、変数へんすう推論すいろんされるべきであるのにたい変数へんすうつね観測かんそくされるということである。このことは、同時どうじかくりつ最大さいだいとは対照たいしょうてきに、条件じょうけんかくりつ最大さいだい可能かのうにさせる。この計算けいさんはモデルの識別しきべつ学習がくしゅう相当そうとうする。

マルコフ確率かくりつじょうとの関連かんれんせい[編集へんしゅう]

CRFは特徴とくちょうてき訓練くんれんされたマルコフ確率かくりつじょうである。したがって、観測かんそく変数へんすう分布ぶんぷをモデルする必要ひつようはなく、モデルない観測かんそく変数へんすう複雑ふくざつ特徴とくちょう任意にんいふくめられる。

推論すいろん[編集へんしゅう]

CRFにおける厳密げんみつ推論すいろんは、一般いっぱんのグラフでは困難こんなんである。これは基本きほんてきにマルコフ確率かくりつじょうにおけるものとおなじである。ただし、連鎖れんさ構造こうぞうグラフなどの特殊とくしゅケースでは、厳密げんみつ推論すいろん可能かのうである。その場合ばあい使用しようされるアルゴリズムは、HMM使用しようされるフォワードバックワードアルゴリズムビタビアルゴリズム類似るいじしていて、動的どうてき計画けいかくほうなどがもちいられる。

パラメータの学習がくしゅう[編集へんしゅう]

パラメータ学習がくしゅう通常つうじょうについて最尤法さいゆうほうもちいておこなわれる。もしすべてのノードが指数しすうてき分布ぶんぷ訓練くんれんにおいて観測かんそくされるのなら、この最適さいてき関数かんすうとつがたである。L-BFGSほうアルゴリズムのような勾配こうばいほうはんニュートンほう使用しようしてサンプルに沿ってかれる。一方いっぽうで、いくつかの変数へんすう観測かんそくされないとき、推定すいてい問題もんだい観測かんそくされない変数へんすうについてもかれる必要ひつようがある。これは一般いっぱんてきなグラフにおいて厳密げんみつ推定すいていするためえず、推測すいそく使用しようされる必要ひつようがある。

れい[編集へんしゅう]

連続れんぞくモデルにおいて、関心かんしんのあるグラフは連鎖れんさグラフであることがおおい。観測かんそく変数へんすう入力にゅうりょくれつ観測かんそくれつ表現ひょうげんし、観測かんそくによって推測すいそくされるべき必要ひつようかくれた(しくは未知みちの)状態じょうたい変数へんすう表現ひょうげんする。連鎖れんさがた構成こうせいされ、かくあいだあたりつ。入力にゅうりょくれつのそれぞれの要素ようそたいして”ラベル”として簡単かんたん説明せつめいつのと同様どうように、このレイアウトはつぎ事柄ことがらたいして効果こうかてきなアルゴリズムをみちびく。

  • モデルの訓練くんれん: 訓練くんれんデータちゅうのあるコーパスから特徴とくちょう関数かんすうあいだ条件じょうけん分布ぶんぷ学習がくしゅうする
  • 推定すいていあたえられたたいしてあたえられたラベルれつかくりつ決定けっていする
  • 解読かいどくあたえられたたいしてもっともらしいラベルれつ決定けっていする

におけるかく条件じょうけん従属じゅうぞくかたちの”特徴とくちょう関数かんすう”の不変ふへん集合しゅうごうとおして定義ていぎされる。それはたいして各々おのおの可能かのうゆう部分ぶぶんてき決定けっていする入力にゅうりょくれつはかりとして、くだけてかんがえられる。このモデルはそれぞれの特徴とくちょう数値すうちてきおもみをあてて、たいして一定いっていかくりつ決定けっていするためにそれらを統合とうごうする。

線形せんけい連鎖れんさCRFは、概念がいねんじょう簡単かんたんかくれマルコフモデル(HMM)として同様どうよう応用おうようおおつが、HMMにたいして入力にゅうりょくおよび出力しゅつりょくれつ分布ぶんぷについての制約せいやくゆるめたものである。HMMは、状態じょうたい遷移せんい出力しゅつりょくをモデルするためにけつ まった分布ぶんぷ使用しようするような特殊とくしゅ特徴とくちょう関数かんすうつCRFとして大雑把おおざっぱ理解りかいされる。ぎゃくにCRFは、かくれた状態じょうたいれつなか自由じゆう変化へんかする任意にんい関数かんすうなか一定いってい遷移せんい分布ぶんぷ入力にゅうりょくれつ依存いぞんして生成せいせいするようなHMMの一般いっぱんとして大雑把おおざっぱ理解りかいされる。

HMMにたいしてはとく対照たいしょうてきに、CRFsは特徴とくちょう関数かんすういくつもふくめることができ、また特徴とくちょう関数かんすう観測かんそくにおける様々さまざまてん入力にゅうりょくれつ全体ぜんたい精査せいさでき、その値域ちいきかくりつてき解釈かいしゃく必要ひつようとしない。

高次こうじCRFsとセミマルコフCRFs[編集へんしゅう]

CRFsは整数せいすう指定していされた手前てまえ変数へんすう依存いぞんするかんがえることでより高次こうじのモデルに拡張かくちょうされる。訓練くんれん推定すいてい実際じっさいにはちいさいたいしてのみおこなわれる。これは計算けいさんコストがしたがって指数しすうてき増加ぞうかするためである。

べつのCRFsの一般いっぱんとして、セミマルコフ条件じょうけん確率かくりつじょう (semi-CRF) があり、これはラベルれつ可変長かへんちょうセグメンテーションをモデルしたものである。これは計算けいさんコストのおおきいちょう値域ちいき依存いぞんせいをモデルすることで高次こうじCRFsに相当そうとうする能力のうりょく提供ていきょうする。

ソフトウェア[編集へんしゅう]

以下いかはCRFを実行じっこうするためのソフトウェアのれいである。

参考さんこう文献ぶんけん[編集へんしゅう]

  • McCallum, A.: Efficiently inducing features of conditional random fields. In: Proc. 19th Conference on Uncertainty in Artificial Intelligence. (2003)
  • Wallach, H.M.: Conditional random fields: An introduction. Technical report MS-CIS-04-21, University of Pennsylvania (2004)
  • Sutton, C., McCallum, A.: An Introduction to Conditional Random Fields for Relational Learning. In "Introduction to Statistical Relational Learning". Edited by Lise Getoor and Ben Taskar. MIT Press. (2006) Online PDF
  • Klinger, R., Tomanek, K.: Classical Probabilistic Models and Conditional Random Fields. Algorithm Engineering Report TR07-2-013, Department of Computer Science, Dortmund University of Technology, December 2007. ISSN 1864-4503. Online PDF

関連かんれん項目こうもく[編集へんしゅう]