(Translated by https://www.hiragana.jp/)
ベイズ法 - Wikipedia コンテンツにスキップ

ベイズほう

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

ベイズほう(ベイズほう、えいBayesian inference method)は、生物せいぶつ系統けいとう進化しんかしめ系統けいとうじゅ推定すいていする手法しゅほうひとつ。ベイズの定理ていりもとづいてゆうとおしてデータを加味かみした事後じごかくりつ分布ぶんぷ目的もくてき関数かんすうにとり、マルコフ連鎖れんさモンテカルロほう適用てきようして事後じごかくりつ分布ぶんぷ推定すいていし、その期待きたいとしての最良さいりょうがた選択せんたくする。ベイズほう利用りようした系統けいとう推定すいていソフトウェアではMrBayesが代表だいひょうてきである[1]

理論りろん[編集へんしゅう]

基本きほんてき理論りろん[編集へんしゅう]

ベイズほうでは、最尤法さいゆうほうベイズ推定すいてい枠組わくぐみのなかさい構築こうちくされている。最尤法さいゆうほうではある特定とくてい仮定かてい進化しんかモデル)のしたあたえられた配列はいれつぐんゆう最大さいだいする系統けいとうじゅ最適さいてきじゅとして選択せんたくされる。すなわち、あたえられた配列はいれつたいする系統けいとうじゅえだちょう進化しんかモデルのゆう最尤法さいゆうほうでは目的もくてき関数かんすうとしてられている。一方いっぽうで、ベイズほう目的もくてき関数かんすうは、あたえられた配列はいれつたいする系統けいとうじゅがたえだちょう進化しんかモデルの事後じごかくりつとなる。最適さいてきじゅ事後じごかくりつ分布ぶんぷさいしき最大さいだい事後じごかくりつ推定すいていした系統けいとうじゅとして選択せんたくされる[2]

ただし、とくがた事前じぜん分布ぶんぷ一様いちよう分布ぶんぷとした場合ばあい最尤法さいゆうほうによる系統けいとうじゅとベイズほうによる系統けいとうじゅはほぼ一致いっちし、ベイズほうはむしろ最尤法さいゆうほう必要ひつようのない事後じごかくりつ計算けいさんするまわりくどい手法しゅほうとなる。そこでベイズほうでは単一たんいつ最適さいてきじゅもとめるのではなく、複数ふくすう最適さいてきじゅ事後じごかくりつとも提示ていじするか、あるいはそれらを統合とうごうして単一たんいつ合意ごういじゅ作成さくせいすることをおも目的もくてきとする。これにより、遺伝子いでんし水平すいへい伝播でんぱなどにより系統けいとうじゅ一意いちいさだまらない場合ばあいや、複数ふくすう系統けいとう仮説かせつもとめられる場合ばあいに、ベイズほう効果こうか発揮はっきすることになる[2]

アルゴリズム[編集へんしゅう]

系統けいとうじゅ事前じぜんかくりつ分布ぶんぷとする。配列はいれつデータXがあたえられた場合ばあい事後じごかくりつ分布ぶんぷは、最尤法さいゆうほうによりもとめられるゆう関数かんすうとすると、ベイズの定理ていりしたがって以下いかのようにあらわされる[2]

なお、系統けいとうじゅえだちょうと、その進化しんかモデルのすべてのパラメータもかくりつ分布ぶんぷとして予測よそくでき、実際じっさいにベイズほうもとめるかくりつ分布ぶんぷ分母ぶんぼ分子ぶんしともにえだちょうとパラメータのじゅう積分せきぶんかたち表現ひょうげんできる[2]。ただしいずれにせよ、分母ぶんぼ非常ひじょう小規模しょうきぼ系統けいとうじゅでなければ最尤法さいゆうほうによる計算けいさん不可能ふかのうであるため、ベイズほうではマルコフ連鎖れんさモンテカルロほう(MCMC)を利用りようして近似きんじてき計算けいさんし、同時どうじ最適さいてきがた探索たんさくおこなっている[2]

MCMCの手順てじゅんつぎとおりである[2]

  1. 近隣きんりん結合けつごうほう最大さいだい節約せつやくほうにより構築こうちくされた系統けいとうじゅか、あるいはランダム系統けいとうじゅ初期しょき系統けいとうじゅとする。初期しょき系統けいとうじゅえだちょう進化しんかモデルのパラメータも設定せっていし、初期しょき系統けいとうじゅゆうもとめる。
  2. 網羅もうらてき探索たんさくによりあらたな系統けいとうじゅ作成さくせいし、えだちょう進化しんかモデルのパラメータにも変更へんこうくわえ、あらたな系統けいとうじゅゆうもとめる。
  3. 新旧しんきゅう系統けいとうじゅゆう比較ひかくして、しん系統けいとうじゅゆうだいである場合ばあいに、しん系統けいとうじゅ採用さいようする。しん系統けいとうじゅゆうしょうであるならばひくかくりつしん系統けいとうじゅ採用さいようするが、おおくの場合ばあい棄却ききゃくし、べつあらたな系統けいとうじゅ作成さくせいする。
  4. 系統けいとうじゅとそのがたおよびパラメータを記録きろくし、2へもどる。このサイクルを延々えんえんかえす。

手順てじゅんかえすうちに系統けいとうじゅ定常ていじょう状態じょうたいたっする。定常ていじょう状態じょうたいたっするまでの記録きろく無視むしし、定常ていじょう状態じょうたいたっしている記録きろくから一定いってい回数かいすうごとに標本ひょうほん抽出ちゅうしゅつすると、その標本ひょうほん系統けいとうじゅ分布ぶんぷしたがうものになっているため、標本ひょうほん系統けいとうじゅぐんからうえしき分母ぶんぼ近似きんじてき計算けいさんできる。こうして事後じごかくりつ分布ぶんぷもとめられる[2]。また、ここでのがた出現しゅつげん頻度ひんど系統けいとうじゅ事後じごかくりつになる[3]

そのは、事後じごかくりつ最大さいだいとなる単一たんいつ系統けいとうじゅ選択せんたくするか、事後じごかくりつたかじゅん複数ふくすう系統けいとうじゅ選択せんたくして合意ごういじゅ形成けいせいする[2]

MrBayes[編集へんしゅう]

ベイズほうは1996ねんごろからYangにより系統けいとう推定すいてい導入どうにゅうされ、2001ねんにはベイズほう利用りようした系統けいとう推定すいていソフトウェアMrBayesが登場とうじょうした[2]。MrBayesはベイズほうもちいる系統けいとう推定すいていソフトウウェアのなかではもっとひろ使用しようされているものである[1]。MrBayesの登場とうじょうにより、より効率こうりつてきなアルゴリズムや現実げんじつてき進化しんかモデルが実装じっそうされたこともあり、ベイズほうひろ一般いっぱん普及ふきゅうした[2]

MrBayesでは、事後じごかくりつ分布ぶんぷがある程度ていどたか場所ばしょ局所きょくしょてき最適さいてきかい)でマルコフ連鎖れんさ定常ていじょう状態じょうたいたっしないよう、MCMCを改良かいりょうしたMetropolis Coupled MCMC(MCMCMC)が採用さいようされている。MCMCMCでは複数ふくすうほんのMCMCをはしらせており、そのうち1ほんをcold chain、のこりをhot chainとする。cold chainは元々もともとのMCMCであり、局所きょくしょてき最適さいてきかい脱出だっしゅつしにくい一方いっぽうで、膨大ぼうだい時間じかんをかければただしい事後じごかくりつ分布ぶんぷ収束しゅうそくする。hot chain では目標もくひょう分布ぶんぷ平坦へいたんされており、系統けいとうじゅ撹乱かくらんけるため、ただしい事後じごかくりつ分布ぶんぷへの収束しゅうそく保証ほしょう破棄はきする一方いっぽう局所きょくしょてき最適さいてきかいからの脱出だっしゅつりつたかめている。また、一定いってい回数かいすうごとにことなるchain同士どうし変数へんすう交換こうかんし、脱出だっしゅつ容易よういにしつつ収束しゅうそく効率こうりつたかめてもいる[2][3]

特徴とくちょう[編集へんしゅう]

ベイズほう複雑ふくざつ進化しんかモデルを仮定かていしても最尤法さいゆうほうよりも計算けいさん時間じかん必要ひつようとしないという長所ちょうしょがある[1]。ただし、近隣きんりん結合けつごうほう最大さいだい節約せつやくほう比較ひかくすれば時間じかんようする。また、事後じごかくりつ過大かだい評価ひょうかされるてん懸念けねんされている[4]

出典しゅってん[編集へんしゅう]

  1. ^ a b c さんちゅう信宏のぶひろ分子ぶんし系統けいとうがく最近さいきん進歩しんぽ今後こんご展望てんぼう」『植物しょくぶつ防疫ぼうえきだい63かんだい3ごう日本にっぽん植物しょくぶつ防疫ぼうえき協会きょうかい、2009ねん、192-196ぺーじ 
  2. ^ a b c d e f g h i j k 松井まついもとむ分子ぶんし系統けいとう解析かいせき最前線さいぜんせん」『JSBi Bioinformatics Review』だい2かんだい1ごう、2021ねん、30-57ぺーじdoi:10.11234/jsbibr.2021.7 オープンアクセス
  3. ^ a b 仲田なかた崇志たかし (2006ねん6がつ4にち). “Bayes ほう(ベイズほう)の原理げんり”. 2021ねん10がつ29にち閲覧えつらん
  4. ^ 飯野いいの隆夫たかお伊藤いとうたかし微生物びせいぶつ系統けいとうじゅ,どうえがくの?」『生物せいぶつこう学会がっかいだい91かんだい10ごう日本にっぽん生物せいぶつこう学会がっかい、2013ねん、576-581ぺーじ 

関連かんれん項目こうもく[編集へんしゅう]

外部がいぶリンク[編集へんしゅう]