ベイズ確 かく 率 りつ (ベイズかくりつ、英 えい : Bayesian probability )とは、確 かく 率 りつ の概念 がいねん を解釈 かいしゃく したもので、ある現象 げんしょう の頻度 ひんど や傾向 けいこう の代 か わりに、確 かく 率 りつ を知識 ちしき の状態 じょうたい [ 1] を表 あらわ す合理 ごうり 的 てき な期待 きたい 値 ち [ 2] 、あるいは個人 こじん 的 てき な信念 しんねん の定量 ていりょう 化 か と解釈 かいしゃく したものである[ 3] 。
ベイズ確 かく 率 りつ の解釈 かいしゃく は、命題 めいだい 論理 ろんり を拡張 かくちょう したものであり、真偽 しんぎ が不明 ふめい な命題 めいだい を用 もち いた推論 すいろん を可能 かのう にするものと考 かんが えられる[ 4] 。ベイズの考 かんが え方 かた では仮説 かせつ に確 かく 率 りつ を付与 ふよ するが、頻度 ひんど 論 ろん 的 てき な推論 すいろん では確 かく 率 りつ を付与 ふよ せずに仮説 かせつ を検証 けんしょう するのが一般 いっぱん 的 てき である。
ベイズ確 かく 率 りつ は証拠 しょうこ 能力 のうりょく のある確 かく 率 りつ のカテゴリーに属 ぞく する。仮説 かせつ の確 かく 率 りつ を評価 ひょうか するために、ベイズ確率 かくりつ 論 ろん 者 しゃ は事前 じぜん 確 かく 率 りつ を指定 してい する。仮説 かせつ の確 かく 率 りつ を評価 ひょうか するために、ベイズの確率 かくりつ 論 ろん 者 しゃ は事前 じぜん 確 かく 率 りつ を指定 してい し、新 あたら しい関連 かんれん データ(証拠 しょうこ )に照 て らし合 あ わせて事後 じご 確 かく 率 りつ に更新 こうしん する[ 5] 。ベイジアン解釈 かいしゃく では、この計算 けいさん を行 おこな うための標準 ひょうじゅん 的 てき な手順 てじゅん と式 しき が用意 ようい されている。
ベイジアンという言葉 ことば は、18世紀 せいき の数学 すうがく 者 しゃ ・神学 しんがく 者 しゃ であるトーマス・ベイズ に由来 ゆらい する。ベイズは、現在 げんざい ベイズ推定 すいてい として知 し られているものを用 もち いて、統計 とうけい 的 てき データ分析 ぶんせき の自明 じめい でない問題 もんだい を初 はじ めて数学 すうがく 的 てき に扱 あつか った人物 じんぶつ である[ 6] 。また、数学 すうがく 者 しゃ のピエール=シモン・ラプラス は、現在 げんざい ではベイズ確 かく 率 りつ と呼 よ ばれているものを開拓 かいたく し、普及 ふきゅう させた[ 6] 。
ベイズ法 ほう は、以下 いか のような概念 がいねん と手順 てじゅん によって特徴 とくちょう づけられる。
情報 じょうほう 不足 ふそく に起因 きいん する不 ふ 確実 かくじつ 性 せい を含 ふく む、統計 とうけい モデルにおける不 ふ 確実 かくじつ 性 せい のすべての原因 げんいん をモデル化 か するために、確 かく 率 りつ 変数 へんすう 、より一般 いっぱん 的 てき には未知 みち の量 りょう [ 7] を使用 しよう すること(アレトロール的 てき 不 ふ 確実 かくじつ 性 せい およびエピステミックな不 ふ 確実 かくじつ 性 せい も参照 さんしょう )。
利用 りよう 可能 かのう な(事前 じぜん の)情報 じょうほう を考慮 こうりょ して、事前 じぜん の確 かく 率 りつ 分布 ぶんぷ を決定 けってい する必要 ひつよう がある。
ベイズの定理 ていり の逐次 ちくじ 使用 しよう (逐次 ちくじ ベイズ推定 すいてい ):より多 おお くのデータが利用 りよう 可能 かのう になった場合 ばあい 、ベイズの公式 こうしき を用 もち いて事後 じご 分布 ぶんぷ を計算 けいさん し、その後 ご 、事後 じご 分布 ぶんぷ が次 つぎ の事前 じぜん 分布 ぶんぷ となる。
頻度 ひんど 主義 しゅぎ 者 しゃ にとって、仮説 かせつ は(真 しん か偽 にせ かの)命題 めいだい であり、頻度 ひんど 主義 しゅぎ 者 しゃ にとっての仮説 かせつ の確 かく 率 りつ は0か1であるが、ベイズ統計 とうけい 学 がく では、真理 しんり 値 ち が不確 ふたし かであれば、仮説 かせつ に割 わ り当 あ てられる確 かく 率 りつ も0から1の範囲 はんい になる。
ベイズ確 かく 率 りつ (およびベイズ統計 とうけい 学 がく )は、ベイズの定理 ていり の特別 とくべつ な場合 ばあい を証明 しょうめい したトーマス・ベイズ にちなんだ命名 めいめい (実際 じっさい の命名 めいめい は1950年代 ねんだい )ではあるが、ベイズ自身 じしん が現在 げんざい のようなベイズ確 かく 率 りつ やベイズ推定 すいてい の考 かんが え方 かた を持 も っていたかどうかは定 さだ かでない。
ベイズ確 かく 率 りつ の考 かんが え方 かた を積極 せっきょく 的 てき に用 もち いたのはピエール=シモン・ラプラス (ベイズの定理 ていり の一般 いっぱん 的 てき な場合 ばあい を証明 しょうめい した)で、それを「土星 どせい の質量 しつりょう を確 かく 率 りつ 的 てき に見積 みつ もる」というような問題 もんだい に応用 おうよう した。しかし彼 かれ 以後 いご は長 なが らくこの考 かんが え方 かた は顧 かえり みられなかった。土星 どせい の質量 しつりょう は推測 すいそく 値 ち だからと言 い っても確 かく 率 りつ 的 てき に分布 ぶんぷ するわけではなく、観測 かんそく 誤差 ごさ の方 ほう が確 かく 率 りつ 的 てき に分布 ぶんぷ するのであると頻度 ひんど 主義 しゅぎ では考 かんが える。特 とく に19世紀 せいき 末 まつ 以降 いこう に発展 はってん した数理 すうり 統計 とうけい 学 がく は専 もっぱ ら頻度 ひんど 主義 しゅぎ に基 もと づいて厳密 げんみつ な理論 りろん を構築 こうちく した。
確 かく 率 りつ の主観 しゅかん 的 てき 解釈 かいしゃく (のちにベイズ主義 しゅぎ と呼 よ ばれる)は1931年 ねん に哲学 てつがく 者 しゃ ・数学 すうがく 者 しゃ のフランク・ラムゼイ によって提唱 ていしょう され、彼 かれ は別 べつ の主観 しゅかん 確 かく 率 りつ (論理 ろんり 確 かく 率 りつ )の支持 しじ 者 しゃ だったケインズ と論争 ろんそう をしているが、彼 かれ 自身 じしん はこれを頻度 ひんど 主義 しゅぎ 的 てき 解釈 かいしゃく の単 たん なる補助 ほじょ としか考 かんが えなかった。これをさらに厳密 げんみつ に取 と り上 あ げたのは1937年 ねん 、統計 とうけい 学者 がくしゃ ブルーノ・デ・フィネッティ である。さらに初 はじ めて詳細 しょうさい な分析 ぶんせき を加 くわ えたのは1954年 ねん 、レオナード・ジミー・サヴェッジ (英語 えいご 版 ばん ) であって、彼 かれ の考 かんが え方 かた にはベイズ確 かく 率 りつ ・ベイズ主義 しゅぎ という呼 よ び名 な が適用 てきよう された。そのほか初期 しょき の研究 けんきゅう 者 しゃ にはバーナード・クープマン (英語 えいご 版 ばん ) 、エイブラハム・ウォールド らがいる。これらの研究 けんきゅう は現在 げんざい 広 ひろ く受 う け入 い れられるようになってきたが、頻度 ひんど 主義 しゅぎ 者 しゃ とベイズ主義 しゅぎ 者 しゃ の亀裂 きれつ は現在 げんざい でも尾 お を引 ひ いており、両 りょう 主義 しゅぎ の支持 しじ 者 しゃ の一部 いちぶ は互 たが いに議論 ぎろん せず共通 きょうつう の学会 がっかい に参加 さんか しないといった状況 じょうきょう が続 つづ いている。
ベイズ主義 しゅぎ の基本 きほん 的 てき な考 かんが え方 かた は、数学 すうがく 的 てき 確率 かくりつ 論 ろん において現 あらわ れるベイズの定理 ていり を、主観 しゅかん 的 てき 確 かく 率 りつ におけるデータ集積 しゅうせき に応 おう じて改訂 かいてい し、さらに経験 けいけん 的 てき に解釈 かいしゃく し、統計 とうけい 問題 もんだい に適用 てきよう することである。このような確 かく 率 りつ 理解 りかい に基 もと づいて功利 こうり を計算 けいさん し、合理 ごうり 的 てき 意思 いし 決定 けってい の問題 もんだい として考 かんが えていく。つまり、ベイズの定理 ていり における P (B |A ) のうち、データ B を得 え たときの A が成 な り立 た つ条件 じょうけん 付 つ き確 かく 率 りつ を求 もと め、新 あたら しいデータ B 1 , B 2 , B 3 , …, B n が得 え られるたびに、A の生起 せいき 確 かく 率 りつ を更新 こうしん する。この応用 おうよう としてリチャード・ジェフリー の証拠 しょうこ 的 てき 意思 いし 決定 けってい 理論 りろん も編 あ み出 だ されている。
このような手法 しゅほう は、観測 かんそく された頻度 ひんど 分布 ぶんぷ あるいは想定 そうてい された母集団 ぼしゅうだん の割合 わりあい から導 みちび かれるのが確 かく 率 りつ であるとする頻度 ひんど 確 かく 率 りつ の概念 がいねん とは対照 たいしょう 的 てき である。また、統計 とうけい 学 がく 的 てき 方法 ほうほう が大 おお きく異 こと なる場合 ばあい も多 おお い。ただし、ベイズ主義 しゅぎ と頻度 ひんど 主義 しゅぎ とで同 おな じ結論 けつろん が得 え られる問題 もんだい も多 おお い。他方 たほう 、統計 とうけい 学 がく 的 てき 仮説 かせつ 検定 けんてい について、ベイズ主義 しゅぎ と頻度 ひんど 主義 しゅぎ との差 さ が現 あらわ れやすい。頻度 ひんど 主義 しゅぎ では推定 すいてい したいパラメータは一 ひと つの真 しん の値 ね をとると考 かんが えるが、ベイズ主義 しゅぎ においてはパラメータは確 かく 率 りつ 変数 へんすう であると考 かんが える。
ここで、ベイズ主義 しゅぎ 者 しゃ "Bayesian"が考 かんが える確 かく 率 りつ と頻度 ひんど 主義 しゅぎ 者 しゃ "Frequentist"が考 かんが える確 かく 率 りつ とが全 まった く異 こと なる値 ね となる例 れい を一 ひと つ示 しめ す。
ここに1枚 まい のインチキコインがあるとする。すなわち、表 ひょう か裏 うら のどちらかが出 で やすくなっている。
ただし、どちらが出 で やすいのかはわからない。
では、このコインを投 な げたとして表 ひょう が出 で る確 かく 率 りつ をどう計算 けいさん すべきか?
ベイズ主義 しゅぎ 者 しゃ が正 ただ しいと考 かんが えるであろう確 かく 率 りつ
表 ひょう が出 で る確 かく 率 りつ は、1 ⁄2 である。
理由 りゆう :表 ひょう と裏 うら のどちらが出 で やすいのか全 まった く不明 ふめい である。それ故 こ 、表 ひょう の出 で る確 かく 率 りつ も裏 うら の出 で る確 かく 率 りつ も全 まった く平等 びょうどう である。それ故 こ 、理由 りゆう 不十分 ふじゅうぶん の原理 げんり により、ともに1 ⁄2 とする以外 いがい にない。
頻度 ひんど 主義 しゅぎ 者 しゃ が正 ただ しいと考 かんが えるであろう確 かく 率 りつ
表 ひょう が出 で る確 かく 率 りつ は、0から1までのいずれかであるが、1 ⁄2 ではない。
理由 りゆう :コインを何 なん 度 ど も投 な げると、[表 ひょう の出 で た回数 かいすう / 投 な げた回数 かいすう ]は、ある値 ね に近 ちか づく(大数 たいすう の法則 ほうそく )。それが求 もと める確 かく 率 りつ である。
ただし、このコインはインチキコインなのだから1 ⁄2 には絶対 ぜったい にならない。
要 よう するに、ベイズ主義 しゅぎ 者 しゃ は、その時点 じてん で有 ゆう する情報 じょうほう をもとに計算 けいさん された確 かく 率 りつ を重視 じゅうし する。
(新 あら たな情報 じょうほう が入手 にゅうしゅ されれば確 かく 率 りつ は改定 かいてい される。)
これに対 たい して頻度 ひんど 主義 しゅぎ 者 しゃ は、無限 むげん 回 かい 試行 しこう を前提 ぜんてい とした確 かく 率 りつ を重視 じゅうし する。
ベイズの定理 ていり を用 もち いて、新 あたら しい証拠 しょうこ に照 て らして命題 めいだい
θ しーた
i
{\displaystyle \theta _{i}}
の尤 ゆう もらしさ(確 かく 率 りつ )の値 ね
p
i
{\displaystyle p_{i}}
を改訂 かいてい していく方法 ほうほう がベイズ推定 すいてい である。改訂 かいてい 前 まえ の値 ね を事前 じぜん 確 かく 率 りつ 、改訂 かいてい 後 ご を事後 じご 確 かく 率 りつ と呼 よ ぶ。事後 じご 確 かく 率 りつ は最良 さいりょう な推定 すいてい 結果 けっか そのものとなる。
例 たと えばラプラスはこの方法 ほうほう で土星 どせい の質量 しつりょう を見積 みつ もった(土星 どせい の質量 しつりょう の推定 すいてい 値 ち の事後 じご 確 かく 率 りつ 分布 ぶんぷ
p
(
m
sat
)
{\displaystyle p(m_{\text{sat}})}
の期待 きたい 値 ち
m
¯
sat
{\displaystyle {\bar {m}}_{\text{sat}}}
を計算 けいさん した)。
しかし頻度 ひんど 主義 しゅぎ による確 かく 率 りつ の定義 ていぎ では、このような適用 てきよう はできない。土星 どせい 質量 しつりょう の推定 すいてい 値 ち は確 かく 率 りつ 変数 へんすう ではないからである。「土星 どせい の質量 しつりょう とはどんな母集団 ぼしゅうだん から抽出 ちゅうしゅつ されたものか?」という問 と いに答 こた えられなければ、これは頻度 ひんど 主義 しゅぎ 者 しゃ の議論 ぎろん の対象 たいしょう にはならない。
ベイズ確 かく 率 りつ は現在 げんざい いろいろな方面 ほうめん で応用 おうよう されている。一方 いっぽう で頻度 ひんど 主義 しゅぎ に基 もと づく統計 とうけい 学 がく の理論 りろん 体系 たいけい に対 たい しては、かえって実用 じつよう 性 せい を犠牲 ぎせい にしているとのベイジアンからの批判 ひはん がある。むしろベイズ主義 しゅぎ のほうが人間 にんげん の思考 しこう 様式 ようしき になじむというわけである。ベイズ推定 すいてい は、まず複数 ふくすう の仮説 かせつ について尤 もっと もらしさ(信念 しんねん の度合 どあい )を考 かんが え、実験 じっけん や観測 かんそく により新 あたら しい情報 じょうほう (データ)を収集 しゅうしゅう し、それらを組 く み合 あ わせてベイズの定理 ていり によってその確 かく 率 りつ を改訂 かいてい するという点 てん で、科学 かがく 的 てき 方法 ほうほう のモデルとしても提案 ていあん されている。またベイズ因子 いんし (従来 じゅうらい の統計 とうけい 学 がく における尤 ゆう 度 ど を用 もち いる方法 ほうほう に似 に ている)を利用 りよう する方法 ほうほう はオッカムの剃刀 かみそり に対応 たいおう するものとされている。
ベイズ推定 すいてい を用 もち いた方法 ほうほう は近年 きんねん 、スパム を見 み つける方法 ほうほう (ベイジアンフィルタ )として利用 りよう され成果 せいか を上 あ げている。すでに分 わ かっているスパムの選別 せんべつ 法 ほう をフィルターに示 しめ し、次 つ いで単語 たんご の頻度 ひんど を用 もち いてスパムと必要 ひつよう な電子 でんし メール とを識別 しきべつ するのである。
^ Jaynes, E.T. (1986). “Bayesian Methods: General Background”. In Justice, J. H.. Maximum-Entropy and Bayesian Methods in Applied Statistics . Cambridge: Cambridge University Press
^ Cox, R.T. (1946). “Probability, Frequency, and Reasonable Expectation”. American Journal of Physics 14 (1): 1–10. Bibcode : 1946AmJPh..14....1C . doi :10.1119/1.1990764 .
^ de Finetti, Bruno (2017). Theory of Probability: A critical introductory treatment . Chichester: John Wiley & Sons Ltd.. ISBN 9781119286370
^ Hailperin, Theodore (1996). Sentential Probability Logic: Origins, Development, Current Status, and Technical Applications . London: Associated University Presses. ISBN 0934223459
^ Paulos (5 August 2011). “The Mathematics of Changing Your Mind [by Sharon Bertsch McGrayne ]”. 2011年 ねん 8月 がつ 6日 にち 閲覧 えつらん 。
^ a b Stigler, Stephen M. (March 1990). The history of statistics . Harvard University Press. ISBN 9780674403413
^ Dupré, Maurice J.; Tipler, Frank J. (2009). “New axioms for rigorous Bayesian probability” . Bayesian Analysis 4 (3): 599–606. doi :10.1214/09-BA422 . http://projecteuclid.org/download/pdf_1/euclid.ba/1340369856 .