かたよりと分散ぶんさん

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

かたよりと分散ぶんさんバイアス-バリアンスのトレードオフ(かたよりとぶんさんのトレードオフ、えい: bias–variance tradeoff)とは、統計とうけいがく機械きかい学習がくしゅうにおいて、パラメータ推定すいていにおいてバイアス(かたよ)をらすと標本ひょうほんあいだのバリアンス(分散ぶんさん)がえ、同時どうじにそのぎゃく成立せいりつする、という予測よそくモデルの特徴とくちょうのことである。

バイアス-バリアンスのジレンマ(bias–variance dilemma)やバイアス-バリアンスの問題もんだい(bias–variance problem)とは、誤差ごさ原因げんいんであるバイアスとバリアンスの両方りょうほう同時どうじらそうとするさい対立たいりつことであり、教師きょうしあり学習がくしゅうアルゴリズム訓練くんれんデータの内容ないようえてひろしするさい課題かだいとなる。

バイアス(かたよ
学習がくしゅうアルゴリズムにおいて、誤差ごさのうち、モデルの仮定かていあやまりに由来ゆらいするぶん。バイアスがおおきすぎることは、入力にゅうりょく出力しゅつりょく関係かんけい適切てきせつとらえられていないことを意味いみし、過少かしょう適合てきごうしている。
バリアンス(分散ぶんさん
誤差ごさのうち、訓練くんれんデータのらぎからしょうじるぶん。バリアンスがおおきすぎることは、本来ほんらい出力しゅつりょくではなく、訓練くんれんデータのランダムなノイズを学習がくしゅうしていることを意味いみし、過剰かじょう適合てきごうしている。

バイアス-バリアンス分解ぶんかい(bias–variance decomposition)とは、ひろし誤差ごさ期待きたいをバイアス+バリアンス+ノイズの3つの分解ぶんかいすることである。

バイアス-バリアンスのトレードオフは、すべての教師きょうしあり学習がくしゅうしょうじる。人間にんげん学習がくしゅうにおいて、人間にんげんヒューリスティクス使用しようすることの有効ゆうこうせい説明せつめいにも使用しようされている[1]

日本語にほんごでの訳語やくご[編集へんしゅう]

統計とうけいがくでは通常つうじょう bias はかたよ、variance は分散ぶんさん翻訳ほんやくするが、この文脈ぶんみゃくではバイアスとバリアンスとカタカナで表記ひょうきされることがおおい。書籍しょせき『パターン認識にんしき機械きかい学習がくしゅう』の翻訳ほんやくしゃはバイアス-バリアンスとやく[2]書籍しょせき統計とうけいてき学習がくしゅう基礎きそ』の翻訳ほんやくしゃはバイアス-分散ぶんさんやくした[3]

二乗にじょう誤差ごさのバイアス-バリアンス分解ぶんかい [編集へんしゅう]

データとして入力にゅうりょく があり、出力しゅつりょく とする。しん関数かんすう 存在そんざいし、平均へいきん0分散ぶんさん のノイズである。

しん関数かんすう 可能かのうかぎ近似きんじした 推定すいていしたいとする。可能かのうかぎりの意味いみとして、ここではじょう誤差ごさ 訓練くんれんデータだけでなく、すべてのデータにおいて最小さいしょうしたいとする。ここで はノイズ ふくんでいるので、原理げんりじょう完璧かんぺき推定すいていすることは不可能ふかのうである。

訓練くんれんデータから 推定すいていする教師きょうしあり学習がくしゅうアルゴリズム無数むすうにあるが、どのアルゴリズムであっても、二乗にじょう誤差ごさ期待きたい以下いかのように分解ぶんかいできる。

導出どうしゅつ[編集へんしゅう]

二乗にじょう誤差ごさのバイアス-バリアンス分解ぶんかい以下いかのように導出どうしゅつできる[4][5] および 簡略かんりゃく表記ひょうきする。分散ぶんさん定義ていぎより、

これをしき変形へんけいすると下記かきになる。

f は決定けっていろんてきなので、

より

より

独立どくりつなので、以下いかのようにしき変形へんけいできる。

手法しゅほう[編集へんしゅう]

次元じげん削減さくげん特徴とくちょう選択せんたくはモデルを簡単かんたんにすることによりバリアンスをらせる。訓練くんれんデータをやすこともバリアンスをらせる。特徴とくちょうりょう追加ついかすることはバイアスをらす傾向けいこうにあるが、バリアンスの追加ついか犠牲ぎせいとなる。

学習がくしゅうアルゴリズムはバイアスとバリアンスのバランスを調整ちょうせいするパラメータがあることがおおい。以下いかはそのれい

バイアス-バリアンスのトレードオフを解決かいけつする1つの方法ほうほうは、混合こんごうモデルアンサンブル学習がくしゅうである[9][10]たとえば、ブースティングでは複数ふくすうじゃく学習がくしゅう(バイアスがおおきい)をわせることでバイアスをげることができ、バギングではつよ学習がくしゅうわせることでバリアンスをらせる。

人間にんげん学習がくしゅうへの適用てきよう[編集へんしゅう]

バイアス-バリアンスのジレンマは機械きかい学習がくしゅう文脈ぶんみゃくひろ議論ぎろんされているが、人間にんげん認知にんち文脈ぶんみゃくでも検討けんとうされていて、Gerd Gigerenzer とうによる学習がくしゅうヒューリスティクス研究けんきゅうがある。経験けいけんがまばらであまり特徴付とくちょうづけられていない状況じょうきょうで、こうバイアスていバリアンスのヒューリスティクスにて、このジレンマを解決かいけつして、人間にんげんのう学習がくしゅうしていると主張しゅちょうしている。バイアスがちいさすぎる学習がくしゅう手法しゅほうは、あたらしい状況じょうきょうへのひろし能力のうりょくとぼしく、世界せかいしん状態じょうたい不適切ふてきせつ推定すいていする、という事実じじつ反映はんえいしている。これらのヒューリスティクスは相対そうたいてき簡単かんたんであるが、おおくの状況じょうきょうたいしてより推定すいていをもたらす。[1]

Stuart Geman とう[7]一般いっぱん物体ぶったい認識にんしきをゼロから学習がくしゅうすることは不可能ふかのうであり、あるしゅの"かた配線はいせん"があり、それを経験けいけんにより調整ちょうせいするかたち必要ひつようであるということを、バイアス-バリアンスのジレンマは意味いみしていると主張しゅちょうしている。なぜなら、こうバリアンスをけるために、自由じゆうすぎるモデルは現実げんじつてきなほどの大量たいりょう訓練くんれんデータを必要ひつようとするからである。

参照さんしょう[編集へんしゅう]

  1. ^ a b Gigerenzer, Gerd; Brighton, Henry (2009). “Homo Heuristicus: Why Biased Minds Make Better Inferences”. Topics in Cognitive Science 1: 107–143. doi:10.1111/j.1756-8765.2008.01006.x. PMID 25164802. 
  2. ^ C.M. ビショップ『パターン認識にんしき機械きかい学習がくしゅう丸善まるぜん出版しゅっぱん、2012ねんISBN 4621061224 
  3. ^ Trevor Hastie『統計とうけいてき学習がくしゅう基礎きそ共立きょうりつ出版しゅっぱん、2014ねんISBN 432012362X 
  4. ^ The Bias–Variance Tradeoff”. University Edinburgh (2007ねん). 2014ねん8がつ19にち閲覧えつらん
  5. ^ Shakhnarovich, Greg (2011ねん). “Notes on derivation of bias-variance decomposition in linear regression”. 2014ねん8がつ21にち時点じてんオリジナルよりアーカイブ。2014ねん8がつ20日はつか閲覧えつらん
  6. ^ Belsley, David (1991). Conditioning diagnostics : collinearity and weak data in regression. New York: Wiley. ISBN 978-0471528890 
  7. ^ a b Geman, Stuart; E. Bienenstock; R. Doursat (1992). “Neural networks and the bias/variance dilemma”. Neural Computation 4: 1–58. doi:10.1162/neco.1992.4.1.1. http://web.mit.edu/6.435/www/Geman92.pdf. 
  8. ^ Gareth James; Daniela Witten; Trevor Hastie; Robert Tibshirani (2013). An Introduction to Statistical Learning. Springer. http://www-bcf.usc.edu/~gareth/ISL/ 
  9. ^ Jo-Anne Ting, Sethu Vijaykumar, Stefan Schaal, Locally Weighted Regression for Control. In Encyclopedia of Machine Learning. Eds. Claude Sammut, Geoffrey I. Webb. Springer 2011. p. 615
  10. ^ Scott Fortmann-Roe. Understanding the Bias–Variance Tradeoff. 2012. http://scott.fortmann-roe.com/docs/BiasVariance.html

関連かんれん項目こうもく[編集へんしゅう]