(Translated by https://www.hiragana.jp/)
マローズのCp - Wikipedia コンテンツにスキップ

マローズのCp

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

MallowsのCp[1] [2]は、最小さいしょうじょうほうによって推定すいていされた回帰かいきモデル適合てきごう評価ひょうかするためにもちいられる指標しひょうである。名前なまえコリン・リングウッド・マローズにちなむ。モデル選択せんたくおこなさいもちいられ、ある複数ふくすう変数へんすうから出力しゅつりょく予測よそくすることができるとき、そのなかから一部いちぶ変数へんすうえらんでもっといモデルをつけることが目的もくてきである。Cpちいさいほど、モデルが比較的ひかくてき正確せいかくであることを意味いみする。

マローズのCpは、ガウス線形せんけい回帰かいきという特殊とくしゅ場合ばあいにおいて赤池あかいけ情報じょうほうりょう基準きじゅん相当そうとうすることがしめされている。[3]

定義ていぎ性質せいしつ

[編集へんしゅう]

マローズのCpは、過剰かじょう適合てきごう問題もんだいたいする方法ほうほうである。一般いっぱんにモデルの変数へんすうえればえるほど、ざん平方和へいほうわなどのモデル適合てきごう指標しひょうつねちいさくなる。したがって、ざん平方和へいほうわ最小さいしょうとなるモデルを選択せんたくする場合ばあいつねにすべての変数へんすうふくむモデルが選択せんたくされてしまう。わりに、データのサンプル計算けいさんされたC p統計とうけいは、 母集団ぼしゅうだんターゲットとして平均へいきんじょう予測よそく誤差ごさ (MSPE)を推定すいていする。

ただし、j ばんのケースのフィットE (Yj | Xj) は j ばんケースの期待きたいであり、σしぐま2誤差ごさ分散ぶんさんぜんケース共通きょうつう定数ていすうとみなされる)である。変数へんすう追加ついかされても、MSPEは自動的じどうてきちいさくなることはない。この基準きじゅんでの最適さいてきなモデルは、サンプルサイズ、さまざまな予測よそく変数へんすう効果こうかりょう、および変数へんすうあいだともせんせい程度ていどによってまる。

P変数へんすうK>PであるようなK変数へんすうから選択せんたくされた場合ばあいCpつぎのように定義ていぎされる。

ただし、

その定義ていぎ

[編集へんしゅう]

つぎのような線形せんけいモデルがあるとする。

ただし、

  • 予測よそく変数へんすう係数けいすう
  • 誤差ごさあらわ

Cp以下いかのようにも定義ていぎされる[4]

ただし、

  • RSSは、教師きょうしデータセットのざん平方和へいほうわ
  • d予測よそく変数へんすうかず
  • 線形せんけいモデルのかく応答おうとう関連かんれんする分散ぶんさん推定すいていす(すべての予測子よそくしふくむモデルで推定すいていされる)

この定義ていぎによるCpは、前掲ぜんけい定義ていぎによるCpひとしくないが、いずれの定義ていぎにおいてもCp最小さいしょうにするようなモデルは同一どういつである。

制約せいやく

[編集へんしゅう]

Cp基準きじゅんにはおもに2つの制約せいやくがある[5]

  1. Cp近似きんじおおきなサンプルサイズにたいしてのみ有効ゆうこうである。
  2. Cp変数へんすう選択せんたく(または特徴とくちょう選択せんたく)の問題もんだいのようなモデルの複雑ふくざつ集合しゅうごうあつかうことができない[5]

実用じつよう

[編集へんしゅう]

関連かんれん項目こうもく

[編集へんしゅう]

参考さんこう文献ぶんけん

[編集へんしゅう]
  1. ^ Mallows, C. L. (1973). “Some Comments on CP”. Technometrics 15 (4): 661–675. doi:10.2307/1267380. JSTOR 1267380. 
  2. ^ Gilmour, Steven G. (1996). “The interpretation of Mallows's Cp-statistic”. Journal of the Royal Statistical Society, Series D 45 (1): 49–56. JSTOR 2348411. 
  3. ^ Boisbunon, Aurélie; Canu, Stephane. "AIC, Cp and estimators of loss for elliptically symmetric distributions". arXiv:1308.2766 [math.ST]。
  4. ^ James, Gareth; Witten; Hastie; Tibshirani (2013-06-24). An Introduction to Statistical Learning. http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Sixth%20Printing.pdf: Springer. pp. 211. ISBN 978-1-4614-7138-7 
  5. ^ a b Giraud, C. (2015), Introduction to high-dimensional statistics, Chapman & Hall/CRC, ISBN 9781482237948

参照さんしょう

[編集へんしゅう]