二乗にじょう平均へいきん平方根へいほうこん誤差ごさ

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

二乗にじょう平均へいきん平方根へいほうこん誤差ごさ(にじょうへいきんへいほうこんごさ)は、モデルまたは推定すいていりょうにより予測よそくされた標本ひょうほんまたは母集団ぼしゅうだん)と観測かんそくされたあいだとして頻繁ひんぱん使用しようされる尺度しゃくどである。RMSE (root-mean-square errorのりゃく)またはRMSD (root-mean-square deviationのりゃく) などともかれる。RMSDは、予測よそく観測かんそくの2標本ひょうほんモーメント平方根へいほうこん、すなわちこれらの二乗にじょう平均へいきん平方根へいほうこんあらわしている。これらの偏差へんさは、推定すいてい使用しようされたデータ標本ひょうほん計算けいさんされた場合ばあいざんばれ標本ひょうほんでなく計算けいさんされた場合ばあい誤差ごさ(または予測よそく誤差ごさ)とばれる。RMSDは、様々さまざまなデータてん予測よそくにおける誤差ごさおおきさを予測よそくりょくの1つの尺度しゃくど集約しゅうやくする役割やくわりをする。RMSDは、スケールに依存いぞんするため、データセットあいだではなく特定とくていのデータセットにたいすることなるモデルの予測よそく誤差ごさ比較ひかくするためのせい確度かくど尺度しゃくどである[1]

RMSDはつね非負ひふをとり、(ほとんどこらないが)0はデータに完全かんぜんにフィットしていることをしめす。一般いっぱんてきにはRMSDがちいさいほういとされている。しかし、この尺度しゃくど使用しようする数値すうち尺度しゃくど依存いぞんするため、ことなる種類しゅるいのデータあいだでの比較ひかく意味いみたない。

RMSDは、平均へいきんじょう誤差ごさ平方根へいほうこんである。かく誤差ごさがRMSDにあたえる影響えいきょうじょう誤差ごさおおきさに比例ひれいするため、誤差ごさおおきいほどRMSDへの影響えいきょう比例ひれいしておおきくなる。そのため、誤差ごさおおきいほどRMSDへの影響えいきょうおおきく、結果けっかとしてはず影響えいきょうけやすくなる[2][3]

しき[編集へんしゅう]

推定すいていパラメータ たいする推定すいていりょう たいするRMSDは、平均へいきんじょう誤差ごさ (MSE) の平方根へいほうこんとして定義ていぎされる。

不偏ふへん推定すいていりょう場合ばあい、RMSDは分散ぶんさん平方根へいほうこんであり標準ひょうじゅん偏差へんさばれる。

Tかい観測かんそくされた変数へんすう回帰かいき従属じゅうぞく変数へんすう 時間じかん tたいする予測よそく のRMSDは、Tことなる予測よそくたいして、偏差へんさじょう平均へいきん平方根へいほうこんとして計算けいさんされる。

横断おうだんデータ英語えいごばん回帰かいきでは、ti に、Tnえる)

分野ぶんやによっては、RMSDは、変化へんかする可能かのうせいがありどちらも「標準ひょうじゅん」としてれられない2つのもののあいだ比較ひかくするために使用しようされる。たとえば、2つのとき系列けいれつ 平均へいきんてき測定そくていする場合ばあいしきつぎのようになる。

正規せいき[編集へんしゅう]

RMSDを正規せいきすることで、スケールのことなるデータセットやモデルあいだでの比較ひかく容易よういになる。正規せいき方法ほうほう文献ぶんけんにより統一とういつされていないが、一般いっぱんてきには測定そくていデータの平均へいきんまたは範囲はんい最大さいだいから最小さいしょういたもの)が選択せんたくされる[4]

または .

この一般いっぱんてきにNRMSD (normalized root-mean-square deviation) または NRMSE (normalized root-mean-square error) とばれ、おおくの場合ばあいパーセンテージであらわされ、ひくいほどざん分散ぶんさんすくないことをしめす。おおくの場合ばあいすくない標本ひょうほんでは標本ひょうほん範囲はんい標本ひょうほんおおきさに影響えいきょうされ、比較ひかくさまたげになるとおもわれる。

RMSDをより有用ゆうよう比較ひかく尺度しゃくどとするためのべつ方法ほうほうとして、RMSDをよんふん範囲はんい英語えいごばん (IQR)でけることがかんがえられる。RMSDをIQRでけると、正規せいきされた対照たいしょうとなる変数へんすう極端きょくたんたいする感度かんどひくくなる。

(ここで

であり である。CDF−1ぶんてん関数かんすう英語えいごばんである。

測定そくてい平均へいきん正規せいきする場合ばあい曖昧あいまいさをけるためにRMSDの変動へんどう係数けいすう(coefficient of variation of the RMSD, CV(RMSD)) という用語ようご使用しようすることがある[5]。これは、標準ひょうじゅん偏差へんさわりにRMSDをもちいた変動へんどう係数けいすう類似るいじする。

平均へいきん絶対ぜったい誤差ごさ[編集へんしゅう]

研究けんきゅうしゃなかにはRMSDのわりに平均へいきん絶対ぜったい誤差ごさ英語えいごばん (MAE)を使用しようすることを推奨すいしょうしている。MAEはRMSDよりも説明せつめいりょくがあるという利点りてんがある。MAEは、誤差ごさ絶対ぜったい平均へいきんである。WAEは、二乗にじょう誤差ごさ平均へいきん平方根へいほうこんよりも基本きほんてき理解りかいしやすい。さらに、かく誤差ごさ誤差ごさ絶対ぜったい比例ひれいしてMAEに影響えいきょうあたえるが、RMSDの場合ばあいはそうではない[2]

使用しようれい[編集へんしゅう]

関連かんれん項目こうもく[編集へんしゅう]

出典しゅってん[編集へんしゅう]

  1. ^ Hyndman, Rob J.; Koehler, Anne B. (2006). “Another look at measures of forecast accuracy”. International Journal of Forecasting 22 (4): 679–688. doi:10.1016/j.ijforecast.2006.03.001. 
  2. ^ a b Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). “Components of information for multiple resolution comparison between maps that share a real variable”. Environmental Ecological Statistics 15 (2): 111–142. doi:10.1007/s10651-007-0043-y. 
  3. ^ Willmott, Cort; Matsuura, Kenji (2006). “On the use of dimensioned measures of error to evaluate the performance of spatial interpolators”. International Journal of Geographical Information Science 20: 89–102. doi:10.1080/13658810500286976. 
  4. ^ Coastal Inlets Research Program (CIRP) Wiki - Statistics”. 2015ねん2がつ4にち閲覧えつらん
  5. ^ FAQ: What is the coefficient of variation?”. 2019ねん2がつ19にち閲覧えつらん
  6. ^ Armstrong, J. Scott; Collopy, Fred (1992). “Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons”. International Journal of Forecasting 8 (1): 69–80. doi:10.1016/0169-2070(92)90008-w. http://faculty.weatherhead.case.edu/Fred-Collopy/researchArticles/ErrorMeasures.pdf. 
  7. ^ Anderson, M.P.; Woessner, W.W. (1992). Applied Groundwater Modeling: Simulation of Flow and Advective Transport (2nd ed.). Academic Press 
  8. ^ Ensemble Neural Network Model
  9. ^ ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History