傾向けいこう推定すいてい

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

傾向けいこう推定すいてい(けいこうすいてい、えい: trend estimation)とは、ある過程かてい(プロセス)を測定そくていしたものをどき系列けいれつとしてあつかい、そのデータの傾向けいこう推定すいていする統計とうけいてき手法しゅほうである。完全かんぜんには解明かいめいされていない物理ぶつりてきけいたいしては、なんらかのモデルを構築こうちくして測定そくてい結果けっか説明せつめいしようとこころみる。とく測定そくてい結果けっか増加ぞうか傾向けいこう減少げんしょう傾向けいこうにあるかをることでランダムないではないことを判断はんだんしようとする。たとえば、ある地点ちてんでの毎日まいにち気温きおんはかることでぶしによる変化へんか傾向けいこう長期ちょうきてき気象きしょう変化へんか傾向けいこうる。

とくに、等質とうしつせい問題もんだい重要じゅうようである(そのとき系列けいれつぜん測定そくてい区間くかんひとしく信頼しんらいできるか?)。以下いかでは、単純たんじゅんのためそのような観点かんてんをあえてける。

傾向けいこうへの適合てきごう: 最小さいしょう乗法じょうほう[編集へんしゅう]

データぐんあたえられ、そのデータからなんらかのモデル(この場合ばあい、データに適合てきごうする関数かんすう意味いみする)を構築こうちくしたい場合ばあい選択せんたく可能かのう関数かんすう様々さまざまである。しかしそのデータについてなんらかの事前じぜん解釈かいしゃく存在そんざいしない場合ばあいもっと単純たんじゅん直線ちょくせんてき関数かんすう適合てきごうさせるのが基本きほんである。

直線ちょくせん適合てきごうさせるとめた場合ばあいにも様々さまざま手法しゅほう存在そんざいする。しかし圧倒的あっとうてきおお使つかわれるのは最小さいしょう乗法じょうほうである。データの地点ちてん とそのデータ について 選択せんたくすることでつぎしき最小さいしょうする。

解法かいほうについては最小さいしょう乗法じょうほう項目こうもく参照さんしょうされたし。

以下いかでは、最小さいしょう乗法じょうほうもとめた「傾向けいこう」についてべる。問題もんだいは、その傾向けいこう有意ゆういせいであり、「有意ゆうい」とはどういうことか、である。

作為さくいデータにおける傾向けいこう[編集へんしゅう]

じつデータにおける傾向けいこうかんがえるまえに、無作為むさくいデータにおける傾向けいこう理解りかいする必要ひつようがある。

あか部分ぶぶん上位じょうい1%、あおは5%、みどりは10% をしめす。この場合ばあい本文ほんぶんべられている95%の信頼しんらいのVは 0.2 である。

無作為むさくいであることがかっているデータれつたとえばサイコロをった結果けっかやコンピュータが生成せいせいしたランダムな数列すうれつ)があるとき、その傾向けいこうもとめるとゼロ傾向けいこうとなることはほとんどない。しかし、その傾向けいこうきわめてちいさいことは予測よそくされる。あるまった程度ていどのノイズをふくまったサイズ(たとえば100)のデータれつがあり、それを多数たすう生成せいせいする(たとえば10まんくみ)と、その10まんくみのデータれつから傾向けいこう計算けいさんすることができ、傾向けいこう分布ぶんぷがあることを経験けいけんてきることになる(みぎ参照さんしょう)。その分布ぶんぷは(完全かんぜんにランダムなら)ゼロを中心ちゅうしんとする正規せいき分布ぶんぷとなるだろう(中心ちゅうしん極限きょくげん定理ていり)。以上いじょう手順てじゅんからある程度ていど統計とうけいてきかくかさ 設定せっていすることができる(95%が典型てんけいてきだが、より正確せいかくには99%、よりおおまかなら 90%)。そして、% の傾向けいこうふくまれる範囲はんい指定していする傾向けいこう もとめることができる。こまかいことをえば、分布ぶんぷせいまけ両方りょうほうひろがっており、両方りょうほう対象たいしょうかんがえる場合ばあいもあるし、一方いっぽうだけを対象たいしょうかんがえる場合ばあいもある。

以上いじょうのように多数たすうかい試行しこうによって経験けいけんてき経験けいけん分布ぶんぷ計算けいさんすることをしめした。単純たんじゅん場合ばあい正規せいき分布ぶんぷ無作為むさくいなノイズ)、傾向けいこう分布ぶんぷ正確せいかくもとめられる。

ここで、それまでのランダムデータれつとおおよそおな分散ぶんさん特性とくせいあらたなデータれつかんがえる。そのデータれつ実際じっさい傾向けいこうつかどうかはからないので、傾向けいこう 計算けいさんし、それが よりちいさいと判明はんめいしたとする。そこで、かくからしさ 範囲はんいでこのデータの傾向けいこうはランダムノイズと区別くべつできないとえる。

しかし、えらんだとき、のこりの 部分ぶぶんがある傾向けいこうっていると(あやまって)宣言せんげんする可能かのうせいがあることに注意ちゅういされたい。ぎゃく本当ほんとう傾向けいこうつデータれつのこ部分ぶぶんは、傾向けいこうたないと宣言せんげんされる可能かのうせいがある。

傾向けいこう+ノイズとしてのデータ[編集へんしゅう]

どき系列けいれつデータを解析かいせきするため、データれつ傾向けいこう要素ようそとノイズ要素ようそからると仮定かていする。

は(通常つうじょう未知みちの)定数ていすうであり、無作為むさくい誤差ごさである。なんらかの特殊とくしゅ性質せいしつつと判明はんめいするまでは、正規せいき分布ぶんぷであると仮定かていする。つねおな分布ぶんぷであると仮定かていするのがもっと単純たんじゅんだが、そうでない場合ばあい(いくつかのデータの分散ぶんさん非常ひじょうおおきいなど)、最小さいしょう乗法じょうほうにおいてそれらのデータの分散ぶんさんぎゃくおもけすることで考慮こうりょすることができる。

1つのとき系列けいれつ分析ぶんせきするとき、傾向けいこう推定すいていによって 分散ぶんさん推定すいていすることができる。つまり、傾向けいこう推定すいていもとめた したがってざんとして し、そこから分散ぶんさんもとめる。おおくの場合ばあい、これが 分散ぶんさんもとめる唯一ゆいいつ方法ほうほうである。

特殊とくしゅれいとして気温きおんとき系列けいれつがある。気温きおんデータは時間じかんたいして均質きんしつでないことがかっている。一般いっぱん気象きしょう観測かんそくデータは最近さいきんになるにしたがってえており、したがって気温きおん推定すいていかかわる誤差ごさとも減少げんしょうしている。このため気象きしょうデータの傾向けいこう推定すいていおこなうにはこれを考慮こうりょする。

データれつのノイズがあきらかになると、傾向けいこう が 0 とほとんど差異さいがないという仮説かせつによって傾向けいこう検定けんていすることができる。上述じょうじゅつ作為さくいデータれつ傾向けいこう分散ぶんさんはなしから、無作為むさくいな(本来ほんらい傾向けいこうのない)データからも傾向けいこうられることがあることがかる。もし計算けいさんされた傾向けいこう よりおおきければ、その傾向けいこう水準すいじゅんにおいてゼロと有意ゆういがあるとえる。

ノイズのおおとき系列けいれつ[編集へんしゅう]

ノイズのおおとき系列けいれつから傾向けいこう抽出ちゅうしゅつすることはむずかしい。たとえば、本来ほんらいとき系列けいれつが 0, 1, 2, 3 というで、それとは独立どくりつした正規せいき分布ぶんぷノイズ 標準ひょうじゅん偏差へんさ とする。ながさ50のとき系列けいれつデータがあるとき、 なら傾向けいこうあきらかだろう。 では傾向けいこうはおそらくかるだろう。しかし、 では傾向けいこうはノイズにうずもれてしまうだろう。

具体ぐたいれいとして、IPCCしめした過去かこ140年間ねんかん気温きおん記録きろく[1]てみよう。年間ねんかん気温きおん分散ぶんさんやく 0.2°C で、傾向けいこうやく 0.6°C、95% 信頼しんらいは 0.2°C である(年間ねんかん分散ぶんさんおなとなっているのは偶然ぐうぜんである)。したがってこの傾向けいこう統計とうけいてきに 0 とは有意ゆういがある。もっとも、気温きおん変動へんどう具体ぐたいてき原因げんいんはこのデータからはからない。

傾向けいこう推定すいていざん[編集へんしゅう]

フィルタリングによってざんじょう変化へんかするが、傾向けいこうわらない

最小さいしょう乗法じょうほうによる傾向けいこう推定すいていでは、ざん二乗にじょう推定すいていてる。それはつまり推定すいていされた傾向けいこうのラインで説明せつめいされるデータの分散ぶんさん部分ぶぶんがどれだけかということでもある。それは傾向けいこう有意ゆういせいには関係かんけいしない(みぎ参照さんしょう)。ノイズのおお系列けいれつではざんじょう非常ひじょうちいさいこともあるが、推定すいてい有意ゆういせい非常ひじょうおおきいこともある。フィルタリングをおこなうとざんじょう増大ぞうだいする傾向けいこうがあるが、推定すいていされる傾向けいこうそのものやその有意ゆういせいにはあまりちがいがしょうじない。

自己じこ相関そうかんてきじつデータ[編集へんしゅう]

これまで、データれつ傾向けいこうとノイズから構成こうせいされるとしてきた。また、ノイズはかくデータで「独立どくりつ」であった(マルコフせい正規せいき分布ぶんぷノイズ)。ノイズが定常ていじょうてきガウス・マルコフ過程かていしたがうという前提ぜんてい情報じょうほう最小さいしょう原理げんりからしょうじた。これは統計とうけい容易たやすさというてんおおきな意味いみがある。気象きしょうデータのようなじつデータはこの前提ぜんていたさないかもしれない。

自己じこ相関そうかんてき系列けいれつ自己じこ回帰かいき移動いどう平均へいきんモデル使つかってモデルされる。

関連かんれん項目こうもく[編集へんしゅう]

参考さんこう文献ぶんけん[編集へんしゅう]

  • Chatfield, C. (1993) "Calculating Interval Forecasts," Journal of Business and Economic Statistics, 11(2) 121-135.