(Translated by https://www.hiragana.jp/)
有意 - Wikipedia コンテンツにスキップ

有意ゆうい

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』
Pから転送てんそう

統計とうけいがくてき有意ゆうい(とうけいがくてきゆうい、えい: statistical significance)は、確率かくりつろん統計とうけいがく用語ようごで、「かくりつてき偶然ぐうぜんとはかんがえにくく、意味いみがあるとかんがえられる」[1]ことをす。科学かがく分野ぶんやでの用語ようごとして、有意ゆういである(significant)とは「注目ちゅうもくあたいするほどおおきい、ないしは重要じゅうようである」という意味いみ[2]

P[編集へんしゅう]

仮説かせつした実際じっさいにデータから計算けいさんされた統計とうけいりょうよりも極端きょくたんな(仮説かせつはんする)統計とうけいりょう観測かんそくされるかくりつを、Pという。P利用りようともなしょ問題もんだい考慮こうりょした社会しゃかい心理しんりがくけいのジャーナル、Basic and Applied Social Psychology英語えいごばん(BASP)は、仮説かせつ有意ゆういせい検定けんていおよびそれにるいする統計とうけいがくてき処理しょり禁止きんしすると発表はっぴょうした[3]

有意ゆうい水準すいじゅん[編集へんしゅう]

有意ゆうい水準すいじゅんαあるふぁ (0<αあるふぁ<1) は、どの程度ていど正確せいかくさをもって仮説かせつ棄却ききゃくするかをあらわ定数ていすうである。有意ゆうい水準すいじゅんαあるふぁ仮説かせつ検定けんていは、とき棄却ききゃくする。このとき、「統計とうけいりょうαあるふぁ水準すいじゅん有意ゆういである」という。有意ゆうい水準すいじゅんαあるふぁ仮説かせつただしいにもかかわらず仮説かせつ検定けんてい棄却ききゃくしてしまうかくりつだい一種いっしゅ過誤かごおかかくりつ)にひとしい。日本工業規格にほんこうぎょうきかくでは、「だい一種いっしゅあやまりのかくりつ上限じょうげん」と定義ていぎしている[4]

有意ゆうい水準すいじゅんとしては、0.05 (5%) をもちいるのが一般いっぱんてきであるが、そのとりかた学問がくもん調査ちょうさ研究けんきゅう対象たいしょうによってもちがいがあり、社会しゃかい科学かがくなどでは0.1(10%)をもちいる場合ばあいもあり、厳密げんみつさがもとめられる自然しぜん科学かがくでは0.01(1%)などをもちいる場合ばあいもある。また、データ表示ひょうじたっては有意ゆういせい段階だんかいをつけて複数ふくすう有意ゆうい水準すいじゅん同時どうじもちいることもあり、たとえば0.05水準すいじゅん有意ゆういならば * 、0.01水準すいじゅんと0.001水準すいじゅんたいしてはそれぞれ ** 、 *** と表示ひょうじする。

有意ゆういであるからといって「偶然ぐうぜんではない」と断定だんていできるわけではなく、「偶然ぐうぜんとはかんがえにくい」という意味いみぎない。したがって、たとえば有意ゆうい水準すいじゅん5%で有意ゆういという場合ばあいには、「実際じっさいには偶然ぐうぜんぎないのに、あやまって『意味いみがある』と判断はんだんしている」可能かのうせいおおくて5%ある。

ぎゃくに、場合ばあいは、「有意ゆういがあるとはいえない」とまでしかならない[5]

有意ゆうい水準すいじゅんたいする批判ひはん[編集へんしゅう]

2010年代ねんだい初頭しょとうはいると科学かがくは「再現さいげんせい危機きき」にくるしんでいて、研究けんきゅうしゃ助成じょせい機関きかん出版しゅっぱんしゃも、学術がくじゅつ文献ぶんけん信頼しんらいできない結果けっかにまみれているのではないかと不安ふあんつのらせている。2017ねんに72にん著名ちょめい研究けんきゅうしゃが、あらたな発見はっけんをしたと主張しゅちょうするさい証拠しょうこ統計とうけいてき基準きじゅんひくさが再現さいげんせい危機きき一因いちいんになっているとする論文ろんぶん発表はっぴょうした。しん発見はっけん統計とうけいてき有意ゆういせい評価ひょうかするために、科学かがくしゃこのんでもちいる有意ゆうい水準すいじゅんは0.05から0.005げるべきであると、統計とうけいがく大家たいかたちは主張しゅちょうする。

その一方いっぽうイリノイ工科こうか大学だいがく計算けいさん科学かがくものShlomo Argamonは「実験じっけんする方法ほうほう多数たすうあるかぎり、どんなにちいさい有意ゆうい水準すいじゅんもちいてもそのなかひとつの実験じっけん方法ほうほう偶然ぐうぜん有意ゆういになる可能かのうせいきわめてたかい」とあたらしい方法ほうほうろんてき基準きじゅんもとめる。実際じっさいちいさい有意ゆうい水準すいじゅんもちいたらおぞう問題もんだいがよりいちじるしくなり、多数たすう論文ろんぶん出版しゅっぱんできなくなる[6]

2016ねんにはこの問題もんだいについて、アメリカ統計とうけい協会きょうかい声明せいめい発表はっぴょう[7]し、「どんなにちいさい効果こうかでも、サンプルサイズがおおきかったり測定そくてい精度せいど十分じゅうぶんたかければちいさいPとなりうる」「P仮説かせつやその計算けいさん背後はいごにある仮定かていもとづいたデータについての記述きじゅつであり、仮説かせつ背後はいごにある仮定かてい自身じしんについての記述きじゅつではない」など、Pについての基本きほんてき問題もんだいてん整理せいりし、「Pは、それだけでは統計とうけいモデルや仮説かせつかんするエビデンスの、よい指標しひょうとはならない」ことを強調きょうちょうしている。

2019ねんには科学かがくしゃ800にんちょうが、『ネイチャー』に署名しょめいし、P有意ゆうい水準すいじゅんよりおおきい場合ばあい、「有意ゆういがあるとはいえない」とまでしかならないが、あやまって「有意ゆういがない=くすりなどの効果こうかがない」と推論すいろんする文献ぶんけんは791文献ぶんけんちゅうの51%に見当みあたったということで、「統計とうけいてき有意ゆういせい」を使つかうのをやめて信頼しんらい区間くかん互換ごかん区間くかんという言葉ことばにいいかえて使用しようすべきだとされた[5]

多重たじゅう比較ひかく[編集へんしゅう]

同種どうしゅ検定けんていかえして全体ぜんたいでの有意ゆういせい有無うむ判断はんだんする場合ばあい多重たじゅう比較ひかく)、1かい検定けんていたいする有意ゆうい水準すいじゅんαあるふぁとすると、kかい同様どうよう試行しこうたいしていちでも有意ゆうい結果けっかかくりつ はkかい試行しこう独立どくりつせい依存いぞんする。たとえば、kかい試行しこう独立どくりつであるときは、 となる。しかしながら、上限じょうげんはkαあるふぁであることから、1かい検定けんていたいする有意ゆうい水準すいじゅんαあるふぁ/kとさだめれば、kかい同様どうよう試行しこうたいして有意ゆうい水準すいじゅん高々たかだかαあるふぁ検定けんていおこなうことができる。これをボンフェローニ補正ほせいという。ただし、この方法ほうほうではkのおおきくなるにつれて有意ゆうい水準すいじゅんがり、実用じつようせいとぼしくなる。そのため、より検定けんていりょくたか手法しゅほう提案ていあんされている。ふるくはLSDほうが、ボンフェローニほうとも計算けいさん容易よういであるためこのまれた。今日きょうでは、テューキーの範囲はんい検定けんていやRyanほうもっと一般いっぱんてきである。また、シェッフェの方法ほうほうやWSDほうかけるようになっている。これらは、分散ぶんさん分析ぶんせきで3水準すいじゅん以上いじょう要因よういんしゅ効果こうか有意ゆういであった場合ばあい下位かい検定けんていにももちいられる。

有意ゆうい[編集へんしゅう]

仮説かせつを「2つのははすうがない」というかたちにした場合ばあいには、仮説かせつ棄却ききゃくされることで「2つのははすうあいだには有意ゆういがある」という結論けつろんみちびかれる。

信頼しんらい区間くかん仮説かせつ検定けんてい[編集へんしゅう]

統計とうけいりょうXが、あるははすうθしーた推定すいていりょうである場合ばあいかんがえる。このとき、有意ゆうい水準すいじゅんαあるふぁ仮説かせつ棄却ききゃくされないようなXのとりうる範囲はんいは、信頼しんらい水準すいじゅんたいするθしーた信頼しんらい区間くかんひとしい。

たとえば、標本ひょうほん平均へいきんXをはは平均へいきんθしーた推定すいていりょうとみなすと、仮説かせつ有意ゆうい水準すいじゅん5%で棄却ききゃくされないXの範囲はんいは、の95%信頼しんらい区間くかん一致いっちする。

脚注きゃくちゅう[編集へんしゅう]

  1. ^ "有意ゆうい". デジタル大辞泉だいじせん. コトバンクより2022ねん2がつ10日とおか閲覧えつらん
  2. ^ significant - Quick search results | Oxford English Dictionary”. www.oed.com. 2023ねん9がつ4にち閲覧えつらん
  3. ^ 2015 T&FしゃのBASPがP使用しよう禁止きんし発表はっぴょう https://www.editage.jp/insights/a-taylor-francis-journal-announces-ban-on-p-values
  4. ^ JIS Z 8101-1 : 1999 統計とうけい用語ようご記号きごうだい1:かくりつおよ一般いっぱん統計とうけい用語ようご 2.53 有意ゆうい水準すいじゅん, 日本にっぽん規格きかく協会きょうかい, http://kikakurui.com/z8/Z8101-1-1999-01.html
  5. ^ a b 井上いのうえ輝一きいち (2019ねん3がつ26にち). “「“統計とうけいてき有意ゆういなし”もうやめませんか」 Natureに科学かがくしゃ800にんちょう署名しょめいして投稿とうこう”. ITmedia. 2019ねん5がつ21にち閲覧えつらん
  6. ^ 2017 統計とうけいがく大物おおもの学者がくしゃがP刷新さっしん提案ていあん, Nature ダイジェスト
  7. ^ Wasserstein RL, Lazar NAちょ佐藤さとう俊哉としややく (2017ねん4がつ23にち). “統計とうけいてき有意ゆういせいとPかんするASA声明せいめい原題げんだい:The ASA’s statement on p-values: Context, process, and purpose. 2016; 70: 129-133. )”. The American Statistician. 2021ねん4がつ16にち閲覧えつらん

参考さんこう文献ぶんけん[編集へんしゅう]

関連かんれん項目こうもく[編集へんしゅう]