度数どすう分布ぶんぷ

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

度数どすう分布ぶんぷ(どすうぶんぷ、えい: Frequency Distribution)は、統計とうけいにおいて標本ひょうほんとしてたある変量へんりょうのリストである。りょう大小だいしょうじゅんならべ、かく数値すうちあらわれた個数こすう表示ひょうじするひょう度数どすう分布ぶんぷひょう)でしめ[1]日本にっぽん産業さんぎょう規格きかくでは、「特性とくせいと、その度数どすうまたは相対そうたい度数どすうとの関係かんけい観測かんそくしたもの」と定義ていぎしている[2]

れい[編集へんしゅう]

たとえば、100にんがある文章ぶんしょう同意どういするかを5段階だんかいリッカート尺度しゃくど回答かいとうしたとする。このとき、1 はつよ同意どういすることをしめし、5はまった同意どういしないことをしめす。その回答かいとうぐん度数どすう分布ぶんぷあらわすとつぎのようになる。

階級かいきゅう 同意どうい度合どあい 回答かいとうすう
1 つよ同意どういする 25
2 ある程度ていど同意どういする 35
3 どちらともえない 20
4 ある程度ていど同意どういできない 15
5 まった同意どういできない 5

この単純たんじゅんひょうには2つの弱点じゃくてんがある。変量へんりょう連続れんぞくてきをとりうる場合ばあいや、変量へんりょうりうる範囲はんい非常ひじょうひろ場合ばあい度数どすう分布ぶんぷひょう作成さくせいむずかしくなり、分析ぶんせきてきさなくなる。そこで、これを若干じゃっかん修正しゅうせいしたひょう形態けいたいとして、変量へんりょうをある範囲はんい等間隔とうかんかく区切くぎ方法ほうほうられる。たとえば、生徒せいと身長しんちょう統計とうけいをとる場合ばあい度数どすう分布ぶんぷひょう以下いかのようになる。

身長しんちょう範囲はんい 生徒せいとすう 累積るいせき
135 - 150 cm 25 25
150 - 165 cm 35 60
165 - 180 cm 20 80
180 - 195 cm 20 100

応用おうよう[編集へんしゅう]

度数どすう分布ぶんぷされたデータはもとのデータよりもあつかいが容易よういである。度数どすう分布ぶんぷから中央ちゅうおう平均へいきん標準ひょうじゅん偏差へんさもとめる単純たんじゅんなアルゴリズムが存在そんざいする。

複数ふくすう度数どすう分布ぶんぷあいだ差異さい類似るいじせい評価ひょうかから仮説かせつ検定けんてい考案こうあんされた。この評価ひょうかには代表だいひょう平均へいきん測定そくてい統計とうけいてきばらつき標準ひょうじゅん偏差へんさ分散ぶんさん)の測定そくてい関係かんけいする。

平均へいきん中央ちゅうおうことなる場合ばあい度数どすう分布ぶんぷゆががあるとしょうする。度数どすう分布ぶんぷとんがたびとは、平均へいきんへの集中しゅうちゅう度合どあいであり、ヒストグラムあらわした場合ばあいのグラフのとが具合ぐあいである。正規せいき分布ぶんぷ以上いじょうとがっている場合ばあいを「きゅうとんがてき; leptokurtic」としょうし、ぎゃく場合ばあいを「なるとんがてき; platykurtic」としょうする。

度数どすう分布ぶんぷ暗号あんごう解読かいどくでの頻度ひんど解析かいせきにも使つかわれる。これは文字もじ種類しゅるいごとの出現しゅつげん頻度ひんど言語げんごにおける文字種もじしゅごとの出現しゅつげん頻度ひんどから暗号あんごう解読かいどくする手法しゅほうである。

脚注きゃくちゅう[編集へんしゅう]

  1. ^ 西岡にしおか, 1.4 すう分布ぶんぷ p.8.
  2. ^ JIS Z 8101-1 : 1999, 2.4 すう分布ぶんぷ.

参考さんこう文献ぶんけん[編集へんしゅう]