维基百科 ひゃっか ,自由 じゆう 的 てき 百科 ひゃっか 全 ぜん 书
在 ざい 统计学 がく 里 さと ,离散程度 ていど (英語 えいご :statistical dispersion ,scatter,spread)或 ある 离散度 ど ,又 また 稱 たたえ 统计变异性 せい (statistical variability)[ 1] ,简称 變異 へんい 、變 へん 差 さ (variation)、变率 ,是 ぜ 指 ゆび 一 いち 个分布 ぶんぷ 或 ある 随 ずい 机 つくえ 变量的 てき 拉 ひしげ 伸 しん 或 ある 压缩程度 ていど [ 2] 。习惯上 じょう ,“离散”常用 じょうよう 来 らい 描述数 すう 据 すえ 分布 ぶんぷ [ 3] ,而“變異 へんい ”(指 ゆび :變異 へんい 數 すう 、方 かた 差 さ )更 さら 常用 じょうよう 来 らい 描述随 ずい 机 つくえ 变量的 てき 变异程度 ていど [ 4] 。 [需要 じゅよう 解 かい 释 ] 用 よう 以描述 じゅつ 离散程度 ていど 或 ある 變異 へんい 的 てき 量 りょう 主要 しゅよう 有 ゆう 方 かた 差 さ 、標準 ひょうじゅん 差 さ 、變異 へんい 系 けい 数 すう 和 わ 四 よん 分 ふん 位 い 距等 ひとし 。
离散程度 ていど 与 あずか 集中 しゅうちゅう 趋势相 あい 对,因 いん 此,离散度 ど 就是指 ゆび 各 かく 个变量 りょう 值与集中 しゅうちゅう 趋势的 てき 偏 へん 离程度 ていど 。
衡量离散程度 ていど 的 てき 值,通常 つうじょう 是非 ぜひ 负实数 :当 とう 衡量值取零 れい 时,表示 ひょうじ 分布 ぶんぷ 集中 しゅうちゅう 在 ざい 同一 どういつ 个值上 じょう ;随 ずい 着 ぎ 衡量值的增加 ぞうか ,随 ずい 机 つくえ 变量的 てき 取 と 值越来 ごえく 越 えつ 分散 ぶんさん 。
部分 ぶぶん 描述离散程度 ていど 的 てき 量 りょう 是 ぜ 带单位 い 的 てき ,并且,这些量的 りょうてき 单位 与 あずか 随 ずい 机 つくえ 变量本身 ほんみ 的 てき 单位相 しょう 同 どう 。也就是 ぜ 说,如果随 ずい 机 つくえ 变量的 てき 单位是 ぜ 米 まい 或 ある 秒 びょう ,则这些量的 てき 单位也是米 まい 或 ある 秒 びょう 。这些量 りょう 举例如下:
此外,也有 やゆう 一 いち 些无量纲量 :
另外,还有一些带单位的量,但 ただし 是 ぜ 他 た 们的单位和 わ 随 ずい 机 つくえ 变量本身 ほんみ 的 てき 单位不同 ふどう :
变差的 てき 可 か 解 かい 释性,通常 つうじょう 是 ぜ 对于一个随机变量而言的。当 とう 观测 到 いた 随 ずい 机 つくえ 变量的 てき 一 いち 些取值(例 れい 如训练集 しゅう 中 なか 的 てき 标签可 か 视作是 ぜ 一个随机变量的一些观测值),需要 じゅよう 推断 すいだん 随 ずい 机 つくえ 变量服 ふく 从的分布 ぶんぷ 时,就会遇 ぐう 到 いた 这个问题。一般 いっぱん 而言,推断 すいだん 有限 ゆうげん 观测值的随 ずい 机 つくえ 变量服 ふく 从的分布 ぶんぷ 的 てき 过程,即 そく 是 ぜ 建立 こんりゅう 模型 もけい 的 てき 过程。
假 かり 设有随 ずい 机 つくえ 变量
X
{\displaystyle \mathbf {X} }
及其服 ふく 从的真 ま 实分布 ぶんぷ
X
∼
D
{\displaystyle \mathbf {X} \sim D}
。则对于该随 ずい 机 つくえ 变量的 てき 观测值,可 か 计算其变差 さ (以方差 さ 表示 ひょうじ )
SS
total
:=
Var
(
X
)
{\displaystyle {\text{SS}}_{\text{total}}:={\text{Var}}(\mathbf {X} )}
;对于分布 ぶんぷ ,亦 また 可 か 计算其变差 さ
SS
distribution
:=
Var
(
D
)
{\displaystyle {\text{SS}}_{\text{distribution}}:={\text{Var}}(D)}
。则
SS
distribution
{\displaystyle {\text{SS}}_{\text{distribution}}}
是 ぜ 相 しょう 对该随 ずい 机 つくえ 变量的 てき 可 か 解 かい 释變異 へんい (英 えい 语:explainable variation),其余的 てき 部分 ぶぶん 则是不可解 ふかかい 释變異 へんい (英 えい 语:unexplainable variation)。为了衡量不可解 ふかかい 释變異 へんい ,可 か 引入不可解 ふかかい 释變異 へんい 分数 ぶんすう (英 えい 语:fraction of unexplainable variation)
FUV
:=
1
−
SS
distribution
SS
total
{\displaystyle {\text{FUV}}:=1-{\tfrac {{\text{SS}}_{\text{distribution}}}{{\text{SS}}_{\text{total}}}}}
。不可解 ふかかい 释變異 へんい 亦 また 称 たたえ 为统计噪声 。
假 かり 设
D
′
{\displaystyle D'}
是 ぜ 模型 もけい 给出的 てき 随 ずい 机 つくえ 变量的 てき 分布 ぶんぷ 。则对于该预测分布 ぶんぷ ,我 わが 们可以计算 さん 器 き 變異 へんい (以方差 さ 表示 ひょうじ )
SS
model
:=
Var
(
D
′
)
{\displaystyle {\text{SS}}_{\text{model}}:={\text{Var}}(D')}
。则
SS
model
{\displaystyle {\text{SS}}_{\text{model}}}
是 ぜ 该模型 がた 相 しょう 对该随 ずい 机 つくえ 变量的 てき 已 やめ 解 かい 释變異 へんい (英 えい 语:explained variation),其余部分 ぶぶん 则是未 み 解 かい 释變異 へんい (英 えい 语:unexplained variation)。同 どう 样,为了衡量未 み 解 かい 释變異 へんい ,可 か 引入未 み 解 かい 释變異 へんい 分数 ぶんすう (英 えい 语:fraction of unexplained variation)
FUV
:=
1
−
SS
model
SS
total
{\displaystyle {\text{FUV}}:=1-{\tfrac {{\text{SS}}_{\text{model}}}{{\text{SS}}_{\text{total}}}}}
。
^ 贺睿杰. 统计活 かつ 动视角 かく 下 か 的 てき 高 だか 中 ちゅう 生 なま 统计学 がく 习研究 けんきゅう [D]. 华东师范大学 だいがく , 2020.
^ NIST/SEMATECH e-Handbook of Statistical Methods. 1.3.6.4. Location and Scale Parameters . www.itl.nist.gov. U.S. Department of Commerce. [2022-11-14 ] . (原始 げんし 内容 ないよう 存 そん 档 于2022-11-14).
^ 米 べい 小 しょう 琴 きん . 统计计算与 あずか 分析 ぶんせき . 清 きよし 华大学 がく 出版 しゅっぱん 社 しゃ 有限 ゆうげん 公司 こうし . 2004: 68–75. ISBN 9787302064343 .
^ 安德 あんとく 森 もり . 王 おう 峰 ほう , 编. 商 しょう 务与经济统计. 中 ちゅう 信 しん 出版 しゅっぱん 社 しゃ . 2003: 202. ISBN 9787800738753 .