Дисперсия случайной величины
У этого термина существуют и другие значения, см.
Дисперсия .
Диспе́рсия случа́йной величины́ — мера разброса значений случайной величины относительно её математического ожидания . Обозначается
D
[
X
]
{\displaystyle D[X]}
в русской литературе и
Var
-->
(
X
)
{\displaystyle \operatorname {Var} (X)}
(англ. variance ) в зарубежной. В статистике часто употребляется обозначение
σ σ -->
X
2
{\displaystyle \sigma _{X}^{2}}
или
σ σ -->
2
{\displaystyle \displaystyle \sigma ^{2}}
.
Квадратный корень из дисперсии, равный
σ σ -->
{\displaystyle \displaystyle \sigma }
, называется среднеквадратическим отклонением , стандартным отклонением или стандартным разбросом. Стандартное отклонение измеряется в тех же единицах , что и сама случайная величина, а дисперсия измеряется в квадратах этой единицы измерения.
Из неравенства Чебышёва следует, что вероятность того, что значения случайной величины отстоят от математического ожидания этой случайной величины более чем на
k
{\displaystyle k}
стандартных отклонений, составляет менее
1
/
k
2
{\displaystyle 1/k^{2}}
. В специальных случаях оценка может быть усилена. Так, например, как минимум в 95 % случаев значения случайной величины, имеющей нормальное распределение , удалены от её среднего не более чем на два стандартных отклонения, а в примерно 99,7 % — не более чем на три.
Определение
Дисперсией случайной величины называют математическое ожидание квадрата отклонения случайной величины от её математического ожидания.
Пусть
X
{\displaystyle X}
— случайная величина, определённая на некотором вероятностном пространстве . Тогда дисперсией называется
D
[
X
]
=
E
[
(
X
− − -->
E
[
X
]
)
2
]
,
{\displaystyle D[X]=\mathbb {E} \left[{\big (}X-\mathbb {E} [X]{\big )}^{2}\right],}
где символ
E
{\displaystyle \mathbb {E} }
обозначает математическое ожидание [1] [2] .
Замечания
Если случайная величина
X
{\displaystyle X}
дискретная , то
D
[
X
]
=
∑ ∑ -->
i
=
1
n
p
i
(
x
i
− − -->
E
[
X
]
)
2
,
{\displaystyle D[X]=\sum _{i=1}^{n}{p_{i}(x_{i}-\mathbb {E} [X])^{2}},}
D
[
X
]
=
1
2
∑ ∑ -->
i
=
1
n
∑ ∑ -->
j
=
1
n
p
i
p
j
(
x
i
− − -->
x
j
)
2
=
∑ ∑ -->
i
=
1
n
∑ ∑ -->
j
=
i
+
1
n
p
i
p
j
(
x
i
− − -->
x
j
)
2
,
{\displaystyle D[X]={\frac {1}{2}}\sum _{i=1}^{n}\sum _{j=1}^{n}{p_{i}p_{j}(x_{i}-x_{j})^{2}}=\sum _{i=1}^{n}\sum _{j=i+1}^{n}{p_{i}p_{j}(x_{i}-x_{j})^{2}},}
где
x
i
{\displaystyle x_{i}}
—
i
{\displaystyle i}
-ое значение случайной величины,
p
i
=
P
(
X
=
x
i
)
{\displaystyle p_{i}=P(X=x_{i})}
— вероятность того, что случайная величина принимает значение
x
i
{\displaystyle x_{i}}
,
n
{\displaystyle n}
— количество значений, которые принимает случайная величина.
Доказательство 2-й формулы
Если случайная величина
X
{\displaystyle X}
непрерывна , то:
D
[
X
]
=
∫ ∫ -->
− − -->
∞ ∞ -->
+
∞ ∞ -->
(
x
− − -->
E
[
X
]
)
2
f
(
x
)
d
x
{\displaystyle D[X]=\int \limits _{-\infty }^{+\infty }{(x-\mathbb {E} [X])^{2}f(x)dx}}
D
[
X
]
=
1
2
∫ ∫ -->
− − -->
∞ ∞ -->
+
∞ ∞ -->
∫ ∫ -->
− − -->
∞ ∞ -->
+
∞ ∞ -->
(
x
2
− − -->
x
1
)
2
f
(
x
1
)
f
(
x
2
)
d
x
1
d
x
2
{\displaystyle D[X]={\frac {1}{2}}\int \limits _{-\infty }^{+\infty }\int \limits _{-\infty }^{+\infty }(x_{2}-x_{1})^{2}{f(x_{1})f(x_{2})dx_{1}dx_{2}}}
,
где
f
(
x
)
{\displaystyle f(x)}
— плотность вероятности случайной величины.
В силу линейности математического ожидания справедлива формула:
D
[
X
]
=
E
[
X
2
]
− − -->
(
E
[
X
]
)
2
{\displaystyle D[X]=\mathbb {E} [X^{2}]-\left(\mathbb {E} [X]\right)^{2}}
Дисперсия является вторым центральным моментом случайной величины.
Дисперсия может быть бесконечной.
Дисперсия может быть вычислена с помощью производящей функции моментов
U
(
t
)
{\displaystyle U(t)}
:
D
[
X
]
=
E
[
X
2
]
− − -->
(
E
[
X
]
)
2
=
U
″
(
0
)
− − -->
(
U
′
(
0
)
)
2
.
{\displaystyle D[X]=\mathbb {E} [X^{2}]-\left(\mathbb {E} [X]\right)^{2}=U''(0)-\left(U'(0)\right)^{2}.}
Дисперсия целочисленной случайной величины может быть вычислена с помощью производящей функции последовательности .
Формула для вычисления смещённой оценки дисперсии случайной величины
X
{\displaystyle X}
по последовательности реализаций этой случайной величины:
X
1
.
.
.
X
n
{\displaystyle X_{1}...X_{n}}
имеет вид:
S
¯ ¯ -->
2
=
1
n
∑ ∑ -->
i
=
1
n
(
X
i
− − -->
X
¯ ¯ -->
)
2
{\displaystyle {\overline {S}}^{2}={\frac {1}{n}}\sum \limits _{i=1}^{n}(X_{i}-{\overline {X}})^{2}}
, где
X
¯ ¯ -->
=
1
n
∑ ∑ -->
i
=
1
n
X
i
{\displaystyle {\overline {X}}={\frac {1}{n}}\sum \limits _{i=1}^{n}X_{i}}
— выборочное среднее (несмещённая оценка
E
[
X
]
{\displaystyle \mathbb {E} [X]}
).
Для получения несмещённой оценки дисперсии случайной величины значение
S
¯ ¯ -->
2
{\displaystyle {\overline {S}}^{2}}
необходимо умножить на
n
n
− − -->
1
{\displaystyle {\frac {n}{n-1}}}
. Несмещённая оценка имеет вид:
S
~ ~ -->
2
=
1
n
− − -->
1
∑ ∑ -->
i
=
1
n
(
X
i
− − -->
X
¯ ¯ -->
)
2
{\displaystyle {\widetilde {S}}^{2}={\frac {1}{n-1}}\sum \limits _{i=1}^{n}(X_{i}-{\bar {X}})^{2}}
Свойства
Дисперсия любой случайной величины неотрицательна:
D
[
X
]
⩾ ⩾ -->
0
;
{\displaystyle D[X]\geqslant 0;}
Если дисперсия случайной величины конечна, то конечно и её математическое ожидание;
Если случайная величина равна константе, то её дисперсия равна нулю:
D
[
a
]
=
0.
{\displaystyle D[a]=0.}
Верно и обратное: если
D
[
X
]
=
0
,
{\displaystyle D[X]=0,}
то
X
=
E
[
X
]
{\displaystyle X=\mathbb {E} [X]}
почти всюду .
Дисперсия суммы двух случайных величин равна:
D
[
X
+
Y
]
=
D
[
X
]
+
D
[
Y
]
+
2
cov
(
X
,
Y
)
{\displaystyle D[X+Y]=D[X]+D[Y]+2\,{\text{cov}}(X,Y)}
, где
cov
(
X
,
Y
)
{\displaystyle {\text{cov}}(X,Y)}
— их ковариация .
Для дисперсии произвольной линейной комбинации нескольких случайных величин имеет место равенство:
D
[
∑ ∑ -->
i
=
1
n
c
i
X
i
]
=
∑ ∑ -->
i
=
1
n
c
i
2
D
[
X
i
]
+
2
∑ ∑ -->
1
⩽ ⩽ -->
i
<
j
⩽ ⩽ -->
n
c
i
c
j
cov
(
X
i
,
X
j
)
{\displaystyle D\left[\sum _{i=1}^{n}c_{i}X_{i}\right]=\sum _{i=1}^{n}c_{i}^{2}D[X_{i}]+2\sum _{1\leqslant i<j\leqslant n}c_{i}c_{j}\,{\text{cov}}(X_{i},X_{j})}
, где
c
i
∈ ∈ -->
R
{\displaystyle c_{i}\in \mathbb {R} }
.
В частности,
D
[
X
1
+
… … -->
+
X
n
]
=
D
[
X
1
]
+
… … -->
+
D
[
X
n
]
{\displaystyle D[X_{1}+\ldots +X_{n}]=D[X_{1}]+\ldots +D[X_{n}]}
для любых независимых или некоррелированных случайных величин, так как их ковариации равны нулю.
D
[
a
X
]
=
a
2
D
[
X
]
{\displaystyle D\left[aX\right]=a^{2}D[X]}
D
[
− − -->
X
]
=
D
[
X
]
{\displaystyle D\left[-X\right]=D[X]}
D
[
X
+
b
]
=
D
[
X
]
{\displaystyle D\left[X+b\right]=D[X]}
Если
X
=
X
(
ω ω -->
,
τ τ -->
)
{\displaystyle X=X(\omega ,\tau )}
— случайная величина от пары элементарных событий (случайная величина на декартовом произведении вероятностных пространств), то
D
(
ω ω -->
,
τ τ -->
)
[
X
]
=
E
ω ω -->
[
D
τ τ -->
[
X
]
]
+
D
ω ω -->
[
E
τ τ -->
[
X
]
]
{\displaystyle D_{(\omega ,\tau )}[X]=\mathbb {E} _{\omega }[D_{\tau }[X]]+D_{\omega }[\mathbb {E} _{\tau }[X]]}
Условная дисперсия
Наряду с условным математическим ожиданием
E
[
X
|
Y
]
{\displaystyle \mathbb {E} [X|Y]}
в теории случайных процессов используется условная дисперсия случайных величин
D
[
X
|
Y
]
{\displaystyle D[X|Y]}
.
Условной дисперсией случайной величины
X
{\displaystyle X}
относительно случайной величины
Y
{\displaystyle Y}
называется случайная величина:
D
[
X
|
Y
]
=
E
[
(
X
− − -->
E
[
X
|
Y
]
)
2
|
Y
]
=
E
[
X
2
|
Y
]
− − -->
E
[
X
|
Y
]
2
{\displaystyle D[X|Y]=\mathbb {E} [(X-\mathbb {E} [X|Y])^{2}|Y]=\mathbb {E} [X^{2}|Y]-\mathbb {E} [X|Y]^{2}}
.
Её свойства:
условная дисперсия относительно случайной величины
Y
{\displaystyle Y}
является Y-измеримой случайной величиной (то есть измерима относительно сигма-алгебры , порождённой случайной величиной
Y
{\displaystyle Y}
);
условная дисперсия неотрицательна:
D
[
X
|
Y
]
⩾ ⩾ -->
0
{\displaystyle D[X|Y]\geqslant 0}
;
условная дисперсия
D
[
X
|
Y
]
{\displaystyle D[X|Y]}
равна нулю тогда и только тогда, когда
X
=
E
[
X
|
Y
]
{\displaystyle X=\mathbb {E} [X|Y]}
почти наверное, то есть тогда и только тогда, когда
X
{\displaystyle X}
совпадает почти наверное с некоторой Y-измеримой величиной (а именно, с
E
[
X
|
Y
]
{\displaystyle \mathbb {E} [X|Y]}
);
обычная дисперсия также может быть представлена как условная:
D
[
X
]
=
D
[
X
|
1
]
{\displaystyle D[X]=D[X|1]}
;
если величины
X
{\displaystyle X}
и
Y
{\displaystyle Y}
независимы, случайная величина
D
[
X
|
Y
]
{\displaystyle D[X|Y]}
является константой, равной
D
[
X
]
{\displaystyle D[X]}
;
если
X
,
Y
{\displaystyle X,Y}
— две числовые случайные величины, то
D
[
X
]
=
E
[
D
[
X
|
Y
]
]
+
D
[
E
[
X
|
Y
]
]
,
{\displaystyle D[X]=\mathbb {E} [D[X|Y]]+D[\mathbb {E} [X|Y]],}
откуда, в частности, следует, что дисперсия условного математического ожидания
E
[
X
|
Y
]
{\displaystyle \mathbb {E} [X|Y]}
всегда меньше или равна дисперсии исходной случайной величины
X
{\displaystyle X}
.
Пример
Пусть случайная величина
X
{\displaystyle \displaystyle X}
имеет стандартное непрерывное равномерное распределение на
[
0
,
1
]
{\displaystyle \displaystyle [0,1]}
, то есть её плотность вероятности задана равенством
f
X
(
x
)
=
{
1
,
x
∈ ∈ -->
[
0
,
1
]
0
,
x
∉
[
0
,
1
]
.
{\displaystyle f_{X}(x)=\left\{{\begin{matrix}1,&x\in [0,1]\\0,&x\not \in [0,1].\end{matrix}}\right.}
Тогда математическое ожидание квадрата случайной величины равно
E
[
X
2
]
=
∫ ∫ -->
0
1
x
2
d
x
=
x
3
3
|
0
1
=
1
3
{\displaystyle \mathbb {E} \left[X^{2}\right]=\int \limits _{0}^{1}\!x^{2}\,dx=\left.{\frac {x^{3}}{3}}\right\vert _{0}^{1}={\frac {1}{3}}}
,
и математическое ожидание случайной величины равно
E
[
X
]
=
∫ ∫ -->
0
1
x
d
x
=
x
2
2
|
0
1
=
1
2
{\displaystyle \mathbb {E} \left[X\right]=\int \limits _{0}^{1}\!x\,dx=\left.{\frac {x^{2}}{2}}\right\vert _{0}^{1}={\frac {1}{2}}}
Дисперсия случайной величины равна
D
[
X
]
=
E
[
X
2
]
− − -->
(
E
[
X
]
)
2
=
1
3
− − -->
(
1
2
)
2
=
1
12
{\displaystyle D[X]=\mathbb {E} \left[X^{2}\right]-(\mathbb {E} [X])^{2}={\frac {1}{3}}-\left({\frac {1}{2}}\right)^{2}={\frac {1}{12}}}
См. также
Примечания
↑ Колмогоров А. Н. Глава IV. Математические ожидания; §3. Неравенство Чебышева // Основные понятия теории вероятностей. — 2-е изд. — М. : Наука, 1974. — С. 63—65. — 120 с.
↑ Боровков А. А. Глава 4. Числовые характеристики случайных величин; §5. Дисперсия // Теория вероятностей. — 5-е изд. — М. : Либроком, 2009. — С. 93—94. — 656 с.
Литература