Дисперсия случайной величины

Диспе́рсия случа́йной величины́ — мера разброса значений случайной величины относительно её математического ожидания. Обозначается $D[X]$ в русской литературе и $\operatorname {Var} (X)$ (англ. variance) в зарубежной. В статистике часто употребляется обозначение $\sigma _{X}^{2}$ или $\displaystyle \sigma ^{2}$ .

Квадратный корень из дисперсии, равный $\displaystyle \sigma$ , называется среднеквадратическим отклонением, стандартным отклонением или стандартным разбросом. Стандартное отклонение измеряется в тех же единицах, что и сама случайная величина, а дисперсия измеряется в квадратах этой единицы измерения.

Из неравенства Чебышёва следует, что вероятность того, что значения случайной величины отстоят от математического ожидания этой случайной величины более чем на $k$ стандартных отклонений, составляет менее $1/k^{2}$ . В специальных случаях оценка может быть усилена. Так, например, как минимум в 95 % случаев значения случайной величины, имеющей нормальное распределение, удалены от её среднего не более чем на два стандартных отклонения, а в примерно 99,7 % — не более чем на три.

Определение

Дисперсией случайной величины называют математическое ожидание квадрата отклонения случайной величины от её математического ожидания.

Пусть $X$ — случайная величина, определённая на некотором вероятностном пространстве. Тогда дисперсией называется

D[X]=\mathbb {E} \left[{\big (}X-\mathbb {E} [X]{\big )}^{2}\right],

где символ $\mathbb {E}$ обозначает математическое ожидание^[1]^[2].

Замечания

Если случайная величина $X$ дискретная, то
$D[X]=\sum _{i=1}^{n}{p_{i}(x_{i}-\mathbb {E} [X])^{2}},$

$D[X]={\frac {1}{2}}\sum _{i=1}^{n}\sum _{j=1}^{n}{p_{i}p_{j}(x_{i}-x_{j})^{2}}=\sum _{i=1}^{n}\sum _{j=i+1}^{n}{p_{i}p_{j}(x_{i}-x_{j})^{2}},$

где $x_{i}$ — $i$ -ое значение случайной величины, $p_{i}=P(X=x_{i})$ — вероятность того, что случайная величина принимает значение $x_{i}$ , $n$ — количество значений, которые принимает случайная величина.

Доказательство 2-й формулы

Пусть $Y$ - случайная величина, независимая от $X$ , но с тем же самым распределением. Тогда $P(Y=x_{i})=p_{i}$ , $\mathbb {E} [Y]=\mathbb {E} [X]$ , $D[Y]=D[X]$ и

D[X-Y]=D[X]+D[Y]=2D[X]

D[X-Y]=\mathbb {E} [(X-Y)^{2}]-\mathbb {E} [X-Y]^{2}=\mathbb {E} [(X-Y)^{2}]=\sum _{i=1}^{n}\sum _{j=1}^{n}p_{i}p_{j}(x_{i}-x_{j})^{2}

Сопоставляя две эти формулы, получаем нужное равенство.

Если случайная величина $X$ непрерывна, то:
$D[X]=\int \limits _{-\infty }^{+\infty }{(x-\mathbb {E} [X])^{2}f(x)dx}$

$D[X]={\frac {1}{2}}\int \limits _{-\infty }^{+\infty }\int \limits _{-\infty }^{+\infty }(x_{2}-x_{1})^{2}{f(x_{1})f(x_{2})dx_{1}dx_{2}}$ ,

где $f(x)$ — плотность вероятности случайной величины.

В силу линейности математического ожидания справедлива формула:
$D[X]=\mathbb {E} [X^{2}]-\left(\mathbb {E} [X]\right)^{2}$
Дисперсия является вторым центральным моментом случайной величины.
Дисперсия может быть бесконечной.
Дисперсия может быть вычислена с помощью производящей функции моментов $U(t)$ :
$D[X]=\mathbb {E} [X^{2}]-\left(\mathbb {E} [X]\right)^{2}=U''(0)-\left(U'(0)\right)^{2}.$
Дисперсия целочисленной случайной величины может быть вычислена с помощью производящей функции последовательности.
Формула для вычисления смещённой оценки дисперсии случайной величины $X$ по последовательности реализаций этой случайной величины: $X_{1}...X_{n}$ имеет вид:
${\overline {S}}^{2}={\frac {1}{n}}\sum \limits _{i=1}^{n}(X_{i}-{\overline {X}})^{2}$ , где ${\overline {X}}={\frac {1}{n}}\sum \limits _{i=1}^{n}X_{i}$ — выборочное среднее (несмещённая оценка $\mathbb {E} [X]$ ).

Для получения несмещённой оценки дисперсии случайной величины значение

{\overline {S}}^{2}

необходимо умножить на

{\frac {n}{n-1}}

. Несмещённая оценка имеет вид:

{\widetilde {S}}^{2}={\frac {1}{n-1}}\sum \limits _{i=1}^{n}(X_{i}-{\bar {X}})^{2}

Свойства

Дисперсия любой случайной величины неотрицательна: $D[X]\geqslant 0;$
Если дисперсия случайной величины конечна, то конечно и её математическое ожидание;
Если случайная величина равна константе, то её дисперсия равна нулю: $D[a]=0.$ Верно и обратное: если $D[X]=0,$ то $X=\mathbb {E} [X]$ почти всюду.
Дисперсия суммы двух случайных величин равна:
$D[X+Y]=D[X]+D[Y]+2\,{\text{cov}}(X,Y)$ , где ${\text{cov}}(X,Y)$ — их ковариация.
Для дисперсии произвольной линейной комбинации нескольких случайных величин имеет место равенство:
$D\left[\sum _{i=1}^{n}c_{i}X_{i}\right]=\sum _{i=1}^{n}c_{i}^{2}D[X_{i}]+2\sum _{1\leqslant i<j\leqslant n}c_{i}c_{j}\,{\text{cov}}(X_{i},X_{j})$ , где $c_{i}\in \mathbb {R}$ .
В частности, $D[X_{1}+\ldots +X_{n}]=D[X_{1}]+\ldots +D[X_{n}]$ для любых независимых или некоррелированных случайных величин, так как их ковариации равны нулю.
$D\left[aX\right]=a^{2}D[X]$
$D\left[-X\right]=D[X]$
$D\left[X+b\right]=D[X]$
Если $X=X(\omega ,\tau )$ — случайная величина от пары элементарных событий (случайная величина на декартовом произведении вероятностных пространств), то
$D_{(\omega ,\tau )}[X]=\mathbb {E} _{\omega }[D_{\tau }[X]]+D_{\omega }[\mathbb {E} _{\tau }[X]]$

Условная дисперсия

Наряду с условным математическим ожиданием $\mathbb {E} [X|Y]$ в теории случайных процессов используется условная дисперсия случайных величин $D[X|Y]$ .

Условной дисперсией случайной величины $X$ относительно случайной величины $Y$ называется случайная величина:

D[X|Y]=\mathbb {E} [(X-\mathbb {E} [X|Y])^{2}|Y]=\mathbb {E} [X^{2}|Y]-\mathbb {E} [X|Y]^{2}

.

Её свойства:

условная дисперсия относительно случайной величины $Y$ является Y-измеримой случайной величиной (то есть измерима относительно сигма-алгебры, порождённой случайной величиной $Y$ );
условная дисперсия неотрицательна: $D[X|Y]\geqslant 0$ ;
условная дисперсия $D[X|Y]$ равна нулю тогда и только тогда, когда $X=\mathbb {E} [X|Y]$ почти наверное, то есть тогда и только тогда, когда $X$ совпадает почти наверное с некоторой Y-измеримой величиной (а именно, с $\mathbb {E} [X|Y]$ );
обычная дисперсия также может быть представлена как условная: $D[X]=D[X|1]$ ;
если величины $X$ и $Y$ независимы, случайная величина $D[X|Y]$ является константой, равной $D[X]$ ;
если $X,Y$ — две числовые случайные величины, то
$D[X]=\mathbb {E} [D[X|Y]]+D[\mathbb {E} [X|Y]],$

откуда, в частности, следует, что дисперсия условного математического ожидания

\mathbb {E} [X|Y]

всегда меньше или равна дисперсии исходной случайной величины

X

.

Пример

Пусть случайная величина $\displaystyle X$ имеет стандартное непрерывное равномерное распределение на $\displaystyle [0,1]$ , то есть её плотность вероятности задана равенством

f_{X}(x)=\left\{{\begin{matrix}1,&x\in [0,1]\\0,&x\not \in [0,1].\end{matrix}}\right.

Тогда математическое ожидание квадрата случайной величины равно

\mathbb {E} \left[X^{2}\right]=\int \limits _{0}^{1}\!x^{2}\,dx=\left.{\frac {x^{3}}{3}}\right\vert _{0}^{1}={\frac {1}{3}}

,

и математическое ожидание случайной величины равно

\mathbb {E} \left[X\right]=\int \limits _{0}^{1}\!x\,dx=\left.{\frac {x^{2}}{2}}\right\vert _{0}^{1}={\frac {1}{2}}

Дисперсия случайной величины равна

D[X]=\mathbb {E} \left[X^{2}\right]-(\mathbb {E} [X])^{2}={\frac {1}{3}}-\left({\frac {1}{2}}\right)^{2}={\frac {1}{12}}

См. также

Примечания

↑ Колмогоров А. Н. Глава IV. Математические ожидания; §3. Неравенство Чебышева // Основные понятия теории вероятностей. — 2-е изд. — М.: Наука, 1974. — С. 63—65. — 120 с.
↑ Боровков А. А. Глава 4. Числовые характеристики случайных величин; §5. Дисперсия // Теория вероятностей. — 5-е изд. — М.: Либроком, 2009. — С. 93—94. — 656 с.

Литература

Гурский Д., Турбина Е. Mathcad для студентов и школьников. Популярный самоучитель. — СПб.: Питер, 2005. — С. 340. — ISBN 5469005259.
Орлов А. И. Дисперсия случайной величины // Математика случая: Вероятность и статистика — основные факты. — М.: МЗ-Пресс, 2004.

[1] Колмогоров А. Н. Глава IV. Математические ожидания; §3. Неравенство Чебышева // Основные понятия теории вероятностей. — 2-е изд. — М.: Наука, 1974. — С. 63—65. — 120 с.

[2] Боровков А. А. Глава 4. Числовые характеристики случайных величин; §5. Дисперсия // Теория вероятностей. — 5-е изд. — М.: Либроком, 2009. — С. 93—94. — 656 с.

[1]

[2]