Лекция
Привет, Вы узнаете о том , что такое выборочная функция распределения, Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое выборочная функция распределения, эмпирическая функция распределения , настоятельно рекомендую прочитать все из категории Теория вероятностей. Математическая статистика и Стохастический анализ .
Выборочная (эмпирическая) функция распределения в математической статистике — это приближение теоретической функции распределения, построенное с помощью выборки из него.
Пусть — выборка объема , порожденная случайной величиной , задаваемой функцией распределения . Будем считать, что , где , — независимые случайные величины, определенные на некотором пространстве элементарных исходов . Пуст . Определим функцию следующим образом:
,
где — индикатор события , — функция Хевисайда. Таким образом, значение функции в точке равно относительной частоте элементов выборки, не превосходящих значение . Функция называется выборочной функцией распределения случайной величины , или эмпирической функцией выборки, и является аппроксимацией для функции . Существует теорема Колмогорова, утверждающая, что при функция равномерно сходится к , и указывающая скорость сходимости. Для каждого положительного , — случайная величина со значением .
Поскольку неизвестное распределение можно описать, например, его функцией распределения , построим по выборке «оценку» для этой функции.
Эмпирической функцией распределения, построенной по выборке объема , называется случайная функция , при каждом равная
называется индикатором события . Об этом говорит сайт https://intellect.icu . При каждом это — случайная величина, имеющая распределение Бернулли с параметром .
Иначе говоря, при любом значение , равное истинной вероятности случайной величине быть меньше , оценивается долей элементов выборки, меньших .
Если элементы выборки , , упорядочить по возрастанию (на каждом элементарном исходе), получится новый набор случайных величин, называемый вариационным рядом:
Здесь
Элемент , , называется -м членом вариационного ряда или -й порядковой статистикой.
,
где , а — количество элементов выборки, равных . В частности, если все элементы выборки различны, то .
Математическое ожидание этого распределения имеет вид:
.
Таким образом, выборочное среднее — это теоретическое среднее выборочного распределения. Аналогично, выборочная дисперсия — это теоретическая дисперсия выборочного распределения.
.
.
.
почти наверное при .
по распределению при .
Выборка:
Вариационный ряд:
эмпирическая функция распределения имеет скачки в точках выборки, величина скачка в точке равна , где — количество элементов выборки, совпадающих с .
Можно построить эмпирическую функцию распределения по вариационному ряду:
Другой характеристикой распределения является таблица (для дискретных распределений) или плотность (для абсолютно непрерывных). Эмпирическим, или выборочным аналогом таблицы или плотности является так называемая гистограмма.
Гистограмма строится по группированным данным. Предполагаемую область значений случайной величины (или область выборочных данных) делят независимо от выборки на некоторое количество интервалов (не обязательно одинаковых). Пусть , , — интервалы на прямой, называемые интервалами группировки. Обозначим для через число элементов выборки, попавших в интервал :
(1)
На каждом из интервалов строят прямоугольник, площадь которого пропорциональна . Общая площадь всех прямоугольников должна равняться единице. Пусть — длина интервала . Высота прямоугольника над равна
Полученная фигура называется гистограммой.
Имеется вариационный ряд (см. пример 1):
Разобьем отрезок на 4 равных отрезка. В отрезок попали 4 элемента выборки, в — 6, в — 3, и в отрезок попали 2 элемента выборки. Строим гистограмму (рис. 2). На рис. 3 — тоже гистограмма для той же выборки, но при разбиении области на 5 равных отрезков.
рис 2 рис 3
В курсе «Эконометрика» утверждается, что наилучшим числом интервалов группировки («формула Стерджесса») является .
Здесь — десятичный логарифм, поэтому , т.е. при увеличении выборки вдвое число интервалов группировки увеличивается на 1. Заметим, что чем больше интервалов группировки, тем лучше. Но, если брать число интервалов, скажем, порядка , то с ростом гистограмма не будет приближаться к плотности.
Справедливо следующее утверждение:
Если плотность распределения элементов выборки является непрерывной функцией, то при так, что , имеет место поточечная сходимость по вероятности гистограммы к плотности.
Так что выбор логарифма разумен, но не является единственно возможным.
Исследование, описанное в статье про выборочная функция распределения, подчеркивает ее значимость в современном мире. Надеюсь, что теперь ты понял что такое выборочная функция распределения, эмпирическая функция распределения и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Теория вероятностей. Математическая статистика и Стохастический анализ
Из статьи мы узнали кратко, но содержательно про выборочная функция распределения
Комментарии
Оставить комментарий
Теория вероятностей. Математическая статистика и Стохастический анализ
Термины: Теория вероятностей. Математическая статистика и Стохастический анализ