Лекция
Привет, сегодня поговорим про квантиль, обещаю рассказать все что знаю. Для того чтобы лучше понимать что такое квантиль, процентиль, квантиль, дециль, медиана, мода , настоятельно рекомендую прочитать все из категории Теория вероятностей. Математическая статистика и Стохастический анализ .
квантиль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью.
Рассмотрим вероятностное пространство и — вероятностная мера, задающая распределение некоторой случайной величины . Пусть фиксировано . Тогда -квантилью (или квантилью уровня ) распределения называется число , такое что
В некоторых источниках (например, в англоязычной литературе) -ой -квантилью называется квантиль уровня , то есть -квантиль в предыдущих обозначениях.
где — функция распределения .
a) если , то полагаем ;
б) если , то полагаем ;
в) если , то полагаем .
Заданная таким образом -квантиль удовлетворяет приведенному выше определению.
В некоторых случаях (при большом объеме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства можно использовать приближенное сравнение (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).
Интерквартильным размахом (англ. Interquartile range) называется разность между третьим и первым квартилями, то есть . Интерквартильный размах является характеристикой разброса распределения величины и является робастныманалогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.
Дециль характеризует распределение величин совокупности, при котором девять значений дециля делят ее на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля от 90 % наибольших величин, лежащих выше дециля.
Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определенному интервалу и имеет вполне определенное значение .
-ой перценти́лью называют квантиль уровня . При этом обычно рассматривают перцентили для целых , хотя данное требование не обязательно . Соответственно, медиана является 50-й перцентилью, а первый и третий квартиль — 25-й и 75-й перцентилями.
В целом, понятия квантиль и перцентиль взаимозаменяемы , так же как и шкалы исчисления вероятностей — абсолютная и процентная.
Перцентили также называются процентилями или центилями.
Вероятность (уровень квантили), % | 99,99 | 99,90 | 99,00 | 97,72 | 97,50 | 95,00 | 90,00 | 84,13 | 50,00 |
Квантиль | 3,715 | 3,090 | 2,326 | 2,000 | 1,960 | 1,645 | 1,282 | 1,000 | 0,000 |
Мода — значение во множестве наблюдений, которое встречается наиболее часто. (Мода = типичность.) Иногда в совокупности встречается более чем одна мода (например: 6, 2, 6, 6, 8, 9, 9, 9, 0; мода — 6 и 9). В этом случае можно сказать, что совокупность мультимодальна. Из структурных средних величин только мода обладает таким уникальным свойством. Как правило, мультимодальность указывает на то, что набор данных не подчиняется нормальному распределению.
Мода как средняя величина употребляется чаще для данных, имеющих нечисловую природу. Среди перечисленных цветов автомобилей — белый, черный, синий металлик, белый, синий металлик, белый — мода будет равна белому цвету. При экспертной оценке с ее помощью определяют наиболее популярные типы продукта, что учитывается при прогнозе продаж или планировании их производства.
Для интервального ряда мода определяется по формуле:
здесь XMо — левая граница модального интервала, hМо — длина модального интервала, fМо − 1 — частота премодального интервала, fМо — частота модального интервала, fМо + 1 — частота послемодального интервала .
Модой абсолютно непрерывного распределения называют любую точку локального максимума плотности распределения. Для дискретных распределений модой считают любое значение ai, вероятность которого pi больше, чем вероятности соседних значений.
Данные часто описывают с помощью среднего значения: — средний рост человка, — средняя оценка фильма, — среднегодовой курс $. Вместо среднего лучше использовать медиану и процентили.
Математика |
Среднее степенное (взвешенное) Среднее гармоническое взвешенное Среднее геометрическоевзвешенное Среднее арифметическоевзвешенное Среднее квадратическое Среднее кубическое Среднее арифметико-геометрическое Среднее значение функции Среднее Колмогорова |
---|---|
Геометрия |
|
Теория вероятностей и математическая статистика |
|
Информационные технологии |
|
Теоремы |
|
Другое |
|
Надеюсь, эта статья про квантиль, была вам полезна, счастья и удачи в ваших начинаниях! Надеюсь, что теперь ты понял что такое квантиль, процентиль, квантиль, дециль, медиана, мода и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Теория вероятностей. Математическая статистика и Стохастический анализ
Из статьи мы узнали кратко, но содержательно про квантиль
Комментарии
Оставить комментарий
Теория вероятностей. Математическая статистика и Стохастический анализ
Термины: Теория вероятностей. Математическая статистика и Стохастический анализ