Вам бонус- начислено 1 монета за дневную активность. Сейчас у вас 1 монета

Аппроксимационный метод оценки распределений по выборке

Лекция



Привет, Вы узнаете о том , что такое аппроксимационный метод оценки распределений по выборке, Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое аппроксимационный метод оценки распределений по выборке , настоятельно рекомендую прочитать все из категории Распознавание образов.

Этот подход мы рассматриваем отдельно потому, что по своим свойствам он достаточно универсален. Кроме оценки (восстановле­ния) распределений, он позволяет попутно решать задачу таксономии, оптимизированного управления последовательной процедурой измерения признаков, даже если они статистически зависимы, облегчает оценку информативности признаков и решение некоторых задач анализа экспериментальных данных.

В основе метода лежит предположение о том, что неизвестное (восстанавливаемое) распределение значений признаков каждого образа хорошо аппроксимируется смесью базовых распределений достаточно простого и заранее известного вида

Аппроксимационный метод оценки распределений по выборке 

где Аппроксимационный метод оценки распределений по выборке – множество (вектор) параметров Аппроксимационный метод оценки распределений по выборке-го базового распределения, Аппроксимационный метод оценки распределений по выборке – весовые коэффициенты, удовлетворяющие условию Аппроксимационный метод оценки распределений по выборке. Чтобы не загромождать формулу, в ней опущен индекс номера образа, который описывается данным распределением значений признаков.

Представление неизвестного распределения в виде ряда используется, например, в методе потенциальных функций. Однако там Аппроксимационный метод оценки распределений по выборке являются элементами полной ортогональной системы функций. С одной стороны, это хорошо, потому что вычисление Аппроксимационный метод оценки распределений по выборке первых значений Аппроксимационный метод оценки распределений по выборке гарантирует минимум среднеквадратического отклонения восстановленного распределения от истинного. Но с другой стороны, Аппроксимационный метод оценки распределений по выборке не являются распределениями, могут быть знакопеременными, что при Аппроксимационный метод оценки распределений по выборке, как правило, приводит к неприемлемому эффекту, когда для некоторых значений Аппроксимационный метод оценки распределений по выборке восстановленное распределение Аппроксимационный метод оценки распределений по выборке является отрицательным. Попытки избежать этого эффекта далеко не всегда являются успешными. Этого недостатка лишен рассматриваемый подход, когда искомое распределение представлено смесью базовых. При этом Аппроксимационный метод оценки распределений по выборке называют распределениями компонент смеси, а Аппроксимационный метод оценки распределений по выборке и Аппроксимационный метод оценки распределений по выборке – ее параметрами. У этого подхода при очевидных достоинствах имеются недостатки. В частности, решение задачи оценки параметров смеси является, вообще говоря, многоэкстремальным, и нет гарантий, что найденное решение находится в глобальном экстремуме, если исключить неприемлемый на практике полный перебор вариантов разбиения смеси на компоненты.

Такие понятия, как “смесь”, “компонента” обычно используются при решении задач таксономии, но это не является помехой для описания в виде смеси достаточно общего вида распределения значений признаков того или иного образа. Аппроксимационный метод является как бы промежуточным между параметрическим и непараметрическим оцениванием распределений. Действительно, по выборке приходится оценивать значения параметров Аппроксимационный метод оценки распределений по выборке и Аппроксимационный метод оценки распределений по выборке, и в то же время вид закона распределения заранее неизвестен, на него наложены лишь самые общие ограничения. Например, если компонента – нормальный закон, то плотность вероятности Аппроксимационный метод оценки распределений по выборке не должна обращаться в нуль при всех Аппроксимационный метод оценки распределений по выборке и быть достаточно гладкой. Если компонента – биномиальный закон, то Аппроксимационный метод оценки распределений по выборке может быть практически любым дискретным распределением.

Вместе с тем параметры смеси определить классическими методами параметрического оценивания (например, методом моментов или максимума функции правдоподобия) не представляется возможным за редкими исключениями (частными случаями). В связи с этим целесообразно обратиться к методам, используемым при решении задач таксономии.Аппроксимационный метод оценки распределений по выборке

В качестве компонент удобно использовать биномиальные законы для дискретных признаков и нормальные плотности вероятностей для непрерывных признаков, так как свойства и теория этих распределений хорошо изучены. К тому же они, как показывают практические приложения, в качестве компонент достаточно адекватно описывают весьма широкий класс распределений.

Нормальный закон, как известно, характеризуется вектором средних значений признаков и матрицей ковариаций. Особое место в ряде задач занимают нормальные законы с диагональными ковариационными матрицами (в компонентах признаки статистически независимы). При этом удается оптимизировать последовательную процедуру измерения признаков, даже если в восстановленном распределении Аппроксимационный метод оценки распределений по выборке признаки зависимы. Рассмотрение этого вопроса выходит за рамки курса. Интересующиеся могут обратиться к рекомендованной литературе [2].

Для облегчения понимания аппроксимационного метода будем рассматривать упрощенный вариант, а именно: одномерные распределения.

Итак,

Аппроксимационный метод оценки распределений по выборке 

гдеАппроксимационный метод оценки распределений по выборке Аппроксимационный метод оценки распределений по выборке

Аппроксимационный метод оценки распределений по выборке – для непрерывных признаков,
Аппроксимационный метод оценки распределений по выборке – для дискретных признаков,

Аппроксимационный метод оценки распределений по выборке – вектор параметров базового распределения (компонен­ты),

Аппроксимационный метод оценки распределений по выборке – весовой коэффициент Аппроксимационный метод оценки распределений по выборке-й компоненты,

Аппроксимационный метод оценки распределений по выборке – математическое ожидание Аппроксимационный метод оценки распределений по выборке-й нормальной компоненты,

Аппроксимационный метод оценки распределений по выборке – среднеквадратическое отклонение Аппроксимационный метод оценки распределений по выборке-й нормальной компоненты,

Аппроксимационный метод оценки распределений по выборке – параметр Аппроксимационный метод оценки распределений по выборке-й биномиальной компоненты,

Аппроксимационный метод оценки распределений по выборке – число градаций дискретного признака,

Аппроксимационный метод оценки распределений по выборке

Аппроксимационный метод оценки распределений по выборке

Аппроксимационный метод оценки распределений по выборке Аппроксимационный метод оценки распределений по выборке – число сочетаний из Аппроксимационный метод оценки распределений по выборке по Аппроксимационный метод оценки распределений по выборке.

При достаточно большом Аппроксимационный метод оценки распределений по выборке вместо биномиального закона можно использовать нормальный.

Теперь предстоит оценить значения параметров. Об этом говорит сайт https://intellect.icu . Если рассматривать смесь нормальных законов, то следует отметить, что метод максимума правдоподобия неприменим, когда все параметры смеси неизвестны. В таком случае можно воспользоваться разумно организованными итерационными процедурами. Рассмотрим одну из них.

Для начала зафиксируем Аппроксимационный метод оценки распределений по выборке, то есть будем считать его заданным. Каждому объекту Аппроксимационный метод оценки распределений по выборке выборки поставим в соответствие апостериорную вероятность Аппроксимационный метод оценки распределений по выборке принадлежности его Аппроксимационный метод оценки распределений по выборке-й компоненте смеси:

Аппроксимационный метод оценки распределений по выборке

Легко видеть, что для всех Аппроксимационный метод оценки распределений по выборке выполняются условия Аппроксимационный метод оценки распределений по выборке и Аппроксимационный метод оценки распределений по выборке. Если известны Аппроксимационный метод оценки распределений по выборке для всех Аппроксимационный метод оценки распределений по выборке Аппроксимационный метод оценки распределений по выборке, то можно определить Аппроксимационный метод оценки распределений по выборке методом максимума правдоподобия Аппроксимационный метод оценки распределений по выборке.

Функцию правдоподобия Аппроксимационный метод оценки распределений по выборке-й компоненты смеси определим следующим образом Аппроксимационный метод оценки распределений по выборке, и оценки максимального правдоподобия Аппроксимационный метод оценки распределений по выборке можно получить из уравнения Аппроксимационный метод оценки распределений по выборке

Таким образом, зная Аппроксимационный метод оценки распределений по выборке и Аппроксимационный метод оценки распределений по выборке, можно определить Аппроксимационный метод оценки распределений по выборке, и наоборот, зная Аппроксимационный метод оценки распределений по выборке, можно определить Аппроксимационный метод оценки распределений по выборке и Аппроксимационный метод оценки распределений по выборке, то есть параметры смеси. Но ни то, ни другое неизвестно. В связи с этим воспользуемся следующей процедурой последовательных приближений:

Аппроксимационный метод оценки распределений по выборке

где    Аппроксимационный метод оценки распределений по выборкеАппроксимационный метод оценки распределений по выборке – произвольно заданные начальные значения параметров смеси, верхний индекс – номер итерации в последовательной процедуре вычислений.

Известно, что эта процедура является сходящейся и при Аппроксимационный метод оценки распределений по выборке пределом служат оценки неизвестных параметров Аппроксимационный метод оценки распределений по выборке смеси, дающие максимум функции правдоподобия

Аппроксимационный метод оценки распределений по выборке,

причем Аппроксимационный метод оценки распределений по выборке и Аппроксимационный метод оценки распределений по выборке стремится к нулю при Аппроксимационный метод оценки распределений по выборке.

Для одномерного нормального закона

Аппроксимационный метод оценки распределений по выборке.

Решая уравнение Аппроксимационный метод оценки распределений по выборке и Аппроксимационный метод оценки распределений по выборке, получим для Аппроксимационный метод оценки распределений по выборке-го шага Аппроксимационный метод оценки распределений по выборкеАппроксимационный метод оценки распределений по выборке

После завершения последовательной процедуры вычисляются Аппроксимационный метод оценки распределений по выборке. Соответствующие вычислительные формулы для многомерных нормальных распределений можно найти в работе [2].

Получаемые в результате рассмотренной последовательной процедуры значения параметров являются оценками максимального правдоподобия как относительно каждой компоненты, так и относительно смеси в целом.

Если Аппроксимационный метод оценки распределений по выборке имеет несколько максимумов, то итерационный процесс в зависимости от заданных начальных значений Аппроксимационный метод оценки распределений по выборке сходится к одному из них, не обязательно глобальному. Преодолеть этот недостаток, присущий практически всем методам оценок параметров многомерных распределений (по крайней мере, смесей) достаточно сложно. В частности, можно повторить последовательную процедуру несколько раз при различных Аппроксимационный метод оценки распределений по выборке и выбрать наилучшее из решений. Выбор различных Аппроксимационный метод оценки распределений по выборке осуществляют либо случайным образом, либо с помощью различного рода направленных процедур. Скорость сходимости Аппроксимационный метод оценки распределений по выборке к максимуму тем выше, чем сильнее разнесены компоненты в признаковом пространстве и чем ближе выбранные Аппроксимационный метод оценки распределений по выборке к значениям Аппроксимационный метод оценки распределений по выборке, соответствующим максимуму функции правдоподобия.

Мы рассмотрели метод оценки параметров смеси при фиксированном числе компонент Аппроксимационный метод оценки распределений по выборке. Но в аппроксимационном методе и Аппроксимационный метод оценки распределений по выборке следует определить, оптимизируя какой-либо критерий. Предлагается следующий подход. Оцениваются последовательно параметры Аппроксимационный метод оценки распределений по выборке при Аппроксимационный метод оценки распределений по выборке. Из полученного ряда Аппроксимационный метод оценки распределений по выборке выбирается в некотором смысле лучшее значение Аппроксимационный метод оценки распределений по выборке.

Воспользуемся мерой неопределенности К. Шеннона Аппроксимационный метод оценки распределений по выборке для поиска Аппроксимационный метод оценки распределений по выборке:

Аппроксимационный метод оценки распределений по выборке

 где   Аппроксимационный метод оценки распределений по выборке – энтропия распределения Аппроксимационный метод оценки распределений по выборке,

Аппроксимационный метод оценки распределений по выборке – знак математического ожидания,

Аппроксимационный метод оценки распределений по выборке – плотность вероятности значений непрерывных признаков.

При последовательном увеличении значений Аппроксимационный метод оценки распределений по выборке имеют место две тенденции:

·  уменьшение энтропии за счет разделения выборки на части с уменьшающимся разбросом значений наблюдаемых величин Аппроксимационный метод оценки распределений по выборке внутри подвыборок (компонент смеси);

·  увеличение энтропии за счет уменьшения объема подвыборок и связанным с этим увеличением статистик, характеризующих разброс значений Аппроксимационный метод оценки распределений по выборке.

Наличие этих двух тенденций обуславливает существование Аппроксимационный метод оценки распределений по выборке по критерию наименьшего значения дифференциальной энтропии (рис. 23). Чтобы использовать на практике этот критерий, необходимо в явном виде выразить оценку компонент смеси через объем подвыборки, формирующей эту компоненту. Такие соотношения получены для нормальных и биномиальных распределений. Для простоты рассмотрим одномерное нормальное распределение. Воспользуемся его байесовской оценкой

Аппроксимационный метод оценки распределений по выборке

где    Аппроксимационный метод оценки распределений по выборке – область определения Аппроксимационный метод оценки распределений по выборке,

Аппроксимационный метод оценки распределений по выборке – область определения Аппроксимационный метод оценки распределений по выборке,

Аппроксимационный метод оценки распределений по выборке – выборочные оценки Аппроксимационный метод оценки распределений по выборке и Аппроксимационный метод оценки распределений по выборке.

В соответствии с формулой Байеса

Аппроксимационный метод оценки распределений по выборке

 

Аппроксимационный метод оценки распределений по выборке

Рис. 23. Иллюстрация тенденций, формирующих Аппроксимационный метод оценки распределений по выборке

Если априорное распределение Аппроксимационный метод оценки распределений по выборке неизвестно, то целесообразно использовать равномерное распределение по всей области Аппроксимационный метод оценки распределений по выборке

Опустив все выкладки, которые приведены в работе [2], сообщим лишь, что получается распределение, не являющееся гауссовым, но асимптотически сходящееся к нему (при Аппроксимационный метод оценки распределений по выборке). Среднее значение Аппроксимационный метод оценки распределений по выборке равно среднему значению, определенному по выборке, а дисперсия равна выборочной дисперсии Аппроксимационный метод оценки распределений по выборке, умноженной на коэффициент Аппроксимационный метод оценки распределений по выборке 

 

Можно показать, что Аппроксимационный метод оценки распределений по выборке хорошо аппроксимируется нормальным законом с математическим ожиданием, равным Аппроксимационный метод оценки распределений по выборке – выборочному среднему, и дисперсией, равной выборочной дисперсии Аппроксимационный метод оценки распределений по выборке, умноженной на Аппроксимационный метод оценки распределений по выборке. Как видно из формулы, Аппроксимационный метод оценки распределений по выборке стремится к единице при Аппроксимационный метод оценки распределений по выборке, возрастает с уменьшением Аппроксимационный метод оценки распределений по выборке и накладывает ограничения на объем выборки Аппроксимационный метод оценки распределений по выборке (рис. 24).

 

 

 

Аппроксимационный метод оценки распределений по выборке

Рис. 24. Зависимость поправочного коэффициента b 
от объема выборки N

Таким образом, нам удалось в явной форме выразить зависимость параметров компонент смеси от объема подвыборок, что, в свою очередь, позволяет реализовать процедуру поиска Аппроксимационный метод оценки распределений по выборке.

Объем подвыборки для q-й компоненты смеси определяется по формуле Аппроксимационный метод оценки распределений по выборке.

Итак, рассмотрен вариант оценки параметров смеси. Он не является статистически строго обоснованным, но все вычислительные процедуры опираются на критерии, принятые в математической статистике. Многочисленные практические приложения аппроксимационного метода в различных предметных областях показали его эффективность и не противоречат ни одному из допущений, изложенных в данном разделе.

 Более подробное и углубленное изложение аппроксимационного метода желающие могут найти в рекомендованной литературе [2], [4].

Представленные результаты и исследования подтверждают, что применение искусственного интеллекта в области аппроксимационный метод оценки распределений по выборке имеет потенциал для революции в различных связанных с данной темой сферах. Надеюсь, что теперь ты понял что такое аппроксимационный метод оценки распределений по выборке и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Распознавание образов

создано: 2017-04-09
обновлено: 2024-11-14
131



Рейтиг 9 of 10. count vote: 2
Вы довольны ?:


Поделиться:

Найди готовое или заработай

С нашими удобными сервисами без комиссии*

Как это работает? | Узнать цену?

Найти исполнителя
$0 / весь год.
  • У вас есть задание, но нет времени его делать
  • Вы хотите найти профессионала для выплнения задания
  • Возможно примерение функции гаранта на сделку
  • Приорететная поддержка
  • идеально подходит для студентов, у которых нет времени для решения заданий
Готовое решение
$0 / весь год.
  • Вы можите продать(исполнителем) или купить(заказчиком) готовое решение
  • Вам предоставят готовое решение
  • Будет предоставлено в минимальные сроки т.к. задание уже готовое
  • Вы получите базовую гарантию 8 дней
  • Вы можете заработать на материалах
  • подходит как для студентов так и для преподавателей
Я исполнитель
$0 / весь год.
  • Вы профессионал своего дела
  • У вас есть опыт и желание зарабатывать
  • Вы хотите помочь в решении задач или написании работ
  • Возможно примерение функции гаранта на сделку
  • подходит для опытных студентов так и для преподавателей

Комментарии


Оставить комментарий
Если у вас есть какое-либо предложение, идея, благодарность или комментарий, не стесняйтесь писать. Мы очень ценим отзывы и рады услышать ваше мнение.
To reply

Распознавание образов

Термины: Распознавание образов