Статистические методы распознавания образов кратко

Лекция

Привет, Вы узнаете о том , что такое статистические методы распознавания образов, Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое статистические методы распознавания образов , настоятельно рекомендую прочитать все из категории Распознавание образов.

Говоря о статистических методах распознавания, мы предполагаем установление связи между отнесением объекта к тому или иному классу (образу) и вероятностью ошибки при решении этой задачи. В ряде случаев это сводится к определению апостериорной вероятности принадлежности объекта образу Статистические методы распознавания образов при условии, что признаки этого объекта приняли значения . Начнем с байесовского решающего правила. По формуле Байеса

Статистические методы распознавания образов

Здесь Статистические методы распознавания образов – априорная вероятность предъявления к распознаванию объекта -го образа:

Статистические методы распознавания образов .

Для каждого Статистические методы распознавания образов

Статистические методы распознавания образов ,

при признаках с непрерывной шкалой измерений

Статистические методы распознавания образов ,

при признаках с дискретной шкалой измерений

Статистические методы распознавания образов .

При непрерывных значениях признаков Статистические методы распознавания образов представляет из себя функцию плотности вероятностей, при дискретных – распределение вероятностей.

Распределения, описывающие разные классы, как правило, "пересекаются", то есть имеются такие значения признаков Статистические методы распознавания образов , при которых

Статистические методы распознавания образов .

В таких случаях ошибки распознавания неизбежны. Естественно, неинтересны случаи, когда эти классы (образы) в выбранной системе признаков Статистические методы распознавания образов неразличимы (при равных априорных вероятностях решения можно выбирать случайным отнесением объекта к одному из классов равновероятным образом).

В общем случае нужно стремиться выбрать решающие правила так, чтобы минимизировать риск потерь при распознавании.

Риск потерь определяется двумя компонентами: вероятностью ошибок распознавания и величиной "штрафа" за эти ошибки (потерями). Матрица ошибок распознавания:

Статистические методы распознавания образов ,

где Статистические методы распознавания образов – вероятность правильного распознавания;

Статистические методы распознавания образов – вероятность ошибочного отнесения объекта -го образа к -му ().

Матрица потерь

Статистические методы распознавания образов ,

где Статистические методы распознавания образов – "премия" за правильное распознавание;

Статистические методы распознавания образов – "штраф" за ошибочное отнесение объекта -го образа к -му ().

Необходимо построить решающее правило так, чтобы обеспечить минимум математического ожидания потерь (минимум среднего риска). Такое правило называется байесовским.

Разобьем признаковое пространство Статистические методы распознавания образов на непересекающихся областей , каждая из которых соответствует определенному образу.

Средний риск при попадании реализаций Статистические методы распознавания образов -го образа в области других образов равен

Статистические методы распознавания образов , .

Здесь предполагается, что все компоненты Статистические методы распознавания образов имеют непрерывную шкалу измерений (в данном случае это непринципиально).

Величину Статистические методы распознавания образов можно назвать условным средним риском (при условии, что совершена ошибка при распознавании объекта -го образа). Об этом говорит сайт https://intellect.icu . Общий (безусловный) средний риск определяется величиной Статистические методы распознавания образов

Решающие правила (способы разбиения Статистические методы распознавания образов на ) образуют множество . Наилучшим (байесовским) решающим правилом является то, которое обеспечивает минимальный средний риск Статистические методы распознавания образов , где – средний риск при применении одного из решающих правил, входящих в .

Рассмотрим упрощенный случай. Пусть Статистические методы распознавания образов , а (). В таком случае байесовское решающее правило обеспечивает минимум вероятности (среднего количества) ошибок распознавания. Пусть Статистические методы распознавания образов . Вероятность ошибки первого рода (объект 1-го образа отнесен ко второму образу)

Статистические методы распознавания образов ,

где Статистические методы распознавания образов – вероятность ошибки второго рода

Статистические методы распознавания образов .

Средние ошибки

Статистические методы распознавания образов .

Так как Статистические методы распознавания образов , то и . Ясно, что минимум будет иметь минимум в том случае, если подынтегральное выражение в области будет строго отрицательным, то есть в Статистические методы распознавания образов . В области должно выполняться противоположное неравенство. Это и есть байесовское решающее правило для рассматриваемого случая. Оно может быть записано иначе: Статистические методы распознавания образов ; величина , рассматриваемая как функция от , называется правдоподобием при данном , а – отношением правдоподобия. Таким образом, байесовское решающее правило можно сформулировать как рекомендацию выбирать решение Статистические методы распознавания образов в случае, если отношение правдоподобия превышает определенное пороговое значение, не зависящее от наблюдаемого .

Без специального рассмотрения укажем, что если число распознаваемых классов больше двух ( Статистические методы распознавания образов ), решение в пользу класса (образа) принимается в области , в которой для всех .

Иногда при невысокой точности оценки апостериорной вероятности (малых объемах обучающей выборки) используют так называемые рандомизированные решающие правила. Они состоят в том, что неизвестный объект относят к тому или иному образу не по максимуму апостериорной вероятности, а случайным образом, в соответствии с апостериорными вероятностями этих образов Статистические методы распознавания образов . Реализовать это можно, например, способом, изображенным на рис. 18.

Статистические методы распознавания образов

Рис. 18. Иллюстрация рандомизированного решающего правила

После вычисления апостериорных вероятностей принадлежности неизвестного объекта с параметрами Статистические методы распознавания образов каждому из образов , , отрезок прямой длиной единица разбивают на интервалов с длинами, численно равными , и каждому интервалу ставят в соответствие этот образ. Затем с помощью датчика случайных (псевдослучайных) чисел, равномерно распределенных на Статистические методы распознавания образов , генерируют число, определяют интервал, в который оно попало, и относят распознаваемый объект к тому образу, которому соответствует данный интервал.

Понятно, что такое решающее правило не может быть лучше байесовского, но при больших значениях отношения правдоподобия ненамного ему уступает, а в реализации может оказаться достаточно простым (например, метод ближайшего соседа, о чем речь пойдет позже).

Байесовское решающее правило реализуется в компьютерах в основном двумя способами.

1. Прямое вычисление апостериорных вероятностей

Статистические методы распознавания образов ,

где Статистические методы распознавания образов – вектор значений параметров распознаваемого объекта и выбор максимума. Решение принимается в пользу того образа, для которого Статистические методы распознавания образов максимально. Иными словами, байесовское решающее правило реализуется решением задачи .

Если пойти на дальнейшее обобщение и допустить наличие матрицы потерь общего вида, то условный риск можно определить по формуле Статистические методы распознавания образов , . Здесь первый член определяет "поощрение" за правильное распознавание, а второй – "наказание" за ошибку. Байесовское решающее правило в данном случае состоит в решении задачи

Статистические методы распознавания образов

2. "Топографическое" определение области Статистические методы распознавания образов , в которую попал вектор значений признаков, описывающих распознаваемый объект.

Такой подход используют в тех случаях, когда описание областей Статистические методы распознавания образов достаточно компактно, а процедура определения области, в которую попал , проста. Иными словами, данный подход естественно использовать, когда в вычислительном отношении он эффективнее (проще), чем прямое вычисление апостериорных вероятностей.

Статистические методы распознавания образов

Рис. 19. Байесовское решающее правило
для нормально распределенных признаков
с равными ковариационными матрицами

Так, например (доказательство приводить не будем), если классов два, их априорные вероятности одинаковы, Статистические методы распознавания образов и – нормальные распределения с одинаковыми ковариационными матрицами (отличаются только векторами средних), то байесовская разделяющая граница – гиперплоскость. Запоминается она значениями коэффициентов линейного уравнения. При распознавании какого-либо объекта в уравнение подставляют значения признаков Статистические методы распознавания образов этого объекта и по знаку (плюс или минус) получаемого решения относят объект к или (рис. 19).

Если у классов Статистические методы распознавания образов и ковариационные матрицы и не только одинаковы, но и диагональны, то байесовским решением является отнесение объекта к тому классу, евклидово расстояние до эталона которого минимально (рис. 20).

Статистические методы распознавания образов

Рис. 20. Байесовское решающее правило для нормально распределенных признаков с равными диагональными ковариационными матрицами (элементы диагоналей одинаковы)

Таким образом, мы убеждаемся в том, что некоторые решающие правила, ранее рассмотренные нами как эмпирические (детерминированные, эвристические), имеют вполне четкую статистическую трактовку. Более того, в ряде конкретных случаев они являются статистически оптимальными. Список подобных примеров мы продолжим при дальнейшем рассмотрении статистических методов распознавания.

Теперь перейдем к методам оценки распределений значений признаков классов. Знание Статистические методы распознавания образов является наиболее универсальной информацией для решения задач распознавания статистическими методами. Эту информацию можно получить двояким образом:

заранее определить (оценить) Статистические методы распознавания образов для всех и ;

определять Статистические методы распознавания образов при каждом акте распознавания конкретного объекта, признаки которого имеют значения .

Каждый из этих подходов имеет свои преимущества и недостатки, зависящие от числа признаков, объема обучающей выборки, наличия априорной информации и т.п.

Начнем с локального варианта (определения Статистические методы распознавания образов в окрестности распознаваемого объекта).

Вау!! 😲 Ты еще не читал? Это зря!

распознавание

Представленные результаты и исследования подтверждают, что применение искусственного интеллекта в области статистические методы распознавания образов имеет потенциал для революции в различных связанных с данной темой сферах. Надеюсь, что теперь ты понял что такое статистические методы распознавания образов и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Распознавание образов

Из статьи мы узнали кратко, но содержательно про статистические методы распознавания образов

Статистические методы распознавания образов кратко

Вау!! 😲 Ты еще не читал? Это зря!

Комментарии

Оставить комментарий

Распознавание образов

Термины: Распознавание образов