Вам бонус- начислено 1 монета за дневную активность. Сейчас у вас 1 монета

Коэффициент детерминации

Лекция



Привет, сегодня поговорим про коэффициент детерминации, обещаю рассказать все что знаю. Для того чтобы лучше понимать что такое коэффициент детерминации , настоятельно рекомендую прочитать все из категории Теория вероятностей. Математическая статистика и Стохастический анализ .

 
 

коэффициент детерминации  (Коэффициент детерминации — R-квадрат) — это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными. Более точно — это единица минус доля необъясненной дисперсии (дисперсии случайной ошибки модели, или условной по факторам дисперсии зависимой переменной) в дисперсии зависимой переменной. Его рассматривают как универсальную меру зависимости одной случайной величины от множества других. В частном случае линейной зависимости Коэффициент детерминации является квадратом так называемого множественного коэффициента корреляции между зависимой переменной и объясняющими переменными. В частности, для модели парной линейной регрессии коэффициент детерминации равен квадрату обычного коэффициента корреляции между y и x.

 

Содержание

  • 1 Определение и формула
    • 1.1 Интерпретация
  • 2 Недостаток и альтернативные показатели
    • 2.1 Скорректированный (adjusted)
    • 2.2 Информационные критерии
    • 2.3 -обобщенный (extended)
  • 3 Замечание
  • 4 Вау!! 😲 Ты еще не читал? Это зря!
  • 5 Примечания
  • 6 Ссылки

 

Определение и формула[править ]

Истинный коэффициент детерминации модели зависимости случайной величины y от факторов x определяется следующим образом:

Коэффициент детерминации

где Коэффициент детерминации — условная (по факторам x) дисперсия зависимой переменной (дисперсия случайной ошибки модели).

В данном определении используются истинные параметры, характеризующие распределение случайных величин. Если использовать выборочную оценку значений соответствующих дисперсий, то получим формулу для выборочного коэффициента детерминации (который обычно и подразумевается под коэффициентом детерминации):

Коэффициент детерминации

где Коэффициент детерминации — сумма квадратов остатков регрессии, Коэффициент детерминации — фактические и расчетные значения объясняемой переменной.

Коэффициент детерминации — общая сумма квадратов.

Коэффициент детерминации

В случае линейной регрессии с константой Коэффициент детерминации, где Коэффициент детерминации — объясненная сумма квадратов, поэтому получаем более простое определение в этом случае — коэффициент детерминации — это доля объясненной суммы квадратов в общей:

Коэффициент детерминации

Необходимо подчеркнуть, что эта формула справедлива только для модели с константой, в общем случае необходимо использовать предыдущую формулу.

Интерпретация[править ]

  1. Коэффициент детерминации для модели с константой принимает значения от 0 до 1. Об этом говорит сайт https://intellect.icu . Чем ближе значение коэффициента к 1, тем сильнее зависимость. При оценке регрессионных моделей это интерпретируется как соответствие модели данным. Для приемлемых моделей предполагается, что коэффициент детерминации должен быть хотя бы не меньше 50 % (в этом случае коэффициент множественной корреляции превышает по модулю 70 %). Модели с коэффициентом детерминации выше 80 % можно признать достаточно хорошими (коэффициент корреляции превышает 90 %). Значение коэффициента детерминации 1 означает функциональную зависимость между переменными.
  2. При отсутствии статистической связи между объясняемой переменной и факторами, статистика Коэффициент детерминации для линейной регрессии имеет асимптотическое распределение Коэффициент детерминации, где Коэффициент детерминации — количество факторов модели (см. тест множителей Лагранжа). В случае линейной регрессии с нормально распределенными случайными ошибками статистика Коэффициент детерминации имеет точное (для выборок любого объема) распределение Фишера Коэффициент детерминации (см. F-тест). Информация о распределении этих величин позволяет проверить статистическую значимость регрессионной модели исходя из значения коэффициента детерминации. Фактически в этих тестах проверяется гипотеза о равенстве истинного коэффициента детерминации нулю.
  3. В общем случае коэффициент детерминации может быть и отрицательным, это говорит о крайней неадекватности модели: простое среднее приближает лучше.

Недостаток Коэффициент детерминации и альтернативные показатели[править ]

Основная проблема применения (выборочного) Коэффициент детерминации заключается в том, что его значение увеличивается (не уменьшается) от добавления в модель новых переменных, даже если эти переменные никакого отношения к объясняемой переменной не имеют! Поэтому сравнение моделей с разным количеством факторов с помощью коэффициента детерминации, вообще говоря, некорректно. Для этих целей можно использовать альтернативные показатели.

Скорректированный (adjusted) Коэффициент детерминации[править ]

Для того, чтобы была возможность сравнивать модели с разным числом факторов так, чтобы число регрессоров (факторов) не влияло на статистику Коэффициент детерминации обычно используется скорректированный коэффициент детерминации, в котором используются несмещенные оценки дисперсий:

Коэффициент детерминации

который дает штраф за дополнительно включенные факторы, где n — количество наблюдений, а k — количество параметров.

Данный показатель всегда меньше единицы, но теоретически может быть и меньше нуля (только при очень маленьком значении обычного коэффициента детерминации и большом количестве факторов). Поэтому теряется интерпретация показателя как «доли». Тем не менее, применение показателя в сравнении вполне обоснованно.

Для моделей с одинаковой зависимой переменной и одинаковым объемом выборки сравнение моделей с помощью скорректированного коэффициента детерминации эквивалентно их сравнению с помощью остаточной дисперсии  Коэффициент детерминации или стандартной ошибки модели Коэффициент детерминации. Разница только в том, что последние критерии чем меньше, тем лучше.

Информационные критерии[править ]

AIC — информационный критерий Акаике — применяется исключительно для сравнения моделей. Чем меньше значение, тем лучше. Часто используется для сравнения моделей временных рядов с разным количеством лагов.
Коэффициент детерминации, где k— количество параметров модели.
BIC или SC — байесовский информационный критерий Шварца — используется и интерпретируется аналогично AIC.
Коэффициент детерминации. Дает больший штраф за включение лишних лагов в модель , чем AIC.

Коэффициент детерминации-обобщенный (extended)[править ]

В случае отсутствия в линейной множественной МНК регрессии константы свойства коэффициента детерминации могут нарушаться для конкретной реализации. Поэтому модели регрессии со свободным членом и без него нельзя сравнивать по критерию Коэффициент детерминации. Эта проблема решается с помощью построения обобщенного коэффициента детерминации Коэффициент детерминации, который совпадает с исходным для случая МНК регрессии со свободным членом, и для которого выполняются четыре свойства, перечисленные выше. Суть этого метода заключается в рассмотрении проекции единичного вектора на плоскость объясняющих переменных.

Для случая регрессии без свободного члена:
Коэффициент детерминации,
где X — матрица nxk значений факторов, Коэффициент детерминации — проектор на плоскость X, Коэффициент детерминации, где Коэффициент детерминации — единичный вектор nx1.

Коэффициент детерминации с условием небольшой модификации, также подходит для сравнения между собой регрессий, построенных с помощью: МНК, обобщенного метода наименьших квадратов (ОМНК), условного метода наименьших квадратов (УМНК), обобщенно-условного метода наименьших квадратов (ОУМНК).

Замечание[править ]

Высокие значения коэффициента детерминации, вообще говоря, не свидетельствуют о наличии причинно-следственной зависимости между переменными (также как и в случае обычного коэффициента корреляции). Например, если объясняемая переменная и факторы, на самом деле не связанные с объясняемой переменой, имеют возрастающую динамику, то коэффициент детерминации будет достаточно высок. Поэтому логическая и смысловая адекватность модели имеют первостепенную важность. Кроме того, необходимо использовать критерии для всестороннего анализа качества модели .

Вау!! 😲 Ты еще не читал? Это зря![править ]

Примечания[править ]

 

На этом все! Теперь вы знаете все про коэффициент детерминации, Помните, что это теперь будет проще использовать на практике. Надеюсь, что теперь ты понял что такое коэффициент детерминации и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Теория вероятностей. Математическая статистика и Стохастический анализ

Из статьи мы узнали кратко, но содержательно про коэффициент детерминации
создано: 2014-11-06
обновлено: 2024-11-13
470



Рейтиг 9 of 10. count vote: 2
Вы довольны ?:


Поделиться:

Найди готовое или заработай

С нашими удобными сервисами без комиссии*

Как это работает? | Узнать цену?

Найти исполнителя
$0 / весь год.
  • У вас есть задание, но нет времени его делать
  • Вы хотите найти профессионала для выплнения задания
  • Возможно примерение функции гаранта на сделку
  • Приорететная поддержка
  • идеально подходит для студентов, у которых нет времени для решения заданий
Готовое решение
$0 / весь год.
  • Вы можите продать(исполнителем) или купить(заказчиком) готовое решение
  • Вам предоставят готовое решение
  • Будет предоставлено в минимальные сроки т.к. задание уже готовое
  • Вы получите базовую гарантию 8 дней
  • Вы можете заработать на материалах
  • подходит как для студентов так и для преподавателей
Я исполнитель
$0 / весь год.
  • Вы профессионал своего дела
  • У вас есть опыт и желание зарабатывать
  • Вы хотите помочь в решении задач или написании работ
  • Возможно примерение функции гаранта на сделку
  • подходит для опытных студентов так и для преподавателей

Комментарии


Оставить комментарий
Если у вас есть какое-либо предложение, идея, благодарность или комментарий, не стесняйтесь писать. Мы очень ценим отзывы и рады услышать ваше мнение.
To reply

Теория вероятностей. Математическая статистика и Стохастический анализ

Термины: Теория вероятностей. Математическая статистика и Стохастический анализ