Оценка качества пробит- и логит-моделей — КиберПедия 

Состав сооружений: решетки и песколовки: Решетки – это первое устройство в схеме очистных сооружений. Они представляют...

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...

Оценка качества пробит- и логит-моделей

2017-11-28 1330
Оценка качества пробит- и логит-моделей 0.00 из 5.00 0 оценок
Заказать работу

3.3.1. Адекватность. Оценка качества регрессионных моделей с бинарной зависимой переменной осуществляется практически по той же схеме, что и качество обычной линейной регрессии: определяется пригодность модели в целом, затем определяется статистическая значимость каждого коэффициента модели и, наконец, проверяются гипотезы (если они имеют место), относительно ограничений, которым могут удовлетворять отдельные группы параметров.

Пригодность модели в целом (адекватность) определяется с помощью двух показателей. В качестве первого рассмотрим предложенный Макфадденом (McFadden) индекс отношения правдоподобия

, (3.53)

где – максимальное значение логарифмической функции правдоподобия, достигаемое в точке, координаты которой равны оценкам параметров модели , а – значение логарифмической функции правдоподобия, вычисленное в предположении, что . (Во многих пакетах предусмотрен расчет этих значений функции правдоподобия).

Интуиция подсказывает, что значения такого критерия должны быть заключены между 0 и 1. Действительно, в случае, когда все коэффициенты кроме , равны нулю, индекс отношения правдоподобия тоже равен нулю. Если же модель оказалась такой, что ее расчетные значения в точности совпадают с наблюдаемыми значениями , т.е. имеют место только случаи или , или , то индекс . О такой модели принято говорить, что она совершенно согласована. В остальных случаях значение заключено между 0 и 1, причем, чем больше совпадений между расчетными и фактическими значениями, тем ближе значение индекса к 1. К сожалению, случаи, когда значения индекса заключены между нулем и единицей, не имеют собственной интерпретации. Даже в случае, когда построенная модель идентична истинной функции распределения вероятностей она не является совершенно согласованной.

Второй критерий принято называть псевдо (pseudo) . Его расчет осуществляется по формуле

. (3.54)

Как и в случае индекса псевдо равен 0, когда все коэффициенты модели, кроме , равны нулю. Его значение приближается к 1 по мере того, как увеличивается разность между и , но самой 1 не достигает. Чем ближе к 1 значение псевдо , тем точнее модель воспроизводит фактические значения бинарной переменной.

 

3.3.2. Статистическая значимость коэффициентов. Проверка статистической значимости отдельных коэффициентов модели осуществляется с помощью статистики Вальда. Для вычисления ее значения необходимо иметь стандартные ошибки коэффициентов модели. Стандартные ошибки, как и в случае линейной регрессии, определяются по диагональным элементам ковариационной матрицы оценок . Но прежде, чем перейти к определению значимости, исследуем вопрос состоятельности и асимптотической нормальности этих оценок.

Известно, что решение любого из уравнений правдоподобия (3.1) или (3.2), даже если оно существует, не обязательно имеет хорошие асимптотические свойства. Желаемые состоятельность и асимптотическая нормальность обеспечены только в том случае, когда выполняются определенные условия, налагаемые на поведение объясняющих переменных в генеральной совокупности. Существуют два подхода к этой проблеме:

1) полагают, что объясняющие переменные являются стохастическими. Тогда налагаемые на них условия предстают в форме «все х i являются независимыми, одинаково распределенными случайными переменными, для которых существуют моменты достаточно высокого порядка»;

2) полагают, что объясняющие переменные фиксированы. В этом случае условия будут следующими:

§ для зависимой переменной существует асимптотическая матрица вариации-ковариации;

§ значения независимых переменных ограничены, то есть всегда найдутся такие константы m, M; m > -¥, M < ¥, что:

Если одно из этих условий выполнено, то при достаточно больших n оценка существует и сходится по вероятности к истинному значению b. Ковариационная матрица этой оценки равняется матрице, обратной к информационной матрице Фишера, которая представляет собой математическое ожидание Гессиана, взятое с обратным знаком

. (3.55)

Предполагается, что математическое ожидание здесь берется условно по х.

Таким образом, при выполнении выше сформулированных условий можно считать, что оценка вектора коэффициентов модели, полученная с помощью метода максимального правдоподобия, является асимптотически нормальной, т.е.

. (3.56)

Как нетрудно понять асимптотическая матрица ковариации зависит от неизвестного параметра b. Поэтому непосредственное использование ее в практических расчетах исключено. Рекомендации здесь те же самые, что и при использовании обычной регрессии – неизвестные параметры, присутствующие в матрице следует заменить соответствующими оценками. Руководствуясь этим общим правилом, можно записать

(3.57)

и использовать в практических расчетах не ковариационную матрицу, а ее оценку.

Рассмотрим детально, каким образом может быть получена оценка этой матрицы. Для этого вычислим матрицу вторых производных (Гессиан)

(3.58)

где F = F(x i b) и f = f(x i b).

Для получения информационной матрицы Фишера необходимо Гессиан умножить на минус единицу и взять математическое ожидание. Используя тот факт, что E(yi) = F (x i b), и, проведя несложные преобразования, получаем:

(3.59)

Соответственно асимптотическая матрица вариации-ковариации примет вид:

(3.60)

а ее оценка равна

(3.61)

Корни квадратные из диагональных элементов этой матрицы являются стандартными ошибками соответствующих оценок . Их используют для получения статистики Вальда

, . (3.62)

В случае логит-модели, для которой , матрица Фишера упрощается

(3.63)

Кроме того, матрицу Фишера можно представить в более компактной и более удобной для расчетов форме.

С этой целью обозначим через матрицу наблюдений за экзогенными переменными, дополненную столбцом из единиц и имеющую размер . По-прежнему будет обозначать -ую строку матрицы наблюдений. Далее через обозначим диагональную матрицу -го порядка, у которой -ый элемент диагонали имеет следующий вид:

. (3.64)

Тогда информационная матрица Фишера может быть записана следующим образом:

. (3.65)

Ковариационная матрица в этом случае равна

. (3.66)

Такая форма ковариационной матрицы напоминает обобщенную оценку наименьших квадратов.

3.3.3. Стандартные ошибки предсказанных вероятностей и предельных эффектов. Расчетные значения , получаемые с помощью оцененных пробит- и логит моделей, представляют собой вероятности того, что переменная примет значение 1 или 0. Возможные изменения этих вероятностей в зависимости от факторов оцениваются частными предельными эффектами

. (3.67)

Это именно те характеристики, которые подлежат интерпретации и практическому использованию. Чтобы иметь представление о надежности выводов полученных на основе результатов моделирования необходимо иметь оценки стандартных ошибок этих характеристик. Получить оценки стандартных ошибок можно с помощью дельта метода [63].

Для расчетной вероятности дельта-метод позволяет записать асимптотическую величину стандартной ошибки в виде

, (3.68)

где – асимптотическая ковариационная матрица оценки и производная вычислена в точке, компоненты которой совпадают с компонентами оценки .

Заметим, что доступность практического использования данной формулы гарантируется тем, что асимптотическую ковариационную матрицу в ней, следуя рекомендациям предыдущего параграфа, можно заменить оценкой

Чтобы сделать эту формулу более удобной для расчетов, проведем ее преобразование. С этой целью введем обозначение: . Тогда вектор производных может быть представлен следующим образом:

. (3.69)

Замена в (3.68) вектора производных на (3.69) позволяет записать выражение для стандартной ошибки расчетной вероятности в более компактной форме

. (3.70)

Стандартная ошибка зависит от вектора, по которому рассчитывалась вероятность.

Теперь перейдем к рассмотрению предельных эффектов. Для удобства введем обозначение . Тогда асимптотическая ковариационная матрица предельных эффектов может быть записана в виде:

. (3.71)

Для дальнейших преобразований матрицу производных представим в виде суммы

. (3.72)

В полученном выражении вычисление производной привело к единичной матрице, а вычисление – к вектор-строке .

Для пробит-модели, если учесть, что , (3.72) переписывается следующим образом:

. (3.73)

В случае логит-модели плотность вероятности может быть записана через функцию распределения как . Для краткости мы будем писать , полагая . Дифференцируя это выражение по , получаем

. (3.74)

Подставляя полученное выражение в (3.72), получаем стандартные ошибки предельных эффектов логит-модели

. (3.75)

Стандартные ошибки предельных эффектов, так же как и стандартные ошибки расчетных вероятностей зависят от вектора экзогенных переменных.

 

3.3.4. Тесты для проверки линейных гипотез. Описанные выше алгоритмы дают оценки, которые являются асимптотически нормальными при стремлении размера выборки к бесконечности. Асимптотическая нормальность оценок обеспечивает корректность проверки линейных гипотез относительно коэффициентов модели. Опорным элементом всех статистиках, используемых в этих тестах, является информационная матрица Фишера. Способ получения асимптотической оценки этой матрицы был рассмотрен выше. Поэтому в дальнейшем изложении предполагается, что матрица Фишера нам известна.

Во всех тестах проверяется нулевая гипотеза, формальная запись которой имеет следующий вид:

, (3.76)

где – вектор тестируемых параметров;

– матрица (размером ), задающая структуру ограничений,

– вектор (размером ) правой части ограничивающих условий.

Все ниже рассматриваемые тесты асимптотически эквивалентны и, следовательно, обеспечивают получение одних и тех же выводов. Поэтому выбор того или иного теста диктуется только конкретной ситуацией и удобством применения в ней.

Тест Вальда. В соответствии спредположением, лежащим в основе теста Вальда, вектор оценок при выполнении нулевой гипотезы должен быть близок к .

В силу асимптотической нормальности в тех случаях, когда имеет место нулевая гипотеза (), случайное отклонение нормально распределено, т.е.

, (3.77)

где – матрица вариации-ковариации , вычисляемая как обратная к информационной матрице Фишера.

Статистика Вальда в этом случае имеет вид

. (3.78)

В силу свойств нормального распределения статистика имеет распределение , и проверка нулевой гипотезы осуществляется по правилу

Рассмотрим пример, иллюстрирующий технику проверки предположений относительно коэффициентов модели с помощью теста Вальда. Пусть, например, методом максимального правдоподобия получен вектор оценок и требуется проверить предположение о том, что , а . В этом случае нулевая гипотеза записывается следующим образом:

Если проверяется статистическая значимость отдельного коэффициента модели, например , то, как нетрудно понять, нулевая гипотеза записывается в виде

,

и статистика Вальда после выполнения всех перемножений оказывается равной квадрату t–статистики

, (3.79)

где – соответствующий диагональный элемент матрицы .

Есть и другая схема вычисления статистики Вальда. Ее использование удобно в тех случаях, когда проверяется только статистическая значимость некоторых коэффициентов, т.е. проверяется гипотеза о равенстве их нулю.

Будем считать, что независимые переменные упорядочены таким образом, что проверка этой гипотезы касается первых коэффициентов. Для дальнейшего изложения этой схемы разделим вектор коэффициентов на две группы

,

где b 1q -мерный вектор, а b 2 включает (mq) элементов. В этом случае проверяется нуль-гипотеза вида

H0: { b 1 = 0 }. (3.80)

Проверке подвергаются оценки, полученные путем максимизации функции правдоподобия без каких-либо ограничений на оцениваемые коэффициенты модели. Полученные оценки, как отмечалось выше, состоятельны и асимптотически нормальны, т.е.

(3.81)

Обращая информационную матрицу, представленную в блочном виде, по частям, получаем для подвектора матрицу вариации-ковариации

(3.82)

Статистика Вальда в этом случае рассчитывается по формуле

, (3.83)

и нуль-гипотеза отвергается или нет по результатам сравнения с критическим значением .

Особенность теста Вальда в том, что в нем используются оценки, которые вычислены без учета ограничений, которые постулируются в нуль-гипотезе. Это безусловное достоинство теста, так как для его реализации не требуется проведения дополнительных расчетов.

Тест отношения правдоподобия. В отличие от процедуры Вальда, реализация этого теста требует расчетов, связанных с максимизацией функции правдоподобия без учета ограничений и с учетом ограничений на коэффициенты модели.

Вектор оценок с учетом ограничений имеет вид

(3.84)

где является результатом максимизации по b 2. Полученная таким образом оценка является состоятельной и асимптотически нормальной:

(3.85)

Используемая в тесте статистика основана на сравнении двух оценок максимального правдоподобия, полученных максимизацией ограниченной (с учетом ограничений) и неограниченной (без учета ограничений) функции правдоподобия, т.е.

. (3.86)

Статистика имеет распределение . Поэтому решение о том, отвергнуть или нет нулевую гипотезу, принимается аналогично тому, как это делалось в процедуре Вальда.

Тест множителей Лагранжа. Применение этого теста не вызывает затруднений в случае линейных регрессионных моделей. Там понятно, как определить множители Лагранжа и использовать их для расчета статистики. В случае бинарных моделей определение множителей Лагранжа не совсем простая процедура. Поэтому построение статистики основано на других принципах.

Если нулевая гипотеза верна, то две оценки неограниченная и ограниченная должны быть очень близки. Из близости оценок следует близость уравнений правдоподобия, решение которых позволило получить эти оценки.

Причем, неограниченная оценка получена как решение системы уравнений

 

(3.87)

 

 

а ограниченная – как решение той же самой системы, но с учетом ограничения

(3.88)

Обе системы уравнений представляют собой математические ожидания соответствующих уравнений правдоподобия. Взятие математического ожидания в данном случае эквивалентно замене каждой случайной величины ее ожидаемым значением или , соответственно. Причем, значения самих производных вычислены в точке .

Для рассматриваемого случая статистика множителей Лагранжа записывается следующим образом:

. (3.89)

Она является асимптотически эквивалентной статистике Вальда и статистике отношения правдоподобия и имеет распределение . Решение, отвергнуть нулевую гипотезу или нет, принимается по результатам сравнения с критическим значением , т.е. процедура сравнения проводится точно так же, как это описано в тесте Вальда.

Можно значительно упростить процедуру расчета статистики множителей Лагранжа, сведя ее к построению регрессионного уравнения. Правда, для этого необходимо провести ряд не совсем простых преобразований, которые приведут к упрощенной схеме. Начнем с того, что являясь частью матрицы, обратной информационной матрице Фишера, позволяет записать статистику множителей Лагранжа в эквивалентном виде

(3.90)

Теперь вставим индивидуальные наблюдения в уравнение правдоподобия, которое после этой операции будет записываться как сумма логарифмов

(3.91)

Если наблюдения не коррелированны между собой, то можно показать, что информационная матрица Фишера представима в виде произведения производных первого порядка. Первая производная равна

. (3.92)

Соответственно вторая производная может быть записана как

. (3.93)

Выполним операцию взятия математического ожидания путем замены на ()

.

В результате проведенного преобразования взаимно уничтожаются слагаемые, содержащие

.

Если в преобразованном выражении убрать оператор ожидания, т.е. в числителе снова вернуться к

то получаем выражение, отрицательное значение которого представимо в виде суммы произведений

=

. (3.94)

Возможность такого представления непосредственно следует из того, что и , а правильность проверяется непосредственным перемножением.

Таким образом, состоятельная оценка информационной матрицы Фишера может быть представлена в виде

. (3.95)

Используя полученную оценку информационной матрицы, запишем статистику множителей Лагранжа

. (3.96)

Упрощенный расчет этой статистики можно осуществить следующим образом. Обозначим через матрицу (размером n x q) из соответствующих значений частных производных первого порядка

(3.97)

и через е n -мерный вектор из единиц.

Тогда искусственная линейная регрессия

(3.98)

с вектором коэффициентов

(3.99)

может использоваться для расчета статистики . Коэффициенты такой регрессии легко рассчитываются с помощью любого статистического пакета, а значение статистики равно сумме расчетных значений этой регрессии.

 


Поделиться с друзьями:

Биохимия спиртового брожения: Основу технологии получения пива составляет спиртовое брожение, - при котором сахар превращается...

Адаптации растений и животных к жизни в горах: Большое значение для жизни организмов в горах имеют степень расчленения, крутизна и экспозиционные различия склонов...

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.01 с.