Поскольку N всегда больше 0, то коэффициент сопряженности признаков никогда не достигает 1. Его величина находится в пределах от 0 до почти 1. — КиберПедия 

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

Поскольку N всегда больше 0, то коэффициент сопряженности признаков никогда не достигает 1. Его величина находится в пределах от 0 до почти 1.

2017-11-16 95
Поскольку N всегда больше 0, то коэффициент сопряженности признаков никогда не достигает 1. Его величина находится в пределах от 0 до почти 1. 0.00 из 5.00 0 оценок
Заказать работу

Данный критерий имеет значительный недостаток, поскольку его максимальное значение зависит от количества строк и столбцов, т.е. от размера таблицы. Максимальное его значение достигается при равном количестве строк и столбцов. Однако и величина максимального значения изменятся вместе с изменением числа категорий. Так, если таблица сопряженности имеет 3 строки и 3 столбца, то значение коэффициента не превысит 0,8; если по 5 строк и столбцов, то максимальное значение будет равно 0,89 и т.д.

Следовательно, данный критерий нельзя применять при сравнении таблиц разного размера, поскольку возникает сложность интерпретации, в итоге Р приходится рассматривать как численный индекс, а не как меру.

Критерий Крамера в отличие от предыдущего коэффициента изменяется от 0 до 1 независимо от размера таблицы. В статистике его обозначают К (по первой букве фамилии), в SPSS – называется «Cramer's V» / V Крамера, вычисляется данный критерий следующим образом:

 

V = K = ч2. N (k-1)  
 

 

где Х2 (ч2) – критерий Х2 Пирсона;

k – наименьшее из количества строк или столбцов;

N – общая сумма частот в таблице сопряженности.

 

Критерий Пирсона (φ) применяется не для всех номинальных признаков, а только для двух дихотомических, т.е. для таблиц размером 2х2. Он имеет название квадратный корень из среднего квадрата коэффициента сопряженности и определяется по формуле:

 

φ = ч2. n  
 

 

где Х2 (ч2) – критерий Х2 Пирсона; n – количество случаев.

 

φ – это показатель среднеквадратичной сопряженности. Значимость полученной величины может быть проверена при помощи критерия Х2 с 1 степенью свободы.

Коэффициент φ позволяет отразить степень двусторонней зависимости признаков. Таким образом, мы видим, что рассмотренные выше критерии вычисляются на основе Х2, следовательно, и их значимость равна значимости Х2.

Значения этих коэффициентов говорят не только о наличии связи, но и ее силе, тесноте, интенсивности. В статистике принята следующая интерпретация значений коэффициентов.

0,1–0,35 – слабая, незначительная связь;

0,35–0,5 – средняя связь;

Сильная связь.

Однако следует помнить, что на основе перечисленных выше симметричных коэффициентов нельзя говорить о направленности связи.

 

 

Направленные меры

Направленные меры, предназначение для отражения связанности номинальных признаков, определяются на основе так называемой концепции пропорционального сокращения ошибки. При определении этих коэффициентов одна переменная рассматривается как зависимая, поэтому они называются направленными мерами.

Лямбда Л. Гутмана (λ)

Коэффициент основан на модальном прогнозе. У него нет ограничений относительно размера ожидаемых частот, как у критерия Х2 Пирсона.

Этот коэффициент не может быть отрицательным и не может быть больше 1.

0 <λ< 1.

Коэффициент λ показывает вероятность, насколько улучшится предсказание одной переменной в ситуации знания значений другой переменной. Например, мы получили значение коэффициента λ, равное 0,1. Интерпретировать его следует так: значение одной переменной позволяет нам на 10 % лучше предсказать значения другой переменной.

Этот коэффициент имеет 3 значения: λа, λв, λсимм.

λа отражает предсказание строк по столбцам (столбцы – причина);

λв предсказание столбцов по строкам (переменная, отраженная в столбцах таблицы сопряженности, является зависимой); именно здесь и проявляется направленность связи;

λсимм среднее арифметическое; вычисляется, если зависимость строк от столбцов (и наоборот) не очевидна и ни одну из выбранных переменных нельзя считать зависимой.

В SPSS компьютер не знает, какую переменную считать зависимой, поэтому рассчитывает все значения λ (поочередно рассматривая переменные как зависимые).

У данного коэффициента λ есть существенный недостаток. Если для всех респондентов, например мужчин и женщин вотдельности, все модальные значения будут совпадать, то λ = 0, даже если зависимость между признаками будет существовать.

Следовательно, если λ а/в= 0, это не означает отсутствие связи, λ = 0 не говорит о статистической независимости признаков, а означает, что модальные значения частот по строкам лежат в одном столбце, или наоборот, т.е. предсказания одной переменной не меняются, если мы знаем другую. Существует иной коэффициент, не имеющий этого недостатка.

Тау Гудмена – Краскала (τ) или коэффициент Валлиса

Его расчет производится с учетом значений всех частот таблицы, а не только модальных. Этот коэффициент существует также в 3 экземплярах: τа, τв, τсимм. Он также отражает улучшение вероятности предсказаний по всей совокупности градаций:

0 < τ < 1.

В программе SPSS τ вычисляется одновременно с λ и интерпретируется аналогичным образом. Значения данного критерия являются более точными, поскольку рассчитываются с учетом всех частот.

Итак, в результате вычислений мы получаем несколько значений коэффициентов λ и τ. Кроме того, надо помнить, что эти коэффициенты имеют значимость, которую необходимо учитывать при их интерпретации. Таким образом, λ и τ показывают не зависимость признаков (ее наличие или отсутствие), а возможность на основе одних переменных предсказывать другие, причем оба коэффициента не имеют больших значений.

 


Поделиться с друзьями:

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Папиллярные узоры пальцев рук - маркер спортивных способностей: дерматоглифические признаки формируются на 3-5 месяце беременности, не изменяются в течение жизни...

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.013 с.