Обработка таблиц сопряженности — КиберПедия 

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...

Индивидуальные очистные сооружения: К классу индивидуальных очистных сооружений относят сооружения, пропускная способность которых...

Обработка таблиц сопряженности

2022-10-29 263
Обработка таблиц сопряженности 0.00 из 5.00 0 оценок
Заказать работу

Если измерения признаков проводятся в номинальной шкале, то выявление факта взаимозависимости признаков проводится с помощью таблиц сопряженности и критерия χ2.

Допустим, что имеется два признака, измеряемых в номинальной шкале, и пусть первый признак может принимать М различных значений, а второй — К различных значений. Через N обозначим общее количество имеющихся наблюдений, а количество наблюдений (частоту) с одновременным появлением i -го значения первого признака и j -го значения второго признака обозначим как nij. Очевидно, что должно выполняться равенство  Частоты всех возможных пар значений рассматриваемых признаков принято записывать в виде следующей таблицы сопряженности:

Признак 1

Признак 2

1 2 ... K
1 n 11 n 12 ... n 1 K
2 n 21 n 22 ... n 2 K
... ... ... ... ...
M nM 1 nM 2 ... nMK

Анализ таблиц сопряженности может состоять в сравнении наблюдаемых частот с частотами, рассчитанными в соответствии с некоторыми предположениями (гипотезами) о характере зависимости между признаками или ожидаемыми частотами. Степень соответствия наблюдаемых частот ожидаемым можно определить с помощью критерия χ2. Проверочная статистика рассчитывается на основе разностей между наблюдаемыми и ожидаемыми частотами:  где — ожидаемая частота одновременного появления i -го значения первого признака и j -го значения второго признака. При справедливости сделанных предположений статистика  имеет распределение χ2 с  степенями свободы. Сделанные предположения отвергаются, если  где  — критическое значение, определяемое по таблице χ2-распределения. В противном случае, если  то предположения не отвергаются.

Пример. Пусть имеются результаты опроса тысячи покупателей прохладительных напитков. Каждого покупателя просили выбрать из двух типов прохладительных напитков («Фанта» и минеральная вода) один. Результаты опроса с разбивкой по возрастным группам были представлены в виде таблицы сопряженности.

Покупатели «Фанта» Минеральная вода Всего
Дети 254 124 378
Взрослые 167 130 297
Пенсионеры 123 202 325
Всего 544 456 1000

Было выдвинуто следующее предположение (гипотеза): предпочтение «Фанты» или минеральной воды не зависит от возраста опрашиваемого. Если бы это предположение было справедливо, то ожидаемые частоты в таблице сопряженности совпали бы с частотами, вычисленными в следующей таблице.

Покупатели «Фанта» Минеральная вода Всего
Дети 378 · 544/1 000 378 · 456/1 000 378
Взрослые 297 · 544/1 000 297 · 456/1 000 297
Пенсионеры 325 · 544/1 000 325 · 456/1 000 325
Всего 544 456 1 000

Для проверки выдвинутой гипотезы была рассчитана статистика  Число степеней свободы в этом случае ν = (2 – 1)(3 – 1) = 2. Соответствующее критическое значение при вероятности ошибки α = 0,05 (см. таблицу 2)  Поскольку  то выдвинутая гипотеза была отвергнута. В этом случае можно сделать вывод о наличии зависимости между возрастом покупателя и его предпочтением к «Фанте» или минеральной воде.

Задания для самостоятельного решения:

1. С помощью таблицы сопряженности ответьте на вопрос: являются ли конфликтные ситуации» фактором гипертонической болезни

Конфликтные ситуации на работе Больные гипертонией Здоровые Всего
Есть 28 7 35
Нет 17 38 55
Итого 45 45 90

 

2. Используя данные, представленные в таблице сопряженности, оцените взаимосвязь между смертностью населения различных расовых групп и местом их рождения.

Умерло человек за год в одной из европейских стран:

Раса Место рождения — Европа Место рождения — Африка Итого
Негры 1050 600 1650
Белые 750 1300 2050
Всего 1800 1900 3700

 

3. По мнению врачей, прием некоторого витамина как-то сказывается на профилактике простудных заболеваний. Проведен следующий эксперимент: 200 человек случайным образом разделены на две равные группы, одной группе дали витамин, другой – «пустышку», но всем 200 подопытным сказано, что им дали витамин. Результаты обследования приведены в таблице.

  Меньше простудных заболеваний Больше простудных заболеваний Без изменений
Контрольная группа 39 21 40
Группа, принимавшая витамин 51 20 29

 

Проверить на 5% уровне значимости гипотезу о независимости простудных заболеваний от приема витамина.

 

4. Следующая таблица показывает число сотрудников фирмы: мужчин и женщин высшим образованием и средним образованием. Содержимое некоторых ячеек неизвестно, но известно, что процент лиц с высшим образованием в общем числе сотрудников не зависит от пола сотрудника. Восстановите содержимое ячейки «мужчины со средним образованием»

  Мужчины Женщины Всего
Высшее образование   30 40
Среднее образование     60

 

5. Универмаг решил проанализировать сроки погажения кредита для различных категорий своих клиентов. Выборка, включающая 1200 платежей, дала следующие результаты.

Время Рабочие Священники Служащие
До 30 суток 380 220 120
От 30 до 90 суток 220 200 60

 

Есть ли существенная разница между отдельными категориями покупателей с точки зрения сроков погашения кредита?

6. Результаты опроса общественного мнения с точки зрения поддержки четырех кандидатов избирателями южных и северных районов некоторой страны таковы.

Районы

Кандидаты

1 2 3 4
Север 200 156 128 116
Юг 100 104 92 104

 

Имеется ли существенное различие в степени поддержки кандидатов избирателями каждого из регионов на 5% уровне значимости?

7. Комплектующие изделия одного наименования поступают с трех предприятий А, В и С. Результаты проверки изделий следующие:

Результаты проверки

Поставщики

А В С
Годные 29 38 53
Негодные 1 2 7

 

Можно ли считать, что качество изделий не зависит от поставщика? Принять .

8. Утверждается, что результат действия лекарства зависит от способа его применения. Проверить это утверждение при  по следующим данным:

Результат

Способ применения

А В С
Неблагоприятный 11 17 16
Благоприятный 20 23 19

 

9. Отношение зрителей к включению одной из телепередач в программу выразилось следующими данными:

Пол

Отношение

Положительное Безразличное Отрицательное
Мужчины 14 24 2
Женщины 29 36 15

 

Можно ли считать, что отношение к включению данной передачи в программу не зависит от пола зрителя?

10. Изменение производительности труда на предприятии при проведении мероприятий А, В и С выражается следующими данными:

Производительность

Мероприятие

А В С
Увеличилась 14 47 16
Не изменилась 22 37 7
Уменьшилась 20 25 2

 

Можно ли считать, что проведение этих мероприятий не влияет на производительность труда? Принять .

11. Ниже приводятся результаты опроса 100 студентов первых трех курсов на вопрос, считаете ли Вы, что курение мешает учебе?

Ответ

Курс

I II III
Нет 15 10 -
Не знаю 8 5 7
Да - 30 25

 

Подтверждают ли эти данные предположение о том, что отношение к курению студентов разных курсов различно? Принять .

12. Для определения зависимости цвета волос жителей от их местожительства были обследованы три группы людей из районов А, В и С. Свидетельствуют ли приводимые ниже результаты обследования о зависимости цвета волос жителей от их местожительства? Принять .

Район

Цвет волос

Рыжий Светлый Темный
А 2 9 9
В 3 6 21
С 15 15 20

13. Содержание никотина (в мг) для двух марок сигарет характеризуется следующими данными:

Марка А 24 26 25 22
Марка В 27 28 25 29

 

Указывают ли эти результаты на различие в содержании никотина в сигаретах этих марок? Принять .

14. Исследователь хочет сравнить выживаемость при различных типах шока по следующей таблице сопряженности при :

Тип шока

Исход

Выжили Умерли
Гиповолемический 7 8
Кардиогенный 11 11
Неврогенный 10 6
Септический 9 7
Эндокринный 3 5

 

15. С помощью критерия хи-квадрат оцените значимость связи признаков «завод» и «отрасль» с видом заболеваемости. Сделайте выводы.

 

Вид заболевания

Отрасль 1

Отрасль 2

Всего

Электросигнал Экран СЭТМ
Гипертония 83 102 53 238
Остеохондроз 60 108 34 202
Болезни желудочно-кишечного тракта 58 84 106 248
Итого 201 294 193 688

 

16. Найти выборочный коэффициент корреляции Кендэла и Спирмена  и проверить значимость полученного результата при .

Ранги

Студент

1 2 3 4 5 6 7 8 9
Оценки по математике 9 3 1 4 2 8 5 6 7
Оценки по истории 6 7 3 2 1 8 5 4 9

 

17. По данным об объеме строительно-монтажных работ, выполненных собственными силами, и численности работающих в 10 строительных компаниях одного из городов РФ, определить зависимость между этими признаками с помощью коэффициента Кендела и Спирмена.

 

№ строительной компании

Объем работ, тыс.руб.

 

Численность работающих, чел.

1 3998 66  
2 2821 71  
3 4121 73  
4 3583 59  
5 3646 52  
6 3008 50  
7 3973 61  
8 2973 70  
9 2911 38  
10 3114 54  

18. Экспертами оценивались вкусовые качества разных вин. Суммарные оценки получены следующие:

Марка вина Оценка, баллы Цена, усл.ед.
1 11 1,57
2 14 1,60
3 17 2,00
4 15 2,10
5 13 1,70
6 13 1,85
7 18 1,80
8 10 1,15
9 19 2,30
10 25 2,40

Определить зависимость между этими оценкой и ценой с помощью коэффициента Кендела и Спирмена.

19. На конкурсе красоты 12 участниц проранжированы по двум признакам: - артистизм, - красота. Найти выборочный коэффициент ранговой корреляции Спирмена и Кендела  и проверить значимость полученного результата при .

Ранг 3 11 4 10 1 8 9 2 12 6 7 5
Ранг 4 11 1 12 6 2 10 5 9 7 8 3

20. Рейтинг девяти банков был оценен тремя экспертами. С помощью коэффициента ранговой корреляции найти пары экспертов, оценки которых наиболее близко соответствуют друг другу. Оценить значимость различий в оценке рейтинга банков экспертами. Данные о рейтингах приведены в следующей таблице.

Эксперт

Номер банка

1 2 3 4 5 6 7 8 9
1 3 2 1 4 5 6 7 8 9
2 2 3 1 4 7 9 8 5 6
3 1 2 5 3 4 6 9 7 8

 

Контрольные вопросы и задания

1. Для чего проводится проверка значимости коэффициента корреляции?

2. Когда следует использовать ранговый коэффициент корреляции?

3. В каких случаях используется таблица сопряженности?

4. Что такое ранжирование?

5. В каких пределах изменяются ранговые коэффициенты корреляции?

6. Каковы свойства парного коэффициента корреляции?

7. Какие статистики используются для проверки значимости коэффициентов корреляции?

8. Опишите меры связи номинальных признаков в таблицах сопряженности.

9. Чем вызвана необходимость построения ранговых коэффициентов корреляции?

 

Список основной литературы

1. Красс, М.С. Математика для экономистов: Учеб. пособие / М. С. Красс, Б. П. Чупрынов. - СПб.: Питер, 2004. - 464 с.,с.344-421.

2. Доугерти, Кристофер. Введение в эконометрику: учеб. для экон. специальностей вузов: пер. с англ. / Кристофер Доугерти. _ М.: ИНФРА-М, 2010. – 464 с.  

3. Сборник задач по высшей математике для экономистов: учеб. пособие / Под ред. В.И. Ермакова. – 2-е изд., испр. – М.: ИНФРА-М, 2007. – 575 с., с.412-497.

4. Осипов, А.Л. Математика: учеб. пособие для дистанц. обучения и самост. работы / А. Л. Осипов, Е. А. Рапоцевич; СибАГС. - Новосибирск, 2005. - 276 с.- То же [Электронный ресурс]. – Доступ из Б-ки электрон. изданий / Сиб. ин-т упр. – филиал РАНХиГС. – Режим доступа: http://www.sapanet.ru, требуется авторизация (дата обращения: 19.03.2013). - Загл. c экрана.

5. Тюрин, Ю.Н. Анализ данных на компьютере: учеб. пособие /Ю.Н. Тюрин, А.А. Макаров. – М.: ФОРУМ, 2008. – 366 с.

6. Эконометрика: учеб. для вузов / [И.И. Елисеева и др.]; под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2007. – 575 с.

7. Кремер, Н.Ш. Эконометрика: учеб. для вузов / Н.Ш. Кремер, Б.А. Путко. – М.: ЮНИТИ, 2008. – 310 с.

8. Практикум по эконометрике: учебное пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2001. – 192 с.

 


Поделиться с друзьями:

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Индивидуальные очистные сооружения: К классу индивидуальных очистных сооружений относят сооружения, пропускная способность которых...

История развития пистолетов-пулеметов: Предпосылкой для возникновения пистолетов-пулеметов послужила давняя тенденция тяготения винтовок...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.047 с.