Процедура проверки статистических гипотез — КиберПедия 

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...

Процедура проверки статистических гипотез

2017-11-22 76
Процедура проверки статистических гипотез 0.00 из 5.00 0 оценок
Заказать работу

 

Проверка статистической гипотезы заключается в том, чтобы оценить, можно ли считать случайным расхождение между выдвинутой гипотезой и результатами выборочного наблюдения. Такая оценка всегда носит вероятностный характер. Если расхождение между эмпирическими и теоретическими значениями не выходит за пределы случайной ошибки, то можно считать, что с заданной вероятностью выдвинутая гипотеза не опровергается. При этом справедливость самой гипотезы не доказывается, а лишь делается вывод о том, можно ли ее считать допустимой или необходимо отвергнуть.

Пусть задана случайная выборка — последовательность m объектов из множества X. Предполагается, что на множестве X существует некоторая неизвестная вероятностная мера p.

Методика состоит в следующем.

1. Формулируется нулевая гипотеза Ho о распределении вероятностей на множестве X. Гипотеза формулируется исходя из требований прикладной задачи. Чаще всего рассматриваются две гипотезы — основная или нулевая Ho и альтернативная H1. Иногда альтернатива не формулируется в явном виде; тогда предполагается, что H1 означает «не Ho». Иногда рассматривается сразу несколько альтернатив. В статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей.

2. Задаётся некоторая статистика (функция выборки) , для которой в условиях справедливости гипотезы Ho выводится функция распределения F(T) и/или плотность распределения p(T). Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, которым должна удовлетворять «хорошая» статистика T. Вывод функции распределения F(T) при заданных Ho и T является строгой математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы для F(T); в статистических пакетах имеются готовые вычислительные процедуры.

3. Фиксируется уровень значимости — допустимая для данной задачи вероятность ошибки первого рода, то есть того, что гипотеза на самом деле верна, но будет отвергнута процедурой проверки. Это должно быть достаточно малое число.

4. На множестве допустимых значений статистики T выделяется критическое множество наименее вероятных значений статистики , такое, что . Вычисление границ критического множества как функции от уровня значимости является строгой математической задачей, которая в большинстве практических случаев имеет готовое простое решение.

5. Собственно статистический тест (статистический критерий) заключается в проверке условия:

o если , то делается вывод «данные противоречат нулевой гипотезе при уровне значимости ». Гипотеза отвергается.

o если , то делается вывод «данные не противоречат нулевой гипотезе при уровне значимости ». Гипотеза принимается.

Итак, статистический критерий определяется статистикой T и критическим множеством , которое зависит от уровня значимости .

 

 

Таблица сопряженности как метод представления совместного распределения (группировки) двух признаков.

 

Таблица сопряженности - средство представления совместного распределения двух переменных, предназначенное для исследования связи между ними. Таблица сопряженности является наиболее универсальным средством изучения статистических связей, так как в ней могут быть представлены переменные с любым уровнем измерения.

Строки таблицы сопряженности соответствуют значениям одной переменной, столбцы - значениям другой переменной (количественные шкалы предварительно должны быть сгруппированы в интервалы). На пересечении строки и столбца указывается частота совместного появления fij соответствующих значений двух признаков xi и yj. Сумма частот по строке fi называется маргинальной частотой строки; сумма частот по столбцу fj - маргинальной частотой столбца. Сумма маргинальных частот равна объему выборки n; их распределение представляет собой одномерное распределение переменной, образующей строки или столбцы таблицы.

В таблицах сопряженности могут быть представлены как абсолютные, так и относительные частоты (в долях или процентах). Относительные частоты могут рассчитываться по отношению:

  • к маргинальной частоте по строке
  • к маргинальной частоте по столбцу
  • к объему выборки

Таблицы сопряженности используются для проверки гипотезы о наличии связи между двумя признаками (Статистическая связь, Критерий "хи-квадрат"), а также для измерения тесноты связи (Коэффициент фи, Коэффициент контингенции, Коэффициент Крамера)

 


Поделиться с друзьями:

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.007 с.