Глава 11. Дисперсионный анализ — КиберПедия 

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Состав сооружений: решетки и песколовки: Решетки – это первое устройство в схеме очистных сооружений. Они представляют...

Глава 11. Дисперсионный анализ

2020-10-20 106
Глава 11. Дисперсионный анализ 0.00 из 5.00 0 оценок
Заказать работу

Дисперсионный анализ предназначен для проверки зависимости нормально распределенной случайной величины Y, называемой результативным признаком, от нескольких величин — факторных признаков, или факторов. При этом, среди факторов могут быть как случайные, так и неслучайные величины, измеряемые в любой из шкал: интервальной, порядковой или номинальной.

Модели дисперсионного анализа классифицируются в зависимости от числа факторов на однофакторные, двухфакторные и т. д. комплексы.

По природе факторов модели подразделяются на детерминированные (Ml), случайные (М2) и смешанные в зависимости от того, являются ли уровни факторных признаков фиксированными, случайными или теми и другими.

Однофакторный комплекс

Пусть требуется проверить влияние на результативный признак одного контролирующего фактора А, имеющего m уровней , j = 1,2,...,m. Под уровнем фактора понимается некоторая его мера или состояние. Наблюдаемые значения результативного признака Y на каждом из уровней  обозначим через , где i= 1,2,...,  — число наблюдений Y на уровне . Наблюдаемые значения результативного признака обычно представляются в виде таблицы наблюдений:

.

Однофакторная дисперсионная модель имеет вид:

,

где  – наблюдаемое значение результативного признака, полученного на j-м уровне фактора с i-м порядковым номером;  – генеральная средняя комплекса;  – эффект, обусловленный влиянием j-го уровня фактора:

· для модели М1 (фактор имеет фиксированные уровни)  – фиксированные величины, удовлетворяющие условию ;

· для модели М2 (фактор имеет случайные уровни)  – случайные величины, удовлетворяющие условиям:

;

 для ;

 для любых i, j;

 – факторная дисперсия;

 – случайные величины (остатки), отражающие влияние на Y всех неконтролируемых факторов, т. е. вариацией переменной внутри отдельного уровня, удовлетворяющие следующим условиям:

;

 для  или ;

 – остаточная дисперсия.

Введем обозначения:

 – групповое среднее (средние уровня );

 – общая средняя комплекса, где ;

 – факторная сумма квадратов отклонений (сумма квадратов отклонений групповых средних от общей средней);

 – остаточная сумма квадратов отклонений (сумма квадратов отклонений наблюдений от групповых средних);

 – общая сумма квадратов отклонений.

После ряда преобразований можно получить следующее основное тождество дисперсионного анализа о разбиении величины  на слагаемые:

,                                        (2.72)

которая показывает, что общая вариация результативного признака складывается из двух компонентов: , характеризующей изменчивость, обусловленную различиями между уровнями фактора, и , характеризующей одинаковую для всех уровней вариацию под воздействием неучтенных факторов.

При доказательстве разложения общей суммы квадратов (2.72) исходят из очевидного тождества . Далее обе части тождества возводятся в квадрат и производится суммирование по индексам i и j:

.

В правой части полученного равенства третье слагаемое равно нулю:

.

В дисперсионном анализе анализируются не сами суммы квадратов отклонений, а средние квадраты, которые получаются делением суммы квадратов отклонений на соответствующее число степеней свободы Число степеней свободы в общем случае равно числу независимых наблюдений, уменьшенному на число параметров, оцениваемых по этим наблюдениям при вычислении статистики.

Таблица 2.6.

Таблица однофакторного дисперсионного анализа

 

Основная гипотеза дисперсионного анализа состоит в утверждении, что уровни фактора А не влияют на изменение результативного признака Y. В случае модели М1 основная гипотеза формулируется в виде: , j=1,2,…,m, в случае модели М2: .

Для проверки нулевой гипотезы вычисляется:

.                                                                 (2.73)

Если , где  находится по таблицам F-распределения для уровня значимости , числа степеней свободы числителя  и числа степеней свободы знаменателя , то гипотеза не отвергается. Из этого следует, что влияние фактора А на результативный признак не доказано.

Если , то гипотеза отвергается с вероятностью ошибки, равной : фактор А существенно (значимо) влияет на результативный признак Y.

В случае отклонения гипотезы о несущественности влияния фактора А на результативный признак Y переходят к проверке гипотез о равенстве двух средних отдельных уровней, формируемых в виде: . При проверке используется статистика:

,                                               (2.74)

которая при истинности гипотезы  имеет распределение Стьюдента с числом степеней свободы . Гипотеза отвергается при выполнении неравенства

Для проверки гипотезы можно также использовать статистику  с числом степеней свободы числителя  и знаменателя .

Несмещенной точечной оценкой является:

· для остаточной дисперсии :

;                                                     (2.75)

· для факторной дисперсии :

.                                          (2.76)

Оценку  находят только при рассмотрении модели М2 в случае отклонения гипотезы

Интервальная оценка для  с надежностью  задается неравенством:

,                                        (2.77)

где х2 находится по таблицам х2-распределения для заданной доверительной вероятности и числа степеней свободы.

При проверке гипотезы о значении генеральной средней комплекса, формулируемой в виде , используются статистики:

· для модели М1:

,                                                                       (2.78)

которая при истинности гипотезы  имеет F-распределение с числом степеней свободы числителя  и знаменателя .

· для модели М2 (при nj=n):

,                                                                       (2.79)

которая при истинности гипотезы  имеет F-распределение с числом степеней свободы числителя  и знаменателя .

Если , то гипотеза отвергается с вероятностью, равной .

Пример 11.1. В процессе изучения влияния типа станка на сменную выработку рабочего получены следующие данные:

Предполагая, что фактор типа имеет фиксированные уровни, а сменная выработка рабочего есть случайная величина, имеющая нормальный закон распределения, требуется:

а) проверить на уровне значимости  существенность влияния типа станка на сменную выработку рабочего;

б) проверить на уровне значимости  гипотезу об общей средней

Решение.

А. Проверка существенности влияния типа станка на сменную выработку рабочего заключается в проверке основной гипотезы дисперсионного анализа, состоящей в утверждении, что уровни факторного признака на влияют на изменение результативного признака. В случае модели М1 (фактор имеет фиксированные уровни) основная гипотеза формулируется в виде , j=1,2,…,m. Для проверки  рассчитаем , где m – количество уровней факторного признака (количества осадков, а N – общее количество наблюдений.

Факторная и остаточная суммы квадратов отклонений определяются по формулам:

, ,

где ; .

В результате  По таблицам F-распределения найдем критическое значение F-статистики для уровня значимости , числа степеней свободы числителя  и числа степеней свободы знаменателя :

Так как наблюдаемое значение F-статистики превосходит ее критическое значение, то гипотеза о несущественности влияния фактора на изменение результативного признака отвергается с вероятностью ошибки, равной 0,05. Следовательно, можно считать, что изменение типа существенно влияет на сменную выработку рабочего.

Б. Поскольку по условию фактор типа станка имеет фиксированные уровни, то для проверки гипотезы относительно общей средней  используется статистика:

.

Воспользовавшись результатами пункта а) для , получим:

По таблицам F-распределения найдем критическое значение F-статистики для уровня значимости , числа степеней свободы числителя  и знаменателя :

Так как наблюдаемое значение F-статистики не превосходит ее критическое значение, то гипотеза о равенстве общей средней  не отвергается с вероятностью ошибки, равной 0,01.

Пример 11.2. В процессе изучения влияния количества осадков за год на урожайность пшеницы (ц/га) получены следующие данные:

 

Предполагая, что фактор количества осадков имеет случайные уровни, а урожайность пшеницы есть случайная величина, имеющая нормальный закон распределения, требуется:

а) проверить на уровне значимости  существенность влияния количества осадков на урожайность пшеницы;

б) выяснить при , оказывает ли существенное влияние на урожайность пшеницы изменение осадков в диапазоне 270-290 мм;

в) найти значение несмещенной оценки ;

г) с надежностью  найти границы интервальной оценки для остаточной дисперсии .

Решение.

А. Проверка существенности влияния количества осадков на урожайность пшеницы заключается в проверке основной гипотезы дисперсионного анализа, состоящей в утверждении, что уровни факторного признака не влияют на изменение результативного признака. В случае модели М2 (фактор имеет случайные уровни) основная гипотеза формулируется в виде , где  – факторная дисперсия. Для проверки  рассчитаем , где m – количество уровней факторного признака (количества осадков), а N – общее количество наблюдений.

Факторная и остаточная суммы квадратов отклонений определяются по формулам:

, ,

где ; .

Для этого рассчитаем необходимые показатели по таблице:

 

 

В результате  По таблицам F-распределения найдем критическое значение F-статистики для уровня значимости для уровня значимости , числа степеней свободы числителя  и числа степеней свободы знаменателя :

Так как наблюдаемое значение F-статистики превосходит ее критическое значение, то гипотеза о несущественности влияния фактора на изменение результативного признака отвергается с вероятностью ошибки, равной 0,05. Следовательно, можно считать, что изменение количества осадков существенно влияет на урожайность пшеницы.

Б. В пункте А была доказана существенность влияния изменений количества осадков на урожайность пшеницы. Выясним, оказывает ли существенное влияние на урожайность пшеницы изменение осадков в диапазоне 270-290 мм., т. е. проверим гипотезу , где  – средние третьего и четвертого уровней факторного признака.

Для проверки гипотезы  используют статистику:

,

где  – средняя уровня ;  – средняя уровня ; ,  – количество наблюдений на соответствующих уровнях;  – остаточная сумма квадратов отклонений.

Воспользовавшись результатами расчетов пункта а), получим:

По таблицам t-распределения найдем критическое значение t-статистики для уровня значимости , числа степеней свободы

Так как наблюдаемое значение t-статистики не превосходит ее критическое значение, то гипотеза о равенстве двух средних выбранных уровней не отвергается с вероятностью ошибки, равной 0,05. Следовательно, можно считать, что изменение количества осадков в диапазоне 270-190 мм. не оказывает существенного влияния на урожайность пшеницы.

В. Поскольку ранее гипотеза  была отвергнута с вероятностью ошибки, равной 0,05, найдем несмещенную оценку факторной дисперсии  по формуле:

Найдем сумму квадратов числа наблюдений на каждом уровне фактора (количества осадков) – . Воспользовавшись результатами расчетов пункта а), получим:

Г. Интервальная оценка дл  с надежностью  задается неравенством:

.

Для  по таблицам х2-распределения, находим:

Воспользовавшись результатами расчетов пункта а), получим:

;

 


Поделиться с друзьями:

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьше­ния длины пробега и улучшения маневрирования ВС при...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.067 с.