Понятие, назначение дисперсионного анализа. Виды дисперсионного анализа. — КиберПедия 

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Понятие, назначение дисперсионного анализа. Виды дисперсионного анализа.

2018-01-04 130
Понятие, назначение дисперсионного анализа. Виды дисперсионного анализа. 0.00 из 5.00 0 оценок
Заказать работу

Дисперсионный анализ.

Пример использования однофакторного дисперсионного анализа

Пример 1.

Поставки продукции осуществляются тремя поставщиками («Мега+», «Коста» и «Трамп») в разное время: дневные часы, ночные смены и в пересменку. Контроль за качеством продукции в дневное время выше, чем в другое время. Собраны данные с оценками качества продукции (в баллах). Необходимо выяснить, есть ли отличие в качестве продукции, которая поставляется в разное время.

Т аблица 8.5 Таблица исходных данных

  Дневная смена Ночная смена Пересменка
«Мега+» 77,06 93,12 77,05
«Коста» 81,14 88,13 78,11
«Трамп» 82,02 81,18 79,91

 

Т аблица 8.6 Данные, подготовленные для анализа

Группы Объем группы Сумма Среднее Дисперсия
Дневная смена   240,2 80,07 7,003
Ночная смена   262,4 87,48 35,961
Пересменка   235,0 78,36 2,090
Всего        

 

Таблица 6.7 Однофакторный дисперсионный анализ

Источник вариации SS df MS F P-Значение F- критич.
Между группами 140,930688   70,4653444 4,69192377 0,05932788 5,143252
Внутри групп 90,1106   15,0184333      
Итого 231,041288          

Результаты расчета показывают, что , следовательно, существенное отличие в качестве поставляемой продукции в разное время отсутствует. Кроме того, достигнутое значение уровня значимости P-значение превышает 0,05, т.е. нулевая гипотеза на указанном уровне значимости не отвергается. Можно считать доказанным тот факт, что качество поставляемой продукции не зависит от времени поставки и является одинаковым в разное время.

Пример 2.

Требуется оценить влияние уровня рекламы внутри магазина на объемы продаж. Имеются следующие данные по 30 торговым точкам:

Таблица 8.8 Таблица исходных данных

  Уровень рекламы
высокий средний низкий
Продажи, тыс. грн
       
       
       
       
       
       
       
       
       
       

 

Таблица 8.9 Данные подготовленные для анализа

Группы по уровню рекламы Объем групп Сумма Среднее Дисперсия
высокий     8,3 1,789
средний     6,2 3,067
низкий     3,7 4,01

 

Таблица 8.10 Однофакторный дисперсионный анализ

Источник вариации SS df MS F P-Значение F критическое
Между группами 106,0666667   53,03333 17,94360902 1,10362E-05 3,354130829
Внутри групп 79,8   2,955556      
Итого 185,8666667          

 

Результаты анализа показывают, что разница в объемах продаж в магазинах с разным уровнем рекламы, является значимой (существенной). Об этом свидетельствует значение F: 17,943 > 3,354, а также малое значение достигнутого уровня значимости (р – значение = 1,10 Е-0,05).

Следовательно, нулевая гипотеза отклоняется и принимается альтернативная о том, что уровень рекламы влияет на объемы продаж, причем наблюдается прямая зависимость, т.е. более высокому уровню рекламы соответствуют более высокие объемы продаж.

Способы реализации однофакторного дисперсионного анализа с повторными измерениями

Данный вид дисперсионного анализа используется, когда разным градациям фактора соответствует одна и та же выборка (зависимые выборки). С другой стороны, эти выборки можно рассматривать как независимые и применить обычный вариант ANOVA, но ANOVA с повторными измерениями имеет преимущество – он позволяет исключить из общей дисперсии данных ту ее часть, которая обусловлена индивидуальными различиями в уровне зависимой переменной, т.е. из остаточной внутригрупповой изменчивости вычитается компонент, обусловленный индивидуальными различиями. Это позволяет данному варианту дисперсионного анализа быть более чувствительным к влиянию изучаемых факторов, за счет уменьшения дисперсии ошибки факторной модели.

Существует два типа моделей ANOVA с повторными измерениями:

1) Одномерная модель основана на предположении, что каждому уровню внутригруппового фактора соответствует повторное измерение одной и той же зависимой переменной (следовательно, эти изменения положительно коррелируют). Данный одномерный подход основан на применении F-отношений, но имеет определенные ограничения: дисперсии зависимой переменной для разных уровней внутригруппового фактора не различаются и корреляции между повторными измерениями есть и они положительны. Данное предположение проверяется с помощью теста сферичности ковариационно-дисперсионной матрицы Моучли.

2) Многомерная модель свободна от допущения о коррелированности измерений зависимой переменной (т.е. о сферичности). В этом случае применяется не F-критерий, а многомерные тесты, такие как «След Пиллая» (Pillai's Trace) и «λ-Вилкса» (Wilks' Lambda).

Условия применения

1. Генеральные совокупности, из которых извлечены выборки, должны быть нормально распределены.

2. Выборки должны быть независимыми.

3. Дисперсии генеральных совокупностей, из которых извлекались выборки, должны быть равными.

4. Группы должны иметь одинаковый объем выборки.

Пример использования двухфакторного дисперсионного анализа

Необходимо выяснить, оказывают ли влияние тип потребляемого бензина и тип автомобиля на расход топлива. Для этого будут использованы два типа бензина – обычный и высокооктановый, и для каждой группы будут использованы два типа автомобилей – с двумя ведущими колесами и с четырьмя. Для каждой группы будут использованы по два автомобиля, всего восемь.

Таблица 8.14 Пробег автомобиля в милях на галлон

Топливо Тип автомобиля
два колеса четыре колеса
Обычное 26,7 28,6
25,2 29,3
Высокооктановое 32,3 26,1
32,8 24,2

Алгоритм решения задачи:

1. Сформулировать гипотезы.

2. Найти критическое значение для каждого значения F -критерия при заданном α, например, α = 0,05.

3. Заполнить итоговую таблицу, чтобы получить фактические значения критерия.

4. Принять решение.

Формулировка гипотез.

- для взаимодействия типа топлива и типа автомобиля:

Н 0: Тип топлива и тип автомобиля не оказывают эффекта взаимодействия на потребление бензина.

Н 1: Тип топлива и тип автомобиля оказывают эффекта взаимодействия на потребление бензина.

- для типов топлива:

Н 0: Для двух типов топлива нет разницы между средним потреблением бензина.

Н 1: Для двух типов топлива существует разница между средним потреблением бензина.

- для типов автомобилей:

Н 0: Для автомобилей с двумя и четырьмя ведущими колесами нет разницы в среднем потреблении бензина.

Н 1: Для автомобилей с двумя и четырьмя ведущими колесами существует разница в среднем потреблении бензина.

Каждая независимая переменная, или фактор, имеет два уровня (принимает два значения).

Фактор А - тип топлива: обычное и высокооктановое, а = 2.

Фактор В - тип автомобиля: также имеет два значения, b = 2.

Число объектов в каждой группе, n = 2.

Степени свободы для каждого фактора:

- фактор А ;

- фактор В: ;

- взаимодействие (A × B): ;

- ошибка внутри группы: ;

Критические значения:

;

;

.

Если факторы имеют различное число градаций, критические значения будут различными.

Таблица 8.15 Результаты дисперсионного анализа

  Сумма квадратов Степени свободы Дисперсия
Топливо, А 3.92   3.92 4.752
Автомобиль, В 9.68   9.68 11.733
Взаимодействие А и В 54.08   54.08 65.552
Ошибка (внутри группы) 3.3   0.825  
Общая 70.98      

Поскольку , , что превышает критический уровень 7,71, нулевые гипотезы об отсутствии влияния эффекта взаимодействия и типа автомобиля отвергаются. Можно сделать вывод о том, что тип автомобиля и сочетание типа топлива и типа автомобиля оказывает существенное влияние на потребление топлива.

Анализ взаимодействия

Влияние каждого фактора называют основными или главными эффектами.

Если нет значимого эффекта взаимодействия, основные эффекты можно интерпретировать независимо друг от друга. Однако, если значимый эффект взаимодействия существует, надо более внимательно интерпретировать основные эффекты. Чтобы интерпретировать результаты двухфакторного дисперсионного анализа, можно использовать график, на который наносятся средние значения каждой группы.

Рассмотрим пример, рассматривающий влияние типа бензина и типа автомобиля на расход топлива. В таблице приведены средние значения пробега.

Таблица 8.16 Средний пробег автомобиля в милях на галлон топлива

Топливо Тип автомобиля
два колеса четыре колеса
Обычное 25.95 28,95
Высокооктановое 32.55 25.15

Рис. 8.8 Беспорядочное взаимодействие

На графике (рис 8.8) прямые, соединяющие соответствующие средние, пересекаются. В случае такого пересечения и при значительном эффекте взаимодействия, это взаимодействие называется беспорядочным. В случае беспорядочного взаимодействия не следует интерпретировать основные эффекты без учета эффекта взаимодействия.

Другой возможный тип взаимодействия – порядковое взаимодействие (рис.8.9). Если значение F-критерия для взаимодействия оказывается значимым и прямые не пересекаются, тогда взаимодействие называется порядковым, и основные эффекты можно интерпретировать отдельно друг от друга.

Рис.8.9 Порядковое взаимодействие

Наконец, когда нет значительного эффекта взаимодействия, прямые на графике будут параллельными или почти параллельными (рис.8.10). В подобной ситуации основные эффекты можно интерпретировать независимо друг от друга, поскольку не существует значимого взаимодействия. На рисунке приведен график двух переменных, когда эффект взаимодействия незначителен, прямые практически параллельны.

Рис.8.10 Отсутствие значимого взаимодействия

Многомерный ANOVA (MANOVA)

MANOVA применяется для изучения эффектов влияния факторов не на одну, а на несколько переменных (многомерную зависимую переменную). Таким образом, для каждого объекта имеются несколько зависимых переменных, которые подвергаются дисперсионному анализу. MANOVA позволяет проверить не только гипотезы о влиянии факторов на каждую зависимую переменную в отдельности, но и гипотезу о влиянии факторов на всю совокупность зависимых переменных, как на одну многомерную переменную.

Однако MANOVA может применяться как альтернатива ANOVA с повторными измерениями в случае, если не выполняется ее основное допущение о сферичности ковариационно-дисперсионной матрицы. Однако следует учитывать, что MANOVA является менее мощной, но более сложной процедурой, особенно для выборок небольшой численности.

Примеры задач, решаемых с использованием дисперсионного анализа

В задачах, которые решаются с использованием дисперсионного анализа, присутствует результативный признак числовой природы, на который воздействует одна или несколько переменных, имеющих номинальную природу. Например, несколько видов рационов откорма скота или два способа их содержания и т.п.

Пример 1. В течение недели в трех разных местах работало несколько аптечных киосков. В дальнейшем мы можем оставить только один. Необходимо определить, существует ли статистически значимое отличие между объемами реализации препаратов в киосках. Если да, мы выберем киоск с наибольшим среднесуточным объемом реализации. Если же разница объема реализации окажется статистически незначимой, то основанием для выбора киоска должны быть другие показатели.

Пример 2. Сравнение контрастов групповых средних. Семь политических пристрастий упорядочены от крайне либеральные до крайне консервативных, и линейный контраст используется для проверки того, есть ли отличная от нуля тенденция к возрастанию средних значений по группам - т. е. есть ли значимое линейное увеличение среднего возраста при рассмотрении групп, упорядоченных в направлении от либеральных до консервативных.

Пример 3. Двухфакторный дисперсионный анализ. На количество продаж товара, помимо размеров магазина, часто влияет расположение полок с товаром. Данный пример содержит показатели недельных продаж, характеризуемые четырьмя типами расположения полок и тремя размерами магазинов. Результаты анализа показывают, что оба фактора – расположение полок с товаром и размер магазина – влияют на количество продаж, однако их взаимодействие значимым не является.

Пример 4. Исследуется влияние на припек хлеба (превышение массы печёного хлеба по сравнению с массой употреблённой муки) всех возможных комбинаций трех жиров и трех рыхлителей теста. Необходимо выявить значимость взаимодействия жир-рыхлитель. После этого определить различные возможности выбора контрастов, позволяющих выяснить, какие именно комбинации уровней факторов различаются.

Пример 5. Одномерный анализ повторных измерений. Этот эксперимент проводился для определения влияния индивидуального рейтинга тревожности на сдачу экзамена в четырех последовательных попытках. Данные организованы так, чтобы их можно было рассматривать как группы подмножеств всего множества данных. Эффект тревожности оказался незначимым, а эффект попытки - значим.

 

Дисперсионный анализ.

Понятие, назначение дисперсионного анализа. Виды дисперсионного анализа.

Дисперсионный анализ – анализ изменчивости результативного признака под влиянием каких-либо контролируемых переменных факторов. (В зарубежной литературе именуется ANOVA – «Analisis of Variance»).

Результативный признак называют также зависимым признаком, а влияющие факторы – независимыми признаками.

Ограничение метода: независимые признаки могут измеряться по номинальной, порядковой или метрической шкале, зависимые – только по метрической. Для проведения дисперсионного анализа выделяют несколько градаций факторных признаков, а все элементы выборки группируют в соответствии с этими градациями.

Формулировка гипотез в дисперсионном анализе.

Нулевая гипотеза: «Средние величины результативного признака во всех условиях действия фактора (или градациях фактора) одинаковы».

Альтернативная гипотеза: «Средние величины результативного признака в разных условиях действия фактора различны».

Дисперсионный анализ можно подразделить на несколько категорий в зависимости:

от количества рассматриваемых независимых факторов;

от количества результативных переменных, подверженных действию факторов;

от характера, природы получения и наличия взаимосвязи сравниваемых выборок значений.

При наличии одного фактора, влияние которого исследуется, дисперсионный анализ именуется однофакторным, и распадается на две разновидности:

- Анализ несвязанных (то есть – различных) выборок. Например, одна группа респондентов решает задачу в условиях тишины, вторая – в шумной комнате. (В этом случае, к слову, нулевая гипотеза звучала бы так: «среднее время решения задач такого-то типа будет одинаково в тишине и в шумном помещении», то есть не зависит от фактора шума.)

- Анализ связанных выборок, то есть, двух замеров, проведенных на одной и той же группе респондентов в разных условиях. Тот же пример: в первый раз задача решалась в тишине, второй – сходная задача – в условиях шумовых помех. (На практике к подобным опытам следует подходить с осторожностью, поскольку в действие может вступить неучтенный фактор «научаемость», влияние которого исследователь рискует приписать изменению условий, а именно, - шуму.)

В случае если исследуется одновременное воздействие двух или более факторов, мы имеем дело с многофакторным дисперсионным анализом, который также можно подразделить по типу выборки.

Если же воздействию факторов подвержено несколько переменных, - речь идет о многомерном анализе. Проведение многомерного дисперсионного анализа предпочтительнее одномерного только в том случае, когда зависимые переменные не являются независимыми друг от друга и коррелируют между собой.

Обобщенно задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака выделить три частные вариативности:

- вариативность, обусловленную действием каждой из исследуемых независимых переменных (факторов).

- вариативность, обусловленную взаимодействием исследуемых независимых переменных.

- вариативность случайную, обусловленную всеми неучтенными обстоятельствами.

Для оценки вариативности, обусловленной действием исследуемых переменных и их взаимодействием вычисляется отношение соответствующего показателя вариативности и случайной вариативности. Показателем этого соотношения является F – критерий Фишера.

;

;

.

Чем в большей степени вариативность признака обусловлена действием влияющих факторов или их взаимодействием, тем выше эмпирические значения критерия .

В формулу расчета критерия входят оценки дисперсий, и, следовательно, этот метод относится к разряду параметрических.

Непараметрическим аналогом однофакторного дисперсионного анализа для независимых выборок является критерий Краскела-Уоллеса. Он подобен критерию Манна-Уитни для двух независимых выборок, за тем исключением, что он суммирует ранги для каждой из групп.

Кроме этого, в дисперсионном анализе может быть применен медианный критерий. При его использовании для каждой группы определяются число наблюдений, которые превышают медиану, вычисленную по всем группам, и число наблюдений, которые меньше медианы, после чего строится двумерная таблица сопряженности.

Критерий Фридмана является непараметрическим обобщением парного t-критерия для случая выборок с повторными измерениями, когда количество сравниваемых переменных больше двух.

В отличие от корреляционного анализа, в дисперсионном анализе исследователь исходит из предположения, что одни переменные выступают как влияющие (именуемые факторами или независимыми переменными), а другие (результативные признаки или зависимые переменные) – подвержены влиянию этих факторов. Хотя такое допущение и лежит в основе математических процедур расчета, оно, однако, требует осторожности при выводах о причине и следствии.

Например, если мы выдвигаем гипотезу о зависимости успешности работы должностного лица от фактора Н (социальной смелости по Кэттелу), то не исключено обратное: социальная смелость респондента как раз и может возникнуть (усилиться) вследствие успешности его работы – это с одной стороны. С другой: следует отдать себе отчет в том, как именно измерялась «успешность»? Если за ее основу взяты были не объективные характеристики (модные нынче «объемы продаж» и проч.), а экспертные оценки сослуживцев, то имеется вероятность того, что «успешность» может быть подменена поведенческими или личностными характеристиками (волевыми, коммуникативными, внешними проявлениями агрессивности etc.).


Поделиться с друзьями:

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьше­ния длины пробега и улучшения маневрирования ВС при...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.009 с.