Дискретные и интервальные вариационные ряды — КиберПедия 

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Дискретные и интервальные вариационные ряды

2020-01-13 810
Дискретные и интервальные вариационные ряды 0.00 из 5.00 0 оценок
Заказать работу

Вариация может быть признана дискретной или непрерывной.

Признак называется дискретно-вариационным если его отдельные значения (варианты) отличны друг от друга на некоторую величину. Обычно целое число вариационного ряда называют таких признаков дискретным вариационным рядом.

Такие значения, прилагаемые тем или иным признакам, отличаются друг от друга на какую-то конечную величину.

Существует множество признаков значения которых отличаются друг от друга насколько угодно маленьких величин т.е. признак может принимать любые значения в некотором интервале, такие признаки называются непрерывно-вариационными.

Границы интервалов.

В интервалах вариационных рядов различают верх и низ границы интервалов:

Нижняя граница интервала  (min)

Верхняя граница интервала  (max),

Тогда длина интервала обозначается   или  и определяется по формуле:  =  (max) -  (min)

Формула Стэрджеса

· n - число единиц совокупности

· x (max), x (min) – наибольшее и наименьшее значение вариантов ряда

 

Интервалы дефектных изделий 9-12 13-15 16-18 19-21 22-24 25-27
Число станочников 3 14 5 2 1 1

Плотность вариационного ряда или плотность распределения

Одной из характеристик вариационного ряда является плотность распределения

Плотность распределения – это отношение частот (частостей) к величине интервала.

Плотность распределения показывает сколько единиц совокупности приходится на единицу вариации признака.

Различают абсолютную плотность распределения и относительную

·  – абсолютная

·  – относительная

Задача:

Проводится измерение деталей с точностью до 1 мм. Оказалось, что отклонения диаметра изготовленных деталей от заданного размера составили следующую выборку:

n = 20

0, -2, -4, 3, 0, 0, -1, 2, -2, -1, 0, -1, 3, 2, 0, -1, -2, 0, -1, 2

Построить вариационный и статистический ряды, полигон относительных частот и эмпирическую функцию распределения

Вариационный ряд Статистический ряд
Число дефектов -4 -2 -1 0 2 3
  1 3 5 6 3 2
-4 -2 -1 0 2 3
0,05 0,1 0,25 0,3 0,15 0,1

k=20

n=20

Построим полигон относительных частот

Для полученного статистического ряда вычислим эмпирическую функцию распределения.

0 при x<-4

1/20 при -4£ x<-2 (1/20)

4/20 при -2£ x<-1 (1/20 + 3/20)

9/20 при -1£ x<0 (4/20 + 5/20)

15/20 при 0£ x<2 (9/20 + 6/20)

18/20 при 2£ x<3 (15/20 + 3/20)

20/20 при 3£ x (18/20 + 2/20)

Кумулятивная функция

 


 

«Дисперсионный анализ»

Сущность метода дисперсионного анализа заключается в измерении отдельных дисперсий и дальнейшем определении доли(силы) влияния изучаемых факторов на результативный признак.
Дисперсионный анализ это статистический метод оценки связи между факторными и результативными признаками в различных группах, отобранных случайным образом и основанный на определении различий(разнообразия) значений признаков.
В основе дисперсионного анализа лежит анализ отклонений всех единиц исследуемой совокупности от среднего арифметического. В качестве меры отклонений берётся дисперсия(B) средний квадрат отклонений. Отклонение, вызываемое воздействием факторного признака(фактора) сравниваются с величиной отклонений, вызываемых случайными обстоятельствами. Если отклонение, вызываемое факторным признаком, более существенны, чем случайные отклонения, то считается, что фактор оказывает существенное влияние на результативный признак.
Дисперсионный анализ, в котором проверяется влияние одного фактора, называется однофакторным(одномерным) анализом. При изучении влияния более, чем одного фактора, используют многофакторный дисперсионный анализ(многомерный).
Факторные признаки - это те признаки, которые влияют на изучаемое явление.
Результативные признаки - это те признаки, которые изменяются под влиянием факторных признаков.
Для проведения дисперсионного анализа могут использоваться как качественные, так и количественные признаки.
Методы дисперсионного анализа:
1. Метод по Фишеру - критерий F большое. Метод применяется в однофакторном дисперсионном анализе, когда совокупная дисперсия всех наблюдаемых значений раскладывается на дисперсию внутри отдельных групп и дисперсию между группами.
2. Метод общей линейной модели. В его основе лежит корреляционный или регрессионный анализ, применяемый в многофакторном анализе.
Условия применения дисперсионного анализа
1. Задачей исследования является определение силы влияния одного(до трёх) фактора на результат или определения силы совместного влияния различных факторов.
2. Изучаемая факторов должны быть независимыми(не связанные между собой).
3. Подбор групп для исследования проводится рандомизированно(случайны отбор).
Организация дисперсионного комплекса с выполнением принципа случайности отбора вариантов называется рандомизацией.
4. Можно применять как количественные, так и качественные(атрибутивные) признаки.
При проведении однофакторного дисперсионного анализа рекомендуется применять условия:
1. Нормальность распределения анализируемых групп или в соответствии выборочных групп генеральным совокупностям с нормальным распределением.
2. Независимость(несвязанность) распределения наблюдения в группах
3. Наличие частоты(повторность наблюдений).
Принцип применения метода дисперсионного анализа:
1. Сначала формулируется нулевая гипотеза, то есть предполагается, что исследуемые факторы не оказывают никакого влияния на значение результативного признака и полученные различия случайны.
2. Затем определяют какова вероятность получить наблюдаемое(или более сильные различия при условии справедливости нуловей гипотезы).
3. Если эта вероятность мала, то мы отвергаем нулевую гипотезу и заключаем, что результаты исследования статистически значимы. Это не означает, что доказанное действие именно изучаемых факторов (это вопрос прежде всего планирования исследования), но всё же маловероятно, что результат обоснован случайностью. Максимальную приемлемую вероятность отвергнуть верную нулевую гипотезу называют уровнем значимости и обозначают альфа = 0,05. При выполнении всех условий применения дисперсионного анализа, разложение общей дисперсии математически выглядит следующим образом:
D общее = Dфактическое +Dостаточное
D общее - это общая дисперсия наблюдаемых значений(вариант). Характеризуется разбросом вариант от общего до среднего. Измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Общее разнообразие складывается из межгруппового и внутригруппового.
D фактическое - это факторная(межгрупповая) дисперсия. Характеризуется различием средних каждой группе и зависит от влияния исследуемого фактора, по которому дифференцируется каждая группа.
D остаточная - остаточная(внутригрупповая) дисперсия, которая характеризует рассеяние вариант внутри групп. Отражает случайную вариацию, то есть часть вариации, происходящую под влиянием неуточнённых факторов и независящую от признака - фактора, положенного в основании группировки. Вариация изучаемого признака зависит от силы влияния каких-то неучтённых случайных факторов, так и от организованных.
Поэтому общая вариация(дисперсия) слагается из вариаций, вызванной организованными(заданными факторами), называемыми факториальной вариацией и неорганизованными факторами, то есть остаточной вариацией(случайной или неизвестной).
Среди аналитических задач, решаемо статистикой, важнейшей является изучение связи. Если необходимо оценить разности между характеристиками нескольких групп используют дисперсионный анализ. Дисперсионный анализ применяется для сравнения условных математических ожиданий (или средних величин) признака-результата при условии того или иного значения одного или нескольких признаков факторов.

ДА подразделяются на однофакторные и многофакторные.

В простейшем случаи ДА является однофакторный анализ, в котором n единиц совокупности распределенного на m групп по значениям одного фактора.

Общая вариация SSE при этом подразделяется на часть, объясняющую различия между группами.

· группа А SSE – межгрупповая сумма квадратов отклонения;

· группа Б SSW – внутри групповая сумма квадратов отклонения.

 

Источник вариации df SS MS F Значимость F
Межгрупповая SSB

 
Внутригрупповая SSW  
Общая SSB+SSW      

 

· df – число степеней свободы;

· SS – суммы квадратов отклонения;

· MS – средняя сумма квадратов отклонения, приходящаяся на одну степень свободы;

· F – критерий.

В основе ДА лежит разделение дисперсии на компоненты.

Связь между общей дисперсией , средняя из внутригрупповой дисперсии  и межгрупповой дисперсией .

, где

 , ,

 

Если средняя по группам образует в соответствии со значениями фактора x отмечается в пределах случайных разностей, то межгрупповой средней свойств отклонений имеет след вид , внутригрупповое среднее квадратическое отклонение , будет одинаковым.

 это положение соответствует нулевой гипотезы

Правилом проверки H 0 выступает F -критерий

Необходимыми предположительными для корреального используют
F -критерий является корреальное распределение значений зависимой переменной в каждой группе равенство дисперсий в группах.

Задача:

Рассмотрим пример однофакторного дисперсионного анализа. Служба качества решает определить одинаково или надежны динамики мобильных телефонов разных производителей. Было взято пять телефонов из четырех выбранных фирм производитель.

Результаты испытаний представлены в таблице.

№ моб. телефона Фирма 1 Фирма 2 Фирма 3 Фирма 3
1 21,4 25,1 22,3 26,1
2 19,6 24,4 24,1 21,5
3 23,1 25,3 21,7 18,9
4 19,8 23,9 21,4 22,3
5 20,3 24,9 22,6 24,2
Итого 104,2 123,6 112,1 113,1
Сред. арифметическое 20,84 24,72 22,42 22,62

 

В этой задаче фирма производителя выступает в качества фактора (x) влияние которого на надежность динамиков мобильных телефонов (y) – проверяется.

Для построения таблицы ДА необходимо:

1. Определить выборочное среднее для каждой группы (последняя
строка табл.)

2. Определить среднее время для всех моб. телефонов.

Для этого просуммируем все 20 показателей и разделим сумму на общее количество наблюдений.

3. Вычислить суммы квадратов отклонений

Внутригрупповая сумма квадратов отклонений

Общая сумма квадратов отклонения

Межгрупповая сумма квадратов отклонений

Внутригрупповая сумма квадратов отклонений

F-критерий

При заданном уровне значимости и чисел степеней свободы межгрупповой и внутригрупповой числовой вариации, определить критическое значение F-критерия по таблице значений F-критерия Фишера.

В рассматриваемом примере числитель имеет три степени свободы.

Таким образом принимая уровень значимости 0,05 т.е. при вероятности ошибочного решения 5%. ; , верхнее критическое значение F-критерий = 3,24, вычисленное значение F статистическое = 4,64

F табличное = 3,24, следовательно различие между средними значениями времени работы динамиков мобильных телефонов статистически значимое то есть гипотеза H 0 – отклоняется

Проведенный дисперсионный анализ показал наличие статистически значимой связи. Эту связь можно измерить с помощью эмпирического корреляционного отклонения, которое рассматривается как отношение факторной дисперсии к общей дисперсии результативного признака степени .

Эмпирическое корреляционное отклонение

Этот показатель принимает значение в интервале от 0 до 1, чем ближе h к единице, тем связь сильнее и наоборот, следовательно между надежностью динамиков моб. Телефонов и фирмой производителя существует тесная связь.

Для заключения о тесноте связи можно пользоваться следующей рекомендацией:

Значение эмпирической корреляции отношение – теснота связи может быть следующей: слабое (0,3 и меньше); среднее (0,3-0,05); умеренно-среднее (0,5-0,7); тесное (0,7 и более).

Для решения конкретных задач предполагается отдается , которые называются коэффициентом детерминации. Этот показатель отражает долю межгрупповой колеблемости в общей, выражается в %

 

 

Корреляционный анализ


Поделиться с друзьями:

Кормораздатчик мобильный электрифицированный: схема и процесс работы устройства...

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.039 с.