Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. — КиберПедия 

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...

Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал.

2017-10-11 2788
Тема 3. Дисперсия. Стандартное отклонение. Стандартная ошибка среднего. Доверительный интервал. 4.75 из 5.00 4 оценки
Заказать работу

Дисперсия(variance), - мера рассеяния, полученная суммированием квадратов индивидуальных отклонений с последующим делением суммы на объем совокупности.

Дисперсия генеральной совокупности обозначается σ2 (выборочной s2) и вычисляется по формуле:

σ2= .

Стандартное отклонение (standard deviation,) отражает изменчивость (разброс, вариацию) значений переменной и оценивает степень их отличия от среднего Стандартное (среднее квадратическое) отклонение - мера рассеяния равная корню квадратному из дисперсии. Оно рассчитывается на основании вычисленного показателя рассеяния данных, называемого дисперсией (variance), путем извлечения из него квадратного корня, в связи с чем в отечественной литературе его также называют «среднеквадратичным отклонением». Стандартное отклонение генеральной совокупности обозначается символом σ (сигма), а SD выборочной совокупности(s) и вычисляется по формуле:

 

Стандартное отклонение может меняться непредсказуемо, т.е. расти или уменьшаться с увеличением размера выборки, однако обычно не слишком сильно. В статистике есть понятие «правила трех сигма». Оно гласит, что практически все наблюдения укладываются в интервал «среднее ± 3σ». Действительно, в интервал «± 3σ» попадают 99,7% наблюдений, ± 2σ включает 95,4%, а ± 1σ – всего 68,3% всех наблюдений. Это правило подходит для расширенны рукописный вариант различных распределений, включая нормальное.

Стандартная ошибка (среднего) (англ. standard error, SE, иногда standard error mean, SEM) является оценкой возможного отличия между значением среднего в анализируемой выборке, и истинным средним для всей популяции (которое на самом деле не может быть определено без анализа бесконечно большого числа наблюдений). Стандартная ошибка рассчитывается путем деления стандартного отклонения на квадратный корень из числа наблюдений в выборке и, следовательно, ее значение уменьшается с ростом размера выборки. Формула; γ ═ .Это уменьшение является естественным, поскольку чем больше имеется наблюдений, тем больше вероятность, что рассчитанное среднее приближается к истинному.

Доверительный интервал (англ. confidence interval, CI) – диапазон значений, область, в которой с определенным уровнем надежности (или доверия) содержится истинное значение параметра (например, среднего). 90%-ный доверительный интервал означает, что истинное значение величины попадет в рассчитанный интервал с вероятностью 90%. В биомедицинских исследованиях доверительный интервал среднего обычно устанавливается на уровне 95% и определяется как ±1,96 стандартной ошибки (коэффициент 1,96 вытекает из предположения о нормальности распределения значения переменной при условии, что выборка достаточно велика). Для примера, если значение среднего систолического давления в исследованной группе составляет 125 мм рт.ст., а стандартная ошибка 5 мм рт.ст., то при 95% доверительном интервале границы диапазона значений среднего будут 115,2 и 134,8 мм рт.ст. (что составляет ± 9,8 (5 х 1,96) мм рт.ст. в обе стороны от значения среднего).

 

 

ЗАДАЧА-ЭТАЛОН

Х1          
m1          

= ∑m= n=19

 

Х = = = ; Х=21,3

 

Чтобы определить рассеянность значений количественного признака (х) генеральной совокупности вокруг своего среднего значения вводят характеристику генеральная дисперсия.

1. Генеральная дисперсия Дr

Дr =

2. Для характеристики количественного признака вокруг выборки, вокруг своего среднего значения выводят характеристику выборочная дисперсия Дb

Дb= Хb=21,3

 

Дb= = Дb=0,55

Среднее квадратическое отклонение – которое характеризует разнообразие признака.

σ - среднее квадратическое отклонение

σr =√ Дr (генеральные среднее квадратическое)

σb =√ Дb (выборочние среднее квадратическое откланение.

Выборочные среднее квадратическое отклонение равно

σb =

Доверительный интервал ошибки статистического наблюдения.

Доверительная вероятность – вероятность с которой эта оценка покроет неизвестный параметр.

Доверительная вероятность – γ

Часто (γ) равно 0,9; 0,95; 0,99; 0,999

Продолжение задачи

γ ═

t –по таблице = 2,10

Доверительный интервал:

21,3- 0,36= 21,60

21,3+ 0,36= 20,94

Тема 4. Интервальный статистический дискретный ряд распределения. Числовые характеристики интервального статистического ряда. Гистограмма.

Для признака,имеющего непрерывное изменение строится интервальный дискретный ряд Для проведения группировки сначала выбирается группировочный признак — признак, по которому проводится разбивка единиц совокупности на отдельные группы. Затем определяют количество групп, на которые надо разбить исследуемую совокупность. Для количественного признака можно использовать формулу Стерджесса: К = l + 3,322 ´lg N,

где К — число групп; N — число единиц совокупности.

После определения числа групп следует определить интервалы группировки. Интервал — это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину (h), верхнюю и нижнюю границы или хотя бы одну из них. Величина равного интервала определяется по следующей формуле: h = (Xmax – Xmin) / n

Полученную величину округляют. Она является шагом интервала.

 

Объём выборки, n Число интервалов, k  
25-40 40-60 60-100 100-200 Более 200 5-6 6-8 7-10 8-10 10-15  

 

; Ширина

Интервальный статистический ряд можно изобразить графически. Для этого по оси абсцисс откладывают интервалы значений признака и на каждом из них, как на основании, строят прямоугольник с высотой, равной относительной частоте. Полученная столбцовая диаграмма называется гистограммой. Гистограмма – совокупность прилегающих друг к другу прямоугольников..

График 1. Гистограмма

 


Поделиться с друзьями:

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.016 с.