Понятие уровня статистической значимости — КиберПедия 

Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Понятие уровня статистической значимости

2017-11-27 305
Понятие уровня статистической значимости 0.00 из 5.00 0 оценок
Заказать работу

При обосновании статистического вывода следует решить вопрос, где же проходит линия между принятием и отвержением нулевой гипотезы? В силу наличия в эксперименте случайных влияний эта граница не может быть проведена абсолютно точно. Она базируется на понятии уровня значимости.

Уровнем значимости называется вероятность ошибочного отклонения нулевой гипотезы. Или, иными словами, уровень значимости это вероятность ошибки первого рода при принятии решения. Для обозначения этой вероятности, как правило, употребляют либо греческую букву α, либо латинскую букву Р. В дальнейшем мы будем употреблять букву Р.

Исторически сложилось так, что в прикладных науках, использующих статистику, и в частности в психологии, считается, что низшим уровнем статистической значимости является уровень Р = 0,05; достаточным — уровень Р =0,01 и высшим уровень Р = 0,001. Поэтому в статистических таблицах, которые приводятся в приложении к учебникам по статистике, обычно даются табличные значения для уровней Р = 0,05, Р = 0,01 и Р = 0,001. Иногда даются табличные значения для уровней Р = 0,025 и Р = 0,005.

Величины 0,05, 0,01 и 0,001 — это так называемые стандартные уровни статистической значимости. При статистическом анализе экспериментальных данных психолог в зависимости от задач и гипотез исследования должен выбрать необходимый уровень значимости. Как видим, здесь наибольшая величина, или нижняя граница уровня статистической значимости, равняется 0,05 — это означает, что допускается пять ошибок в выборке из ста элементов (случаев, испытуемых) или одна ошибка из двадцати элементов (случаев, испытуемых). Считается, что ни шесть, ни семь, ни большее количество раз из ста мы ошибиться не можем. Цена таких ошибок будет слишком велика.

Заметим, что в современных статистических пакетах на ЭВМ используются не стандартные уровни значимости, а уровни, подсчитываемые непосредственно в процессе работы с соответствующим статистическим методом. Эти уровни, обозначаемые буквой Р, могут иметь различное числовое выражение в интервале от 0 до 1, например, Р = 0,7, Р = 0,23 или Р = 0,012. Понятно, что в первых двух случаях полученные уровни значимости слишком велики и говорить о том, что результат значим нельзя. В то же время в последнем случае результаты значимы на уровне 12 тысячных. Это достоверный уровень.

Рассмотрим соотношение ошибок I и II рода. Предположим, как и прошлых примерах, проверяется гипотеза об отличии среднего значения некоторой величины А. Нулевой гипотезе Но: М = А соответствует известное теоретическое распределение со средним А. Предположим также, что в генеральной совокупности на самом деле среднее значение больше А и равно В, а. исследователь, как обычно, об этом даже и не догадывается. Этому положению дел будет соответствовать свое, «альтернативное» теоретическое распределение, сходное с распределением для Но, но со средним В (рис. 7.3). На рис. 7.3 видно, что с уменьшением «растет «доверительная вероятностость», которая определяет величину отклонения выборочного среднего от А да принятия Но: уменьшая а, исследователь увеличивает возможное отклонение выборочного среднего от А, при котором принимается Но. Принятие I при больших отклонениях выборочного среднего от А увеличивает вероятное ошибки II рода, (3, вероятность того, что на самом деле верна альтернативная гипотеза. Таким образом, снижение величины а увеличивает риск допустил ошибку II рода — не обнаружить различия или связи, которые на самом деле существуют.

Вероятность (1 - β) называется мощностью (чувствительностью) критерия. Эта величина характеризует статистический критерий с точки зрения его способности отклонять Но, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестным.

Величина (1 — α) характеризует степень доверия к результатам статистической проверки и называется доверительной вероятностью.

Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины а, удовлетворяющее двум противоречивым требованиям. Величина α должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Но. Величина а должна быть достаточно велика, чтобы отклонить Но при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина а является приемлемой, не имеет однозначного ответа. Есть лишь общие соображения, которыми можно руководствоваться при назначении а для статистического вывода:

o Для установленного значения а вероятность ошибки β уменьшается с ростом объема выборки.

o Вероятность ошибки β уменьшается при увеличении значения α (например, с 0,01 до 0,05).

 

А В М

Рис. 7.3. Соотношение вероятностей ошибок I и II рода

Вопрос о величине α — вопрос о том, при каком же βуровне исследователь может отклонить Но, решается преимущественно исходя из неформальных соглашений, принятых на основе практического опыта в различных областях исследования. Традиционная интерпретация различных уровней значимости исходит из α = 0,05 и приведена в табл. 7.1. В соответствии с ней приемлемым для отклонения Но признается уровень α < 0,05. Такая относительно высокая вероятность ошибки I рода может быть рекомендована для небольших выборок (когда высока вероятность ошибки II рода). Если объемы выборок около 100 и более объектов, то порог отклонения Но целесообразно снизить до α = 0,01 и принимать решение о наличии связи (различий) при р < 0,01.

Правило принятия статистического вывода таково: на основании полученных экспериментальных данных психолог подсчитывает по выбранному им статистическому методу так называемую эмпирическую статистику, или эмпирическое значение. Эту величину удобно обозначить как Чэмп. Затем эмпирическая статистика Чэмп сравнивается с двумя критическими величинами, которые соответствуют уровням значимости в 5% и в 1% для выбранного статистического метода и которые обозначаются как Чкр. Величины Чкр находятся для данного статистического метода по соответствующим таблицам, приведенным в приложении к любому учебнику по статистике. Эти величины, как правило, всегда различны и их в дальнейшем для удобства можно назвать как Чкр1 и Чкр2. Найденные по таблицам величины критических значений Чкр1 и Чкр2 удобно представлять в следующей стандартной форме записи:

Подчеркнем, однако, что мы использовали обозначения Чэмп и Чкр как сокращение слова «число». Во всех статистических методах приняты свои символические обозначения всех этих величин: как подсчитанной по соответствующему статистическому методу эмпирической величины, так и найденных по соответствующим таблицам критических величин. Например, при подсчете рангового коэффициента корреляции Спирмена (см. главу II, раздел 11.3) по таблице 21 Приложения были найдены следующие величины критических значений, которые для этого метода обозначаются греческой буквой ρ (ро). Так для Р = 0,05 по таблице 21 Приложения найдена величина ρкр1 = 0,61 и для Р = 0,01 величина ρ кр2 = 0,76.

В принятой в дальнейшем изложении стандартной форме записи это выглядит следующим образом:

Теперь нам необходимо сравнить наше эмпирическое значение с двумя найденными по таблицам критическими значениями. Лучше всего это сделать, расположив все три числа на так называемой «оси значимости». «Ось значимости» представляет собой прямую, на левом конце которой располагается 0, хотя он, как правило, не отмечается на самой этой прямой, и слева направо идет увеличение числового ряда. По сути дела это привычная школьная ось абсцисс ОХ декартовой системы координат. Однако особенность этой оси в том, что на ней выделено три участка, «зоны». Левая зона называется зоной незначимости, правая — зоной значимости, а промежуточная зоной неопределенности. Границами всех трех зон являются Чкр1 для Р = 0,05 и Чкр2 для Р = 0,01, как это показано ниже:

Ось значимости

Подсчитанное Чзмп по какому либо статистическому методу должно обязательно попасть в одну из трех зон.

1. Пусть Чэмп попало в зону незначимости, тогда рисунок выглядит так:

В этом случае принимается гипотеза Но об отсутствии различий.

2. Пусть Чэмп попало в зону значимости, тогда рисунок выглядит так:

В этом случае принимается альтернативная гипотеза Н1, о наличии различий, а гипотеза Но отклоняется.

3. Пусть Чзмп попало в зону неопределенночсти, тогда рисунок выглядит так:

В этом случае перед психологом стоит дилемма. Так, в зависимости от важности решаемой задачи он может считать полученную статистическую оценку достоверной на уровне 5%, и принять, тем самым гипотезу H1 отклонив гипотезу H о, либо — недостоверной на уровне 1%, приняв тем самым, гипотезу H о. Подчеркнем, однако, что это именно тот случай, когда психолог может допустить ошибки первого или второго рода. Как уже говорилось выше, в этих обстоятельствах лучше всего увеличить объем выборки.

Подчеркнем также, что величина Чэмп может точно совпасть либо с Чкр1, либо с Чкр2. В первом случае можно считать, что оценка достоверна точно на уровне в 5% и принять гипотезу H1, или, напротив, принять гипотезу H о. Во втором случае, как правило, принимается альтернативная гипотеза H1 о наличии различий, а гипотеза H0 отклоняется.

Для иллюстрации этих положений строим соответствующую «ось значимости» рассмотренного выше примера для оценки уровня значимости эмпирически рассчитанного рангового коэффициента корреляции Спирмена.

Как видим, в этом случае ркр = рэмп,следовательно принимается альтернативная гипотеза H1 о наличии различий, а гипотеза H о отклоняется.


Поделиться с друзьями:

История развития пистолетов-пулеметов: Предпосылкой для возникновения пистолетов-пулеметов послужила давняя тенденция тяготения винтовок...

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.014 с.