Показатели распределения признака. — КиберПедия 

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Показатели распределения признака.

2017-11-16 92
Показатели распределения признака. 0.00 из 5.00 0 оценок
Заказать работу

Любое реальное распределение можно изобразить схематически в виде кривой, воспроизводящей основные особенности данного распределения. Под кривой распределения понимается графическое изображение в виде непрерывной линии изменения частот, функционально связанных с изменением вариант.

Элементами распределения являются:

· варианта

· частота

В зависимости от вида кривых, изображающих распределение, выделяют несколько основных типов распределения:

· одновершинные

· многовершинные

К одновершинным относятся те, в которых один, обычно центральный вариант, имеет наибольшую частоту (плотность распределения). Частоты же остальных вариантов убывают по мере удаления от центрального.

Если частоты убывают слева и справа от центрального значения одинаково, то такие распределения называются симметричными.

Если частоты убывают слева и справа от центра распределения с разной скоростью, то такие распределения называют асимметричными.

Многовершинные распределения — это распределения, в которых несколько центров, т. е. такие, у которых несколько максимумов частот.

Для однородных совокупностей, как правило, характерны одновершинные распределения.

Многовершинность распределения свидетельствует о неоднородности изучаемого явления. В этом случае необходимо произвести перегруппировку данных с целью выделения более однородных групп:

Кривые распределения бывают:

1. симметричными

2. асимметричными.

В зависимости от того, какая ветвь кривой распределения вытянута, различают:

1. правостороннюю асимметрию(отрицательная, значения признака большие)

2. левостороннюю асимметрию.(положительная, значения признака преобладают маленькие)

Для характеристики степени асимметрии двух или нескольких рядов пользуются коэффициентом асимметрии. А>0 правосторонняя ассиметрия, А<0 правосторонняя.

Коэффициент эксцесса: необходим для оценки островершинности распределения. Если Е=0 распределение нормальное, если больше, то гипотеза о нормальном распределении отвергается.

 

Стандартизация показателей.

Одной из задач, возникающих при одномерном анализе данных, является задача сопоставления значения определенной переменной для конкретного респондента со средним значением этой переменной в какой-то социальной группе.

Например, мы знаем, что респондент имеет заработную плату в размере 2 500 руб. Не зная средней величины зарплаты в регионе, где проживает респондент, мы не сможет сказать много или мало он получает. Величина 2 500 может быть проинтерпретирована лишь в сравнении с доходами других людей.

Для того чтобы можно было сразу оценить относительную величину того или иного количественного показателя для конкретного респондента, используется подход стандартизации исходных данных.

Существует несколько различных подходов к стандартизации данных, но наиболее распространенным является так называемая Z-статистика. Вычисление стандартизированной величины Zxy для значения переменной х проводится по

формуле

Zxi = (xi – x)/S,

где Xi – значение переменной х для определенного респондента;

X – среднее значение переменной х;

S – стандартное отклонение для переменной х.

Значение показателя Z значительно более информативно с точки зрения задачи относительного положения данного респондента, чем значение исходной переменной х. Если для респондента значение Z положительно, то он имеет значение переменной х больше, чем средний опрошенный респондент.

После того, как будет известно большее или меньшее значение переменной х имеет данный респондент по сравнению с другими опрошенными, необходимо узнать, насколько это значение больше или меньше, чем у других респондентов.

В знаменателе формулы для расчета Z стоит дисперсия переменной х, следовательно, 68 % Zx должно лежать в интервале от -1 до +1, а 95 % – в интервале от -2 до +2.

Таким образом, если по модулю значение Zx меньше 1, то значение переменной х для данного респондента вполне типично.

Если значение Zx по модулю находится в интервале от 1 до 2, то можно говорить, что данный респондент по рассматриваемому показателю значительно отличается от среднего респондента.

И наконец, если Zx по модулю превосходит 2, то можно утверждать, что респондент резко отличается от среднего.

Стандартизированная по формуле величина имеет среднее значение, равное 0, и дисперсию, равную 1.

Чтобы провести стандартизацию показателей при помощи SPSS, следует использовать блок команд:

Аnalyze / Анализ →

Descriptive statistics / Описательные статистики →

Descriptive / Описательные.

В результате откроется окно. Там будет операция «сохранять стандартиз.значения переменных»

После вычислений автоматически создается новая переменная, содержащая в себе стандартизированные значения, и размещается она последней в матрице данных

Новая переменная zvar21 представляет собой Z-стандартизированное значение переменной var00021. Использование стандартизированной переменной позволяет сказать, что доход респондента номер 21 приблизительно равен среднему значению по массиву опрошенных. В то время как доход у респондента под номером 32 значительно выше, нежели у среднего респондента.

Использование стандартизированных переменных может быть полезно при сопоставлении показателей, измеренных в различных единицах. Так, например, мы располагаем результатами исследований, проведенных в России и США. У российского респондента А средний доход составляет 9 000 руб. в месяц, у американского респондента В доход равен 2 000 дол. в месяц. Не зная значений средних доходов россиян и американцев, мы не можем их сопоставить и определить, кто из респондентов (А или В) находится выше в своем социальном кругу с точки зрения доходов. Но мы можем ответить на данный вопрос, если сопоставим не исходные объективные данные, а стандартизированные показатели.

 

Таблицы сопряженности.

. Наиболее часто перед социологами ставятся такие задачи, как описание и анализ совместного поведения двух и более переменных. При этом социолог формирует различные модели, например «респонденты, принадлежащие к разным возрастным, профессиональным или доходным группам, различаются по степени удовлетворенностью своей жизнью илиполитическим предпочтениям». Тем самым, допускается, что существуетнекоторая переменная (например, принадлежность копределенной социальной группе), которая объясняет поведениедругих переменных. Таким образом, в этой модели есть ипричина и следствие.

В традиционной терминологии объясняющие переменные называются независимыми, а объясняемые переменные – зависимыми. При описании совместного поведения несколькихпеременных социолог прибегает к использованиюмногомерного анализа.Наиболее частым инструментом проверки гипотез овзаимосвязи двух переменных являются таблицысопряженности.

Таблица сопряженности – это таблица, содержащая частоты совместного проявления значений двух признаков (например, X и Y), измеренных в данной совокупности единиц анализа. В ней строки соответствуют значениям одного признака, столбцы – другого. Иными словами, в таблицах сопряженности отражаются выборочные оценки вероятностных распределений многомерных случайных величин. На основе этой таблицы можно судить о сопряженности (взаимной встречаемости) каких-то значений одних признаков с некоторыми значениями других.

Каждая таблица сопряженности представляет собой численность групп респондентов, на которые подразделяется вся совокупность (т.е. матрицу абсолютных чисел). Кроме того, в таблице располагаются относительные частоты, т.е. доли, которые составляют группы из числа единиц анализа. Они приводятся в виде процентов. Наряду с этими частотами приводятся суммарные частоты по отдельным значениям признаков, а также вспомогательная информация, например по каждому вопросу число респондентов, не ответивших на этот вопрос.

Признаки в таблицах сопряженности – это вопросы анкеты, а

значения признаков – варианты ответов на эти вопросы.

Крайний правый столбец образуют строковые маргинальные суммы (маргиналы по строкам). Последняя строка содержит столбцовые маргинальные суммы.

 

Анализ →Описательная статистика →Таблицы сопряженности. где необходимо задать переменные, соответствующие нашим вопросам.Для этого из левой части окна, где содержится список всех переменных, при помощи клавиши (изображение стрелок) переносим в правую часть окна переменные «насколько безопасно чувствуете себя в городе» и «пол». При этом надо выбрать, каким образом переменные должны быть отражены в таблице сопряженности и соответственно заполнить окна «Row / Строки» и «Column / Столбцы». Ячейки Проценты.

Таким образом, мы видим, что главное назначение таблиц сопряженности – это удобное и наглядное представление исходной информации о переменных в целях выявления связей между ними.

 


Поделиться с друзьями:

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Биохимия спиртового брожения: Основу технологии получения пива составляет спиртовое брожение, - при котором сахар превращается...

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.019 с.