Составление сводных таблиц (табулирование данных) — КиберПедия 

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...

Составление сводных таблиц (табулирование данных)

2017-06-13 407
Составление сводных таблиц (табулирование данных) 0.00 из 5.00 0 оценок
Заказать работу

Использование индивидуальных протоколов для математической обработки результатов не очень удобно. Для того, чтобы представить материал в более компактном виде, данные сводятся в итоговую таблицу следующего вида:

№№ п/п. Фамилия, имя, отчество Другие данные (если необходимо) Исследуемый показатель
       
       
       
       
n        

В ряде случаев перед составлением сводной таблицы проводится ранжирование данных. Оно, в частности, необходимо при определении квантилей (см. подраздел 3.3). Для этого данные выстраиваются в общий ряд по исследуемому признаку в порядке его возрастания (или убывания) следующим образом: х 1х 2х 3...х n (или наоборот), где n – общее число значений признака (объем выборки). Знак «меньше или равно» предполагает, что у разных испытуемых могут встречаться одинаковые значения переменной.

Иногда даже итоговые таблицы могут оказаться довольно громоздкими и не вполне удобными для дальнейшей обработки. В этом случае материал можно сделать еще более компактным, составляя частотные таблицы (таблицы распределения частот исследуемого признака):

№№ пп.         ... n – 1 n
x i              
f i              

В первой строке дается номер значения переменной в ранжированном ряду, во второй – конкретное значение (величина признака) и в третьей – частота встречаемости признака (число одинаковых значений признака в выборке).

Для того чтобы полученные данные представить в еще более компактном виде, используются таблицы распределения сгруппированных частот. Для составления такой таблицы необходимо:

1) общий диапазон изменения признака разделить на ряд поддиапазонов (классов) при условии, что ширина всех классов должна быть одинакова;

2) определить границы классов и их число в общем диапазоне;

3) подсчитать частоты встречаемости признака в каждом классе.

Обычно для построения распределения сгруппированных частот используется 7 – 15 классов. Для наиболее точного разбиения диапазона на классы (если в дальнейшем предполагаются математические операции с этими классами) можно использовать формулу Стэрджесса: N = 1 + 3,322 lg n, где n – объем выборки (количество значений признака), а N – количество классов. Так, например, если n = 100, то N = 1 + 3,322 × 2» 8.

Пример

На выборке испытуемых численностью 100 человек определялся коэффициент интеллекта (IQ). Минимальное значениеIQоказалось равным 72, а максимальное – 134. Для составления таблицы сгруппированных частот используем 8 классов (в соответствии с формулой Стэрджесса). Определяем общий диапазон изменения признака – он будет соответствовать разнице между минимальным и максимальным значениями: 134 – 72 = 62. Следовательно, в каждый класс должно попадать по 8 значений признака (при разбиении на классы можно слегка расширить диапазон с тем расчетом, чтобы в каждом классе оказалось одинаковое число значений и чтобы крайние значения не оказались за пределами диапазона). В соответствии с этим определяем границы классов и составляем таблицу сгруппированных частот:

Номер класса (N)       ...  
Границы класса (x min ¸ x max) 72  79 80 87 8895 ... 128 135
Среднее значение (х¯) 75,5 83,5 91,5 ... 131,5
Частоты (f i )       ...  
Накопленные частоты (F i)        

Накопленные частоты, приведенные в 5-й строке, могут быть использованы в некоторых статистических расчетах (например, для вычисления критерия l по Колмогорову). Накопленные частоты вычисляются путем простого суммирования частот от 1-го до N -го класса: F 1 = f 1; F 2 = f 1 + f 2; F 3 = f 1 + f 2 + f 3 и т. д.

 

Определение квантилей

Квантиль – точка на числовой оси (значение признака), делящая совокупность наблюдений в определенной пропорции. Определение квантилей достаточно часто используется в психодиагностических процедурах (при определении тестовых норм и т. д.). Для определения квантилей необходимо иметь ряд значений исследуемого признака, ранжированных в порядке возрастания величины.

Различают несколько разновидностей квантилей:

а) квартили (Q)делят совокупность наблюдений (ранжированный ряд) на 4 равные части: 1-й квартиль (Q 1) делит ряд в соотношении 25:75%, 2-й (Q 2) в соотношении 50:50% и 3-й (Q 3 ) – в соотношении 75:25%.

б) квинтили (K) делят выборку на 5 равных частей: K 1 – в соотношении 20:80%, K 2 – 40: 60%, K 3 – 60:40%, K 4 – 80:20%.

в) децили (D) делят ранжированный ряд на 10 равных частей: D 1 = 10%, D 2 = 20%,... D 9 = 90%.

г) наконец, процентили (Р) делят совокупность наблюдений на 100 частей (в процентном отношении).

Соотношения квантилей можно представить в виде следующей схемы:

Пример

На 20 испытуемых определялся уровень личностной тревожности (УЛТ) по тесту Спилбергера. При ранжировании значений признака получен следующий вариационный ряд (см. таблицу). Задача состоит в том, чтобы определить значения 1-го, 2-го и 3-го квартилей.

№№                                        
УЛТ                                        
       

Q 1 = 36 Q 2 = 41,5 Q 3 = 45

Для определения значений квартилей разбиваем ранжированный ряд на 4 равные части (по 5 значений признака). 1-й квартиль располагается между 5-м и 6-м значениями ряда, оба из которых соответствуют 36. Следовательно, Q 1 = 36. 2-й квартиль расположен между 10-м значением, равным 41, и 11-м, равным 42. Представляется разумным определить значение 2-го квартиля как среднее между двумя смежными значениями (Q 2 = 41,5). Значение 3-го квартиля лежит между 15-м и 16-м значениями ряда (Q 3 = 45).

Точно так же мы можем определить значения квинтилей (разбиение ранжированного ряда на 5 частей по 4 значения признака) или децилей (разбиение ряда на 10 равных частей по 2 значения переменной в каждой).

 


Поделиться с друзьями:

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Организация стока поверхностных вод: Наибольшее количество влаги на земном шаре испаряется с поверхности морей и океанов (88‰)...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.008 с.