Тема 4. Сводка и группировка — КиберПедия 

Индивидуальные очистные сооружения: К классу индивидуальных очистных сооружений относят сооружения, пропускная способность которых...

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Тема 4. Сводка и группировка

2017-11-16 129
Тема 4. Сводка и группировка 0.00 из 5.00 0 оценок
Заказать работу

 

1. Понятие сводки и группировки

2.Виды группировок

3. Группировочные признаки

4. Статистические ряды распределения

5 Статистические таблицы

6. Статистические графики

 

1. Специфика предмета статистики – это специфика статистического метода, он включает:

- сбор данных – статистическое наблюдение;

- обобщение данных наблюдения (включает сводку и группировку);

- представление данных в подходящей форме и компактно;

- анализ и интерпретацию.

В результате первой стадии статистического исследования - статистического наблюдения - получают сведения о каждой еди­нице совокупности. Задача второй стадии статистического иссле­дования состоит в том, чтобы упорядочить и обобщить первич­ный материал, свести его в группы и на этой основе дать обоб­щенную характеристику совокупности. Этот этап в статистике называется сводкой.

Статистическая сводка - систематизация единичных фак­тов, позволяющая перейти к обобщающим показателям, относя­щимся ко всей изучаемой совокупности и ее частям, и осуществ­лять анализ и прогнозирование изучаемых явлений и процессов.

 

Различают:

- простую сводку (подсчет только общих итогов);

- статистическую группировку.

Статистическая группировка сводится к расчленению со­вокупности на группы по существенному для единиц совокупно­сти признаку. Группировка позволяет получить такие результа­ты, по которым можно выявить состав совокупности, характер­ные черты и свойства типичных явлений, обнаружить законо­мерности и взаимосвязи. Группировка является основным мето­дом обработки собранной информации.

Чтобы сгруппировать данные, необходимо ознакомиться со всеми результатами наблюдения и сделать первичные выводы о характеристиках изучаемого объекта. Именно поэтому группи­ровку иногда называют первичным анализом данных.

Способ разработки статистической сводки может быть:

- цен­трализованным;

- децентрализованным.

При централизованной сводке все данные сосредоточиваются в одном месте и сводятся по разработанной методике.

При децентрализованной сводке обобщение материала осу­ществляется снизу доверху по иерархической лестнице управле­ния, подвергаясь на каждом из них соответствующей обработке.

Положив начало научной систематизации и обработке ис­ходной информации, сводка и группировка статистических дан­ных служат тем самым базой для осуществления всестороннего анализа и прогнозирования коммерческой деятельности на рын­ке товаров и услуг.

 

2. Выделяют несколько видов группировок, применение кото­рых обусловлено характером единиц совокупности:

типологическая группировка - подразделяет единицы в зависимости от их типа. Применяется, как правило, для группировок по атрибутивным (качественным) признакам. Отрицательной стороной является подверженность субъективным взглядам исследователя при отнесении единиц к различным типам явления;

структурная группировка - характеризует структуру изу­чаемой совокупности, т.е. отвечает на вопросы:

- какие части можно выделить в объекте наблюдения,

- каково соотношение между ними (или какой удельный вес в целом имеет каждая часть).

Как правило, осуществляется по одному признаку;

аналитическая группировка - характеризует степень влияния одного фактора объекта на другой. Причем влияющий фактор называют признак-фактор, а параметр, подверженный влиянию, - признак-результат.

Иногда учитывается несколько признаков-факторов, тогда такая группировка называется многомерной (многофакториой).

Образование групп по двум и более признакам, взятым в определенном сочетании, называется комбинированной группировкой. При этом группировочные признаки принято располагать, начиная с атрибутивного (качественного), в определенной последовательности, исходя и 1 логики взаимосвязи показателей. Применение комбинированных группировок обусловлено много­образием экополитических явлений, а также необходимостью их всестороннего изучения. Примером комбинированной группиров­ки может служить разделение образованных групп по формам хозяйствования на подгруппы по уровню рентабельности или по другим признакам (производительность труда, фондоотдача и т.д.).

Особенностью аналитических группировок является тот факт, что группировка считается выполненной после применения эле­ментов корреляционно-регрессионного анализа, т.е. после коли­чественного определения меры зависимости между факторами.

Наиболее сложный вопрос теории группировок - выбор группировочного признака.

3. Социально-экономические явления отличаются большим мно­гообразием форм своего развития, и поэтому при группировке встает вопрос о выборе того признака, который адекватен цели исследования и характеру исходной информации. Определяющи­ми являются признаки, наиболее полно и точно характеризую­щие изучаемый объект, позволяющие выбрать его типичные чер­ты и свойства.

Группированные признаки (или основание группировки) - это признаки, по которым производится распределение единиц наблюдаемой совокупности на группы. Так, при группировке на­селения по месту проживания выделяются две группы: город­ское и сельское население. Число возможных групп статисти­ческих данных может быть ограничено соответствующими при­знаками (атрибутами) такими как иол, возраст, образование, клас­совая принадлежность и т.п. Однако группировки могут форми­роваться по множеству других признаков и не только в статике на определенную дату, но и в динамике, т.е. на протяжении ка­ких-то лет, взятых в определенном интервале.

Поскольку единицы совокупностей подвергаемых группи­ровке, обладаю! многими признаками, то группы могут быть об­разованы по одному или нескольким признакам, взятым в определенной комбинации. Группировки по одному признаку назы­ваются простыми, группировки по двум и более признакам, взя­тым в сочетании с другим, называется комбинационными. Примером комбинационных группировок может быть таблица чис­ленности городского и сельского населения в нашей стране по данным переписи 1970 г. Указанные в таблице группировки на­селения по признаку «городское и сельское население» не только представлены в динамике, т.е. в процессе исторического разви­тия страны с 1913 по 1970 г., но и раскрывают этот процесс в абсолютных и относительных числах.

По форме выражения группировочные признаки могут быть:

- атрибутивными (качественными);

- количественными (числен­ными).

При этом количественные признаки, в свою очередь, могут быть:

- дискретными (прерывными), значения которых выражаются только целыми числами (число комнат в квартире, число человек в семье и т. д.),

- интервальными (непрерывными), принимающими как целые, так и дробные значения (рост человека, вес, зарплата, метраж квартиры, объем проданных населению товаров в стоимостном выражении, сумма издержек обраще­ния).

Вопрос о числе групп и границах интервала для каждого вида группировок должен решаться по-разному, исходя из целей исследования, значения изучаемого признака, объема коммерческой деятельности и т.д.

Количество групп во многом зависит от того, какой признак служит основанием группировки. Так, нередко атрибутив­ные группировочные признаки предопределяют число групп. По аналогии также расчленяется совокупность по дискретному при­знаку, изменяющемуся в незначительном диапазоне.

Различают:

- открытые интервалы,

- закрытые интервалы.

Открытые интервалы имеют какую-нибудь одну обозна­ченную границу в первой и последней интервальной группе, а замкнутые - и верхнюю и нижнюю границы интервала.

Интервалы групп устанавливаются только при значитель­ной колеблемости дискретного признака и при непрерывно изме­няющемся количественном признаке (величина зарплаты).

Величина интервала - это разность между максималь­ными и минимальными значениями признака в каждой группе. Эту величину можно определить и как разность между верхни­ми или нижними границами значений признака в смежных груп­пах

Интервалы бывают:

- равные (построение замкнутых интер­валов);

- неравные (построение открытых интервалов).

Величину интервала можно определить по формуле:

где i - величина интервала,

Xmax и Xmin - максимальное и минимальное значение признака в совокупности,

п - число групп.

Пример.

Сформировать 3 группы рабочих по средней зарплате. Известно, что самая высокая з/пл 9200 руб., самая низкая 5600 руб.

1) Определяем величину интервала по формуле:

 

 

2) Сформируем группы рабочих по средней з/пл

1 гр. 5600 – 6800

2 гр. 6800 – 8000

3 гр. 8000 - 9200

4. Первым и наиболее простым способом обобщения статисти­ческих данных являются ряды распределения.

Статистическим рядом распределения называют числен­ное распределение единиц совокупности по изучаемому призна­ку. В зависимости от признака ряды делятся на вариационные (количественные) и атрибутивные (качественные).

Вариационные ряды могут быть дискретными или интервальными.

Дискретный ряд распределения - это ряд, в котором чис­ленное распределение признака выражено одним конечным чис­лом (например, распределение рабочих по разрядам).

Интервальный ряд распределения - это ряд, в котором значения признака заданы в виде интервала. Интервалы в ря­дах распределения могут быть неравными - прогрессивно воз­растающими или прогрессивно убывающими. Это характерно для совокупностей с большой колеблемостью значений признака.

Элементы рядов распределения:

1. Варианта - это отдельное значение варьирующего признака, которое он принимает в ряду распределения.

2. Частота - это число, которое показывает, сколько раз встретилась варианта в данной совокупности.

При построении интервальных рядов распределения необходимо определить:

- какое число групп следует образовать;

- какие взять интервалы (равные, неравные, закрытые, открытые). Эти вопросы решаются на основе экономического анализа сущности изучаемых явлений, поставленной цели и характера изменений признака.

Интервалы не должны быть:

- слишком широкими, так как в противном случае качественно различные объекты могут попасть в одну и ту же группу (нельзя, например, строить такие возрастные интервалы: 0—15 лет; 16—30 лет),

- не долж­ны быть слишком узкими, поскольку и в этом случае число еди­ниц в той или иной группе окажется незначительным и характе­ристики групп не будут типичными.

Интервальные ряды изображают - на графике с помощью гистограмм.

Дискретные ряды изображают - с помощью полигона распределения.

Обобщение данных и виде ряда распределения позволяет видеть вариацию и состав совокупности по изучаемому признаку, сравнивать между собой группы, изучать их в динамике.

Пример.

Сделать группировку рабочих по стажу и построить:

1) Вариационный дискретный ряд.

2) Вариационный интервальный ряд, образовав 2 группы с равными интервалами.

3) Указать варианту и частоту.

 

Данные о стаже рабочих: 3 2 5 6 6 1

1 3 1 5 6 6

2 4 5 4 6 5

1) Ряд распределения рабочих по стажу

 

Стаж работы             Итого
Количество рабочих              

 

Вид РР: вариационный дискретный ряд.

Варианта: стаж работы

Частота: число рабочих

2) Ряд распределения рабочих по стажу

 

Стаж работы 1-4 4-7 Итого
Количество рабочих      

 

Вид РР: вариационный интервальный ряд.

Варианта: стаж работы

Частота: число рабочих

 

5. Результаты группировок находят свое выражение в виде свод­ных таблиц.

Таблица - это компактное изображение собранного мате­риала в виде системы строк и столбцов, на пересечении которых приводятся данные, характеризующие изучаемое явление.

Статистическая таблица состоит из следующих элементов:

общий заголовок - отражает суть всей таблицы, содержит указание на характеризуемый признак объекта исследования, вре­мя, место наблюдения (иногда единицы измерения признака);

подлежащее - характеризуемый в таблице объект исследо­вания (находится в левой части таблицы по строкам);

сказуемое - показатели, характеризующие подлежащее (располагается в верхней части по графам);

итоговая строка - может находиться в начале (тогда со­провождается нижеследующей строкой «в том числе») или в конце подлежащего. В тех графах итоговой строки, и которых по смыслу не могут быть подсчитаны результаты, ставится «X»;

цифровые данные - количественная характеристика иссле­дуемого объекта (в случае отсутствия данных ставится «..» или пишется «нет сведений», а в случае отсутствия типа явления ста­вится «-»);

сетка - пересечение горизонтальных и вертикальных ли­ний.

Все таблицы можно разделить на три группы:

1. Таблицы простые, или перечневые, в которых содержатся сводные показатели или перечень отдельных объектов без расчленения совокупности на группы.

2. Групповые таблицы, в которых статистическая совокупность расчленена на отдельные группы и каждая из этих групп охарактеризована рядом показателей.

3. Комбинационные таблицы, в которых статистическая сово­купность разбита на группы по нескольким признакам (та­ким образом, в таблице получается комбинация групп).

По построению сказуемого различают:

- простые;

-комбини­рованные таблицы.

При простой разработке каждая графа сказу­емого отдельно друг от друга характеризует подлежащее. При комбинированной таблице показатели сказуемого разрабатыва­ются в сочетании друг с другом.

 

6. Графическое представление статистической информации при­меняется для более наглядного отображения исследуемых про­цессов.

Статистические графики - это условные изображения ста­тистических данных в виде точек, линий или фигур,

Схематически все множество графических представлений статических данных разделяют на два класса:

- диаграммы;

- линейные изображения.

Выбор вида применяемого графика зависит от отображаемых данных. Например, для изображения структурного распределения совокупности, как правило, применяется круговая диаграмма.

Статистический график состоит из следующих элементов:

графический образ - геометрические значки, с помощью которых выражаются статистические показатели;

поле графика - ограниченная плоскость, на которой располагается график;

масштабные ориентиры - система мер и шкал, принятых для отображения данных.

К классу линейных графиков относятся:

- полигон,

-кумулятивная кривая,

-кривая концентрации,

- огива.

Полигоном частот называют ломаную, отрезки которой со­единяют точки 1, т2),...,(хk, , тk). Иногда крайние точки соеди­няют с точками, имеющими нулевую ординату.

Кумулятивная кривая (кривая сумм) - ломаная, состав­ленная по последовательно суммированным, т.е. накопленным частотам или относительным частотам. При построении кумуля­тивной кривой дискретного признака на ось абсцисс наносятся значения признака, а ординатами служат нарастающие итоги ча­стот. Соединением вершин ординат прямыми линиями получа­ют кумуляту.

При построении кумуляты интервального признака на ось абсцисс откладываются границы интервалов и верхним значени­ям присваивают накопленные частоты. Кумулятивную кривую называют полигоном накопленных частот.

Если на ось ординат нанести значение признака, а накоп­ленные частоты — на ось абсцисс, то получим кривую, называе­мую огивой.

Диаграмма - это графическое изображение, наглядно по­казывающее соотношение между сравниваемыми величинами. Диаграммы бывают различных видов:

- полосовые (ленточные),

- столбиковые,

- квадратные,

- круговые,

- секторные,

- фигурные,

- ра­диальные,

- знак Варвара.

Основным видом столбиковых диаграмм являются гисто­граммы.

Гистограммой частот называют ступенчатую фигуру, со­стоящую из прямоугольников, основанием которых служат час­тотные интервалы длины, а высоты равны отношению Мi/h (плотность частоты). Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними на рас­стоянии Мi/h проводят отрезки, параллельные основанию.

Гистограммой относительных частот называют ступен­чатую фигуру, состоящую из прямоугольников, основанием ко­торых случат частичные интервалы длиной h, а высоты раины Wi/h. Гистограмма относительных частот - аналог плотности распределения непрерывной случайной величины. Иногда высо­ты прямоугольников и гистограмме не делят на h, но указывают над столбиками значение высоты и над осью ординат пишут, что ее значение надо делить на h. Такую гистограмму называют мас­штабированной.

При построении квадратных и круговых диаграмм площади квадратов или кругов выражают изображаемые величины.

Круговые секторные диаграммы применяют для графичес­кого изображения составных частей целого. Чтобы легче разли­чать сектора, используют различную раскраску или штриховку.

Радиальные диаграммы строятся в полярной системе коор­динат и используются для изображения признаков, периодичес­ки изменяющихся во времени (в большинстве своем сезонных колебаний). Вычисляется среднее арифметическое,затем стро­ится окружность радиуса, равного среднему арифметическому. Данная окружность делится на нужное число секторов (обычно 12) и на каждом радиальном направлении откладываются точки в соответствии со значениями Xi.

Фигурные диаграммы строятся двумя основными способами: данные изображаются либо фигурами различных размеров, либо разной численностью фигур одинакового размера.

Диаграмма «знак Варзара» названа в честь русского статистика. С помощью данной диаграммы можно изображать многомерные признаки на плоскости посредством прямоугольников с разным соотношением между основанием и высотой. Одна из компонент признака изображается основанием прямоугольника, вторая - его высотой, третья равна произведению двух других размером получившейся площади.

 

Тема 5. Средние величины

1. Понятие и расчет средних величин

2. Свойства средних величин

3. Структурные средние величины

 

1. Средняя величина - обобщающий показатель, который выражает типичные черты и дает обобщающую количественную характеристику какого-либо уровня какого-либо варьирующего признака по совокупности однородных явлений.

Введем следующие понятия и обозначения:

признак, по которому находится средняя, называется осредняемым признаком и обозначается ;

величина осредняемого признака у каждой единицы совокупности называется индивидуальным его значением, или вариантами, и обозначается как ;

частота – это повторяемость индивидуальных значений признака, обозначается буквой f.

В статистике применяют различные виды средних величин:

1) простые (невзвешенные) – когда отдельные значения изучаемой совокупности не повторяются;

2) взвешенные – когда отдельные значения изучаемой совокупности повторяются.

Средняя арифметическая простая наиболее распространенный вид средней. Она исчисляется в тех случаях, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности.

В зависимости от характера исходных данных средняя арифметическая определяется следующим образом.

Пример 1. Предположим, что требуется вычислить средний стаж десяти работников торгового предприятия 6, 5, 4, 3, 3, 4, 5, 4, 5, 4, т.е. дан ряд одиночных значений признака, тогда х рассчитывается как

,

т.е. как средняя арифметическая невзвешенная делением количества свободного признака на число показаний:

.

 

Часто приходится рассчитывать среднее значение признака по ряду распределения, когда одно и то же значение признака встречается несколько раз. Объединив данные по величине признака (т.е. сгруппировав) и подсчитав число случаев повторения каждого из них, мы получим следующую таблицу.

 

 

Продолжительность стажа работы (варианты) Число работников торгового предприятия (частоты) Отработано человеко-лет
     
Итого:    

Тогда средняя вычисляется по формуле средней арифметической взвешенной:

.

Часто вычисление средних величин приходится производить и по данным, сгруппированным в виде интервальных рядов распределения, когда варианты признака, из которых исчисляется средняя, представлены в виде интервалов (от – до).

Для вычисления средней величины надо в каждом интервале определить серединное значение , после чего произвести взвешивание обычным порядком x'f. В закрытом интервале серединное значение определяется как полусумма значений нижней и верхней границ. Иногда задача исчисления средней по величинам интервального ряда осложняется тем, что неизвестны крайние границы начального и конечного интервалов. В этом случае предполагается, что расстояние между границами данного интервала такое же, как и в соседнем интервале.

 

Группы предприятий по объему товарооборота, млн. руб. Число предприятий, Середина интервала,
До 400 400-500 500-600 600-700 Свыше 700      
Итого:      

Пример 2. Объем товарооборота в среднем на одно предприятие составит:

 

В данном случае для расчета применялась средняя арифметическая взвешенная из интервального ряда.

; где

X ср – серединное значение интервала.

Необходимо отметить, что изложенный прием исчисления средней является вынужденным в том случае, когда нет прямых данных о конкретной величине отдельных вариантов. Этот прием основан на предположении, что отдельные конкретные варианты равномерно распределены внутри интервала. Однако в действительности распределение отдельных вариантов в пределах интервала может оказаться неравномерным, и тогда середина интервала будет в той или иной степени отличаться от принятой средней. Это может повлиять на правильность общей средней, исчисленной по данным интервального ряда.

Необходимо отметить, что, хотя мы и используем для расчета средней из интервального ряда формулу средней арифметической взвешенной, исчисленная средняя не является точной величиной, так как в результате умножения средних значений групп на их численность мы не получим действительного значения. Сходство исчисленной средней со средней взвешенной лишь в методе вычисления. Здесь взяты не индивидуальные значения вариант, а условные средние каждой группы. Их взвешивание имеет чисто формальный характер.

Степень расхождения зависит от ряда причин:

1) число вариант: Чем больше число вариант, тем вероятнее, что середина интервала будет мало отличаться от групповой средней. Если же на каждую группу приходится малое число единиц, групповые средние могут находиться не только в середине, но и вблизи верхней либо нижней границы интервала. Если же наблюдений много и они более или менее равномерно распределяются в пределах интервала, то средняя величина в группе будет приближаться к середине интервала.

2) величина интервала: Если интервал невелик, то и ошибка будет незначительной, так как фактически групповая средняя будет мало отличаться от середины интервала.

3) характер распределения: Чем симметричнее распределение, тем ошибка меньше.

4) принцип построения интервального ряда: При равных интервалах середина построения его будет ближе примыкать к средней по данной группе. Кроме того, при наличии открытых интервалов к этому добавляются неточности, связанные с условным установлением неизвестных границ.

Средняя гармоническая – это величина, обратная средней арифметической. Когда статистическая информация не содержит частот по отдельным вариантам совокупности, а представлена как их произведение, применяется формула средней гармонической взвешенной

,

где – величина общего объема, т.е. ).

 

Так, например, расчет средней цены выражается отношением: .

Пример 4.

Город Цена, руб. Сумма реализации, тыс.руб. Частоты
А Б В      
Итого:      

Величина суммы реализации, т. е. показателя, который находится в числителе исходного отношения, известна. Для определения неизвестной величины – количества реализованных единиц – нужно отдельно по каждому виду товара разделить сумму реализации на цену:

При определении средней цены, используя невзвешенную среднюю арифметическую, получим среднюю, которая не отражает объема реализации,
т.е. нереальна:

.

Как видно, средняя гармоническая является превращенной формой арифметической средней. Вместо гармонической всегда можно рассчитать среднюю арифметическую, но для этого сначала нужно определить веса отдельных значений признака.

В том случае, если объемы явлений, т. е. произведения, по каждому признаку равны, применяется средняя гармоническая (простая).

Пример 5. Две автомашины прошли один и тот же путь: одна со скоростью 60 км/ч, а вторая – 80 км/ч, тогда средняя скорость составит:

, т.е. .

Средняя геометрическая это величина, используемая как средняя из отношений или в рядах распределения, представленных в виде геометрической прогрессии. Этой средней удобно пользоваться, когда уделяется внимание не абсолютным разностям, а отношениям двух чисел. Поэтому средняя геометрическая используется в расчетах среднегодовых темпов роста.

 


Поделиться с друзьями:

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...

Состав сооружений: решетки и песколовки: Решетки – это первое устройство в схеме очистных сооружений. Они представляют...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.102 с.