Статистическая сводка и группировка первичных данных — КиберПедия 

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Статистическая сводка и группировка первичных данных

2019-08-04 121
Статистическая сводка и группировка первичных данных 0.00 из 5.00 0 оценок
Заказать работу

 

Группировка

 

По данным статистического наблюдения видно, что вариация признаков проявляется в сравнительно узких границах и распределение носит равномерный характер. В этом случае строят группировку с равными интервалами. Количество групп зависит в первую очередь от степени колеблемости признака: чем больше колеблемость признака (размах вариации), тем больше можно образовать групп. Ниже приведены формулы для построения статистической группировки.

Т. к. объем выборочной совокупности не большой, то для определения числа групп воспользуемся формулой:

 

 (1.1)

 

Величина интервала h по формуле:

 

; (1.2)

 

Полученную по формуле (1.2) величину, которая будет являться шагом интервала, округляют (округление не должно отличаться от исходного значения более, чем на 10-15%). При этом для первого интервала нижней границей будет являться , а верхней - ( + h) и т.д. Таким образом, нижняя граница i-го интервала равна верхней границе (i-1) - го интервала.

Результаты группировки заносятся в таблицу.

Далее определяются величины показателей, характеризующих группы, и разносятся по каждой группе. В этом случае идет речь о рядах распределения, т.е. об упорядоченном распределении единиц совокупности по определенному признаку.

 

Определение средней арифметической и структурных средних

 

Для характеристики среднего значения признака в вариационном ряду применяются: средняя арифметическая (взвешенная), мода и медиана.

Расчет средней арифметической производится по сгруппированным данным, т.к некоторые значения признака повторяются.

Средняя арифметическая взвешенная определяется по формуле:

 

; (2.1)

 

Мода - наиболее часто встречающееся значение признака.

В интервальном ряду определяется модальный интервал, т.е. интервал с наибольшим количеством повторений признака.

Значение моды определяется по формуле:

 

 (2.2)

 

Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Положение медианы определяется ее номером. Медианным является первый интервал, в котором сумма накопленных частот превысит половину общего числа наблюдений.

Численное значение медианы определяется по формуле:

 

; (2.3)

 

Гистограмма и кумулята

 

Анализ рядов распределения можно наглядно проводить на основе их графического представления.

Гистограмма применяется для изображения интервального вариационного ряда. При построении на оси Х откладываются величины интервалов, а частоты изображаются прямоугольниками, построенных на соответствующих интервалах. В результате мы получаем столбиковую диаграмму.

При помощи кумуляты изображается ряд накопленных частот. При построении на оси Х откладываются варианты ряда, а по оси У - накопленные частоты.

Предельные ошибки определения средних арифметических и доли (ошибки репрезентативности)

Предельная ошибка выборки ∆х определяется по формуле:

 

; (3.1)

 

t зависит от вероятности, с которой гарантируется величина предельной ошибки.

Выборка предприятий - случайная и бесповторная. При случайной бесповторной выборке величина средней квадратической ошибки рассчитывается по формуле:

 

; (3.2)

; (3.3)

 

Интервальная оценка генеральной средней  будет равна:

 

; (3.4)

 

Доля (ошибка репрезентативности) вычисляется по формуле:

 

 (3.5)

 

Доверительный интервал для генеральной доли:

 

; (3.6)

 

Стоимость основных фондов

 

По формулам (1.1) и (1.2) определяем:

 

;

; ;

 

Результаты группировки приведены в таблице 2. При этом накопленные частоты определяются путем последовательного суммирования частот по группам.


Таблица 2 Группировка приборостроительных предприятий по стоимости основных фондов в 2000 г.

Стоимость основных фондов, млн. руб. (х) Число предприятий, частота повторений признака () Накопленные частоты Середина интервала ()
 [2,3; 3,3) 2 2 2,8
 [3,3; 4,3) 3 5 3,8
 [4,3; 5,3) 8 13 4,8
 [5,3; 6,3) 8 21 5,8
 [6,3; 7,3) 10 31 6,8
 [7,3; 8,3] 6 37 7,8
Итого 37   31,8

 

По формулам (2.1), (2.2) и (2.3) рассчитываем среднюю стоимость основных фондов в целом по 37 предприятиям:

 

 

Модальный интервал (см. табл.2) - пятый (6,3-7,3], т.к он имеет наибольшую частоту (10). Медианный интервал - четвертый (5,3-6,3], т.к это первый интервал, в котором величина накопленных частот больше 18,5.

 

 

Построим гистограмму (рис.1), на которой отразим распределение предприятий по признаку х. Выделим на ней модальный интервал.

 

Рис. 1 Распределение приборостроительных предприятий по стоимости основных фондов

 

Анализируя диаграмму на рис.1, видно, что в рассматриваемой совокупности приборостроительных предприятий Челябинской области наиболее часто встречаются предприятия со стоимостью основных фондов 6,63 млн. руб. Величина медианы свидетельствует о том, что 50% предприятий имеют основных фондов на сумму 6,05 млн. руб.

Построим график кумуляты по данным таблицы 2.

 

Рис.2 Кумулята распределения предприятий по стоимости основных фондов

 

Рассчитаем предельную ошибку средней арифметической и ошибку репрезентативности по формулам (3.1 - 3.6). При вероятности 0, 99 t= 2,68 (по таблице Удвоенная нормированная функция Лапласа):

 

;

 

Интервальная оценка генеральной средней  равна:

 

 

Таким образом, с вероятностью 0,99 можно утверждать, что средняя стоимость основных фондов по 37 предприятиям находится в интервале от 5,36 до 6,44 млн. руб. Решим задачу определения доли предприятий, стоимость основных фондов которых лежит в модальном интервале [6,3; 7,3). Согласно таблице 2 численность таких предприятий составляет , а относительная частота:

 

.

 

Тогда ошибка репрезентативности согласно (3.5) равна:

 

 

Найдем доверительный интервал для данного показателя: 27%, 10% 44%, т.е. с вероятностью 0,99 можно утверждать, что доля предприятий, стоимость основных фондов которых лежит в пределах от 6,3 до 7,3 млн. руб., находится в пределах от 10 до 44% (т.е. у 19-81 предприятий в генеральной совокупности).

 

Объем продукции

 

Аналогично проведенным выше расчетам (пункт 2.5) произведем расчеты необходимых величин по результативному признаку. Результаты группировки оформим в виде таблицы 3. По формулам (1.1) и (1.2) определяем: ; ;

 

Таблица 3 Группировка приборостроительных предприятий по объему продукции в 2000г.

Объем продукции, млн. руб. (у) Число предприятий () Накопленные частоты Середина интервала,
 [1,5; 3,4) 4 4 2,45
 [3,4; 5,2) 10 14 4,3
 [5,2; 7,1) 11 25 6,15
 [7,1; 9,0) 6 31 8,05
 [9,0; 10,9) 4 35 9,95
 [10,9; 12,8] 2 37 11,85
Итого 37   42,75

 

По формулам (2.1), (2.2) и (2.3) рассчитываем средний объем продукции в целом по 37 предприятиям:

 

 

Модальным и медианным интервалом является третий [5,2; 7,1) (см. табл.3) - т.к. он имеет наибольшую частоту (10) и является первым интервалом, в котором величина накопленных частот больше 18,5.

 

млн. руб.

 

Построим гистограмму (рис.3), на которой отразим распределение предприятий по признаку у. Выделим на ней модальный интервал.

 

Рис.3 Распределение приборостроительных предприятий по объему продукции

 

Анализируя диаграмму на рис.3, видно, что в рассматриваемой совокупности приборостроительных предприятий Челябинской области наиболее часто встречаются предприятия с объемом выпускаемой продукции на 5,52 млн. руб. Величина медианы свидетельствует о том, что 50% предприятий имеют объем продукции на сумму 5,58 млн. руб.

Построим график кумуляты по данным таблицы 3.

 

Рис.3 Кумулята распределения предприятий по объему продукции

 

Рассчитаем предельную ошибку средней арифметической и ошибку репрезентативности по формулам (3.1 - 3.6):

 

;

;

 

Интервальная оценка генеральной средней  будет равна:

 

 

Таким образом, с вероятностью 0,99 можно утверждать, что средняя стоимость в целом по 37 предприятиям находится в интервале от 5,23 до 7,37 млн. руб.

Ошибка репрезентативности:

Решим задачу определения доли предприятий, объем продукции которых лежит в модальном интервале [5,2; 7,1]. Согласно таблице 3 численность таких предприятий составляет , а относительная частота:

 

.

 

Тогда ошибка репрезентативности согласно (3.5) равна:

 

 

Найдем доверительный интервал для данного показателя: 30%, 12% 48%, т.е. с вероятностью 0,99 можно утверждать, что объем продукции в размере от 5,2 до 7,1 млн. руб. наблюдается у доли предприятий, которая расположена в пределах от 12 до 48% (т.е. у 22-89 предприятий в генеральной совокупности).


Корреляционный анализ

 


Поделиться с друзьями:

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.043 с.