Интервальное статистическое распределение выборки. — КиберПедия 

Автоматическое растормаживание колес: Тормозные устройства колес предназначены для уменьше­ния длины пробега и улучшения маневрирования ВС при...

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...

Интервальное статистическое распределение выборки.

2021-02-01 1266
Интервальное статистическое распределение выборки. 0.00 из 5.00 0 оценок
Заказать работу

Гистограмма частот [7]

 Если признак Х может принимать любые значения из некоторого числового промежутка, то он называется непрерывно варьирующимся. Например, время службы электрических лампочек, изготовленных некоторым заводом.

В этом случае, особенно если число наблюдений n велико, нет смысла перечислять все значения х i признака Х из-за обилия числовых данных. Поэтому после ранжирования вариантов ряда производят их группировку. Для этого берут отрезок [ a; b ], который содержит все значения вариант х i, причем желательно, чтобы концы отрезка были целыми числами, наиболее близкими к х min   и х max. Ясно, что при этом   а  ≤   х min ≤    х max  ≤ b.

Отрезок [ a; b ], разбивают на k  равных частей, получая частичные интервалы длиной h:

                                   h =  .

Количество интервалов k  следует выбирать при этом оптимально, чтобы построенный интервальный ряд не был слишком громоздким, но в то же время позволял выявить характерные черты рассматриваемого явления.

Далее подсчитывают, сколько значений вариант х i содержится в каждом частичном интервале. Если значение варианты попало на границу между интервалами, то его, как правило, относят к следующему интервалу. В результате получают абсолютные частоты n i, которые показывают, какое количество вариант находится в каждом частичном интервале.

Интервальное статистическое распределение выборки представляет собой перечень последовательности интервалов и соответствующих им частот абсолютных n i или относительных Wi = n i / n.

 Гистограмма служит для наглядного изображения интервального вариационного ряда. Для ее построения в прямоугольной системе координат на оси абсцисс откладывают отрезки, изображающие интервалы варьирования, и на этих отрезках длиной h, как на основаниях, строят прямоугольники с высотами, равными отношению частот n i (i = 1, 2 …   k) к длине интервала:  (плотность частоты). В результате получают ступенчатую фигуру, состоящую из прямоугольников, которую называют гистограммой абсолютных частот.

Аналогично строится гистограмма относительных частот, когда высоты прямоугольников это плотности относительных частот  . При этом площадь i -го прямоугольника равна: h ·  = Wi, т. е. относительной частоте вариант, попавших в i -ый интервал. Отсюда следует, что площадь гистограммы относительных частот равна сумме всех относительных частот, т. е. единице.

 

 Пример. Построить гистограмму относительных частот по данному интервальному распределению выборки:

Х 0 – 2 2 –  4 4 – 6
ni 20 30 50

    

     Решение. Объем данной выборки n = 20 + 30 + 50 = 100. Тогда относительные частоты выборки: W 1 = n 1/ n = 20/100 = 0,2;               W 2 = n 2 / n  = 30/100 = 0,3;   W 3 = n 3 / n  = 50/100 = 0,5.

     Далее найдем плотности относительных частот. Учитывая, что длина каждого частичного интервала   h = 2, получим:

W 1/ h = 0,2/2 = 0,1;      W 2/ h = 0,3/2 = 0,15;   W 3/ h = 0,5/2 = 0,25.

 

     Отметим на оси абсцисс заданные интервалы  и на них, как на основаниях, построим прямоугольники с высотами, равными найденным соответственным плотностям относительных частот. Полученная ступенчатая фигура (рис. 4) будет гистограммой относительных частот.

Рис. 4. Гистограмма относительных частот

 

        Площадь гистограммы равна сумме площадей построенных прямоугольников: 2·0,1 + 2·0,15 + 2·0,25 = 1.

Следует отметить, что если выбрать величину интервала h достаточно малой, то при увеличении объема выборки n гистограмма относительных частот будет приближаться к кривой, представляющей собой график функции плотности распределения вероятностей f (x) для непрерывной случайной величины X.

       7.6.   Основные числовые характеристики выборки [5]

      Пусть задана выборка объема n  в виде дискретного статистического распределения:

 

хi х 1 х 2 хk
ni n 1 n 2 n k

где   n 1 + n 2 + … + n k     = n.

К основным числовым характеристикам выборки относят следующие.

1. Размах варьирования R – это разность между значениями наибольшей и наименьшей вариант: R = xmax  xmin.

    Например, для вариационного ряда 1; 2; 3; 5; 7; 10 размах варьирования   R = 10 – 1 = 9.

2. Медиана Ме  – это варианта, которая делит вариационный ранжированный ряд на две части, равные по количеству вариант.

     Для дискретного вариационного ряда с нечетным числом членов   п = 2 k + 1  медиана равна серединной варианте Ме = xk + 1, а для ряда с четным числом членов n = 2 k  – полусумме двух серединных вариант   Ме = .

    Например, для ряда 1;  3;  4;  6;  8, где   n = 5 – нечетно, Ме = 4. Для ряда 1; 4; 5; 6; 8; 8  с четным числом членов n = 6, Ме = =  5,5.

      3. Мода   Мо  – это варианта, имеющая наибольшую частоту. Например, для статистического распределения выборки:

xi 2 3 4 5 7 10
ni 3 1 3 2 4 2

Мо = 7, т. к. варианта   х = 7 встречается 4 раза, т. е. чаще, чем другие варианты.  

 4. Выборочная средняя –это среднее арифметическое значений признака Х выборочной совокупности:

      Таким образом, выборочная средняя – это средняя взвешенная значений признака xi  с весами n i, равными соответствующим частотам.

   Например, среднее значение для выборки: 4; 1; 2; 3; 1; 1; 3; 4 равно:

= ·(1·3 + 2·1 + 3·2 + 4·2) =  = 2,375,

где учтено, что элемент выборки 1 входит в выборку три раза, элемент 2 –  один раз, элементы 3 и 4 – по два раза.

 

     5. Выборочная дисперсия   – это   характеристика рассеяния (разброса) значений вариант   xi  от их среднего выборочного значения .  Она  измеряется в квадратных единицах признака Х:

      Для вычисления дисперсии используется также другая, часто более удобная формула:

)2,

 где

     

     Например, для предыдущей выборки 4; 1; 2; 3; 1; 1; 3; 4 было найдено среднее значение :

= ·(1·3 + 2·1 + 3·2 + 4·2) =  = 2,375.

     Найдем среднее квадратов значений признака:

 = (13 + 22·1 + 32·2 + 42·2) =  = 7,125.

 Тогда )2 = 7,125 – 2,3752 ≈ 0,7051.

 

      6) Среднее квадратическое выборочное отклонение   это характеристика рассеяния значений признака x i от их среднего выборочного значения в единицах признака Х:

 = .     

Для предыдущего примера  =  ≈ 0,84.

     Отметим, что среди перечисленных характеристик различают средние величины и показатели вариации. Средние величины характеризуют значения признака, вокруг которого концентрируются наблюдения, иначе, центральную тенденцию распределения. Наиболее употребляемой средней величиной является средняя арифметическая . К средним характеристикам относят также моду   Мо и медиану   Ме.

     Средние величины не отражают изменчивости (вариации) значений признака. Простейшим, но весьма приближенным показателем вариации, является размах варьирования R. Наибольший интерес представляют меры вариации вокруг средних величин, в особенности вокруг среднего арифметического значения . К ним относятся выборочная дисперсия   и выборочное среднее квадратическое отклонение .


Решение типовых задач [7]

     Задача 1. Найти все основные числовые характеристики дискретного выборочного статистического распределения:

х i 6 8 11 15
ni 3 7 8 2

     Решение. Объем выборки   n =3 + 7 + 8 + 2 = 20.

      Размах варьирования R  = x max  – xmin   = 15 –  6 = 9.

      Мода Мо = 11, это варианта   х 3 = 11, у которой самая большая частота   n 3 = 8. 

      Медиана Ме = (8+11)/2 = 9,5, это полусумма двух вариант, стоящих в середине вариационного ряда. Так как всего вариант         n  = 20,  то в середине стоят две варианты: х 10 = 8 и х 11 = 11.

      Среднее выборочное значение:

 

        Выборочная дисперсия: ) 2.

      Для ее вычисления найдем сначала среднее выборочное квадратов значений признака:  

= (62·3 + 82·7 + 112·8 + 152·2) =  = 98,7,

тогда                                = 98,7 – 9,62 = 6,54.

     Среднее выборочное квадратическое отклонение:

σ в =  = ≈ 2,557.

 

Ответы: R  = 9;   Мо  = 11;   Ме =  9,5;  = 9,6;  6,54; σ в = 2,557.

     Задача 2. Имеются выборочные данные интервального статистического распределения значений  признака Х:

Х 8 – 12 12 – 16 16 – 20 20 – 24 24 – 28
ni 6 16 30 24 4

      Вычислить выборочную среднюю, выборочную дисперсию и выборочное среднее квадратическое отклонение данного распределения.

      Решение. В качестве значений х i    признака Х возьмем середины интервалов. Получим дискретное статистическое распределение:

х i 10 14 18 22 26
ni 6 16 30 24 4

 

       Объем выборки   n = 6 +16 + 30 + 24 + 4 = 80.

        Среднее выборочное значение:

 = (10·6 + 14·16 + 18·30 + 22·24 + 26·4) =  = 18,2.

     Среднее выборочное квадратов значений

 ·(102·6+142·16+182·30+222·24+262·4) =  = 347,2.

    Выборочная дисперсия:

)2 = 347,2 –18,22 =15,96.

    Выборочное среднее квадратическое отклонение:

σ в =  = ≈ 3,995.

 

Ответы: = 18,2;  347,2; σ в =3,995.  


 

       Задача 3. Имеются данные о месячной зарплате в тыс. руб. для каждого из 25 случайно отобранных работников хозяйства:

35,1 23,0 22,3 28,2 29,3 32,2 26,8 27,4 20,5 18,6

32,4 22,8 42,2 37,6 35,3 29,6 26,7 30,0 15,4 16,8

40,2 25,0 49,8 25,6 32,3.

    Составить интервальное статистическое распределение выборочных данных. Найти распределение относительных частот по интервалам и построить гистограмму относительных частот.

    Вычислить выборочную среднюю, выборочную дисперсию и выборочное среднее квадратическое отклонение построенного распределения.

Решение. Обозначим Х – месячную зарплату работников, тыс. руб. Объем выборки n = 25. Найдем самое маленькое и самое большое значения признака Х: xmin   = 15,4; xmax  = 49,8.

Округлим до целых чисел найденные значения xmin  с недостатком, а  xmax  с избытком. Получим промежуток от 15 до 50, куда попадут все значения признака Х. Разобьем отрезок [15; 50] на интервалы равной длины. Учитывая, что длина промежутка 50 – 15 = 35, разобьем его для удобства на 7 частей. Тогда шаг разбиения будет равен h =  = 5. Заполним таблицу, в верхней строке которой перечислим полученные интервалы. Просматривая последовательно данные значения признака Х, будем проставлять «1» в соответствующий интервал, куда они попадают. Пограничные значения относим к правому интервалу:

 

Х

15– 20

20– 25

25– 30

30– 35

35– 40

40– 45

45– 50

ni

111

1111

11111111

1111

111

11

1  
                               

     Подсчитаем количество единиц в каждом интервале и запишем полученное интервальное статистическое распределение выборочных данных:

X

15– 20

20– 25

25– 30

30– 35 35– 40 40– 45

45– 50

ni

3

4

8

4

3 2 1  
                         

     Контроль: объем выборки n = 3+4+8+4+3+2+1=25, что совпадает с данными задачи.

          Найдем относительные частоты   =  =  ,  а также укажем плотности этих частот = , нужные для построения гистограммы (рис. 5):

 

Х 15– 20 20– 25 25– 30 30– 35 35– 40 40– 45

45– 50

Wi 0,12 0,16 0,32 0,16 0,12 0,08 0,04  
Wi /  h 0,024 0,032 0,064 0,032 0,024 0,016 0,008  

 

 

 

 

 

Рис. 5.  Гистограмма относительных частот

     Для вычисления основных числовых характеристик выборки перейдём к дискретному статистическому распределению абсолютных частот, выбрав в качестве значений х i    признака Х середины интервалов:

xi 17,5 22,5 27,5 32,5 37,5 42,5 47,5
ni 3 4 8 4 3 2 1

  Среднее выборочное значение:

(17,5·3+22,5·4+27,5·8+32,5·4+37,5·3+42,5·2+47,5·1) =

 = 29,5.

 Среднее выборочное квадратов значений

 ·(17,52·3+22,52·4+27,52·8+32,52·4+37,52·3+42,52·2+47,52·1)=  =  = 932,25.

Выборочная дисперсия: )2 = 932,25 –29,52 = 62.

Выборочное среднее квадратическое отклонение:

σ в =  = ≈ 7,874.

 

 

7.8 Вопросы и задачи для самостоятельного решения

Контрольные вопросы

1. Каковы основные задачи математической статистики?

2. Генеральная и выборочная совокупности, их объемы.

3. В чем состоит сущность выборочного метода?

4. Что означает  свойство  репрезентативности  выборки?

5. Назовите виды выборок и способы отбора.

6. Как записать результаты выборки? Поясните понятия: варианта, ранжирование, вариационный ряд.

7. Что собой представляет статистическое распределение выборки?

8. Что такое абсолютная и относительная частоты статистического распределения?

 9. Чему равны суммы абсолютных и относительных частот?

10. Как построить полигон дискретного статистического распределения выборки?

11.Что такое интервальное статистическое распределение выборки? Когда оно используется?

12. Что такое плотность частоты?

13. Как графически изображается интервальное статистическое распределение выборки?

14. Как от интервального статистического распределения выборки перейти к дискретному распределению?

15. Назовите основные характеристики выборки.

16. Как найти размах варьирования R, моду Мо и медиану Ме выборочного дискретного статистического распределения?

17. Как вычисляется выборочная средняя?

18. Понятие выборочной дисперсии, ее смысл.

19. Назовите способы вычисления выборочной дисперсии и запишите соответствующие формулы.

20. Что называется выборочным средним квадратическим отклонением, каков смысл этой характеристики?

21. Назовите средние характеристики выборки и показатели вариации.

Задачи

     1. Имеются данные выборки: 7; 3; 7; 4; 7; 3; 7; 4;  4; 7; 6. Нужно ранжировать их по неубыванию, составить статистическое распределение выборки, указать ее объем и построить полигон абсолютных частот.

Ответ:

х i 3 4 6 7
ni 2 3 1 5

     2. Ранжировать данные выборки  8; 8; 2; 12; 8; 12; 8; 2; 2; 8 и записать ее статистическое распределение. Найти объем выборки и относительные частоты. Построить полигон относительных частот.

Ответ:

х i 2 8 12
Wi 0,3 0,5 0,2

       

    3. Построить полигон относительных частот по данному статистическому распределению выборки:

х i 1 4 5 7
ni 20 10 14 6

Ответ:   W  = {0,4; 0,2; 0,28; 0,12}.                          

     4. Имеются данные интервального статистического распределения 50 студентов потока по росту Х (см):

Х [140–150) [150–160) [160–170) [170–180) [180–190) [190–200)
ni 3 10 18 12 5 2

     Найти распределение относительных частот и построить их гистограмму.

Ответ: W   ={0,06; 0,20; 0,36; 0,24; 0,10; 0,04}.

 

     5. Имеются данные о времени обработки одной детали, мин.:

              2,1 3,0 4,5 6,2 7,4 7,0 5,3 9,8 7,7 5,9

              5,2 4,9 3,8 5,1 4,6 8,1 7,2 5,8 4,0 6,3.

     Составить интервальное статистическое распределение выборочных данных, разбив промежуток времени от 2 до 10 мин. на четыре равные части. Найти объем выборки, распределение абсолютных и относительных частот по интервалам и построить гистограмму относительных частот.

Ответ:

х i 2 – 4 4 – 6 6 – 8 8 – 10
ni 3 9 6 2
Wi 0,15 0,45 0,3 0,1

 

      6. По данному распределению выборки найти плотности абсолютных частот и построить гистограмму абсолютных частот:

Х 1 – 5 5 – 9 9 – 13 13 – 17 17 – 21
ni 10 20 50 12 8

Ответ: n i / h ={2,5; 5; 12,5; 3; 2}.

 

     7. По данному распределению выборки найти плотности относительных частот и построить гистограмму относительных частот:

Х 2 – 4 4 – 6 6 – 8
ni 20 50 30

Ответ: W / h ={0,1; 0,25; 0,15}.

 

      8. Найти средние характеристики (моду, медиану и средне взвешенное арифметическое значение) данного статистического распределения:

х i  5  10 15 20 25
ni 1 5 14 7 3

Ответы: Mo = 15;    Me = 15; = 16.

 

     9. Найти характеристики рассеяния (размах варьирования, дисперсию и среднее квадратическое отклонение) данного статистического распределения:

х i 2 5 7 12
ni 2 9 8 1

Ответы: R = 10;  = 4,2275;   =  2,056.

     10. Результаты контрольной работы по математике записаны в виде статистического распределения:

х i 2 3 4 5
ni 4 8 5 3

     Найти все числовые характеристики этого распределения.

Ответы: R = 3;   Mo = 3; Me = 3;  = 3,35;  = 0,9275;  = 0,963.

 

     11. Имеются данные о количестве пар мужской обуви по размеру Х, проданных за сутки:

хi 38 39 40 41 42 43
ni 6 9 26 31 37 11

    Вычислить выборочную среднюю, выборочную дисперсию и выборочное среднее квадратическое отклонение данного распределения.

Ответы: = 40,975;  = 1,641;  = 1,281. 

   

     12. Имеются выборочные данные интервального статистического распределения значений признака Х:

Х 10 – 14 14 – 18 18 – 22 22 – 26 26 – 30
ni 1 5 8 4 2

      Вычислить выборочную среднюю, выборочную дисперсию и выборочное среднее квадратическое отклонение данного распределения.

У к а з а н и е. В качестве значений х i    признака Х берите середины интервалов.

Ответы:  =  20,2;  16,76;  =  4,094.      

      


 


Поделиться с друзьями:

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...

История создания датчика движения: Первый прибор для обнаружения движения был изобретен немецким физиком Генрихом Герцем...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.146 с.