Определение необходимой численности выборки — КиберПедия 

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначен­ные для поддерживания проводов на необходимой высоте над землей, водой...

Определение необходимой численности выборки

2022-11-14 217
Определение необходимой численности выборки 0.00 из 5.00 0 оценок
Заказать работу

Для определения необходимой численности выборки нужно задать уровень точности выборочной совокупности с определённой вероятностью. В частности, необходимая численность случайной повторной выборки определяется по формуле , которая вытекает из формулы предельной ошибки: .

При проектировании выборочного наблюдения предполагаются заранее заданными величина допустимой ошибки в соответствии с задачами конкретного исследования  и вероятность выводов по результатам наблюдения . Величина , характеризующая дисперсию признака в генеральной совокупности, зачастую бывает неизвестна. Поэтому используют приближённые оценки генеральной дисперсии.

1. Исходя из результатов специально организованного пробного обследования (обычно небольшого объёма), на базе которого определяется величина дисперсии признака, используемая в качестве оценки генеральной совокупности: ,

где  − средняя арифметическая по результатам пробного обследования;

       −  число единиц, попавших в пробное обследование.

По данным нескольких пробных обследований выбирается наименьшее значение.

2. Опираясь на данные предыдущих обследований как выборочных, так и сплошных, проводившихся в аналогичных целях. Дисперсию изучаемого признака в выборке можно оценить по коэффициенту вариации, значение которого получено по итогам предшествующего сплошного или выборочного наблюдения. Коэффициент вариации v=  Следовательно, дисперсия будет равна

3. Зная примерную величину средней дисперсии, находят дисперсию из соотношения .

4. Если известны и , то можно определить среднее квадра-тическое отклонение в соответствии с правилом «трёх сигм»

,

где  – размах вариации.

Размах вариации при нормальном распределении примерно равен 6  (крайние значения отстоят в ту и другую сторону от средней на расстоянии 3 ).

Например, сколько операционистов нужно обследовать в банках региона, чтобы получить характеристику среднего уровня оплаты труда этой категории работников банков в регионе?

Предположим, разница между наивысшим и наименьшим уровнем оплаты труда операциониста в регионе составляет 3 000 руб. Для нормального распределения в промежутках х  включается 99,7% всех вариантов значений признака, а это означает применительно к рассматриваемой задаче, что 3 000 руб. примерно 6  (3 000 ). Поэтому примерная оценка среднеквадратического отклонения заработной платы в генеральной совокупности операциониста региона составит 500 руб.   ( =3 000/6). Для дальнейших расчётов достаточно, чтобы с вероятностью 0,954 предельная ошибка выборки не превышала 100 руб.

Тогда, зная, что =500 руб., а t=2. Следовательно,

человек.

Таким образом, при заданных условиях нужно обследовать размер заработной платы у 100 операционистов региона.

5. Если распределение заведомо асимметричное, то .

6. Для относительной величины принимают максимальную величину дисперсии =0,25,

где  − максимальная доля альтернативного признака.

На практике величина допустимой ошибки выборки, как правило, устанавливается не в абсолютном, а в относительном выражении: она рассчитывается как отношение ошибки к исследуемому параметру:

.

.

Существует градация надёжности результатов выборочного обследования:

1) повышенная надёжность допускает ошибку выборки до 3%;

2) обыкновенная 3 − 10%;

3) приближённая 10 − 20%;

4) ориентировочная 20 − 40%;

5) прикидочная более 40%.Выборка считается репрезентативной, если .

Формулу для определения необходимой численности выборки при собственно случайном повторном отборе можно представить следующим образом: ,

так как , то

Например. Для изучения товарооборота по выделенной товарной группе планируется провести обследование торговых предприятий региона. Сколько предприятий розничной торговли необходимо обследовать, если по данным предшествующего обследования известно, что коэффициент вариации товарооборота по данной группе товаров составляет 90%, а предельная относительная ошибка выборки с вероятностью 0,95 не должна превысить 5%?

При Р=0,95 коэффициент доверия t=1,96 (Приложение Г). Следовательно,  то есть при повторном отборе необходимо обследовать 1 245 торговых предприятий.

Предельная ошибка выборки при собственно-случайном или механическом бесповторном отборе рассчитывается по формуле  поэтому необходимая для достижения заданной ошибки численность выборки .

Если задана предельная относительная ошибка выборки и известен коэффициент вариации, то численность выборки определяется по формуле

.

При бесповторном отборе для нахождения доли альтернативного признака необходимая численность выборки

где  − дисперсия альтернативного признака в выборочной совокупности (в генеральной ).

Например. Исходя из условия предыдущего примера, но зная, что общее число торговых предприятий, осуществляющих продажу товаров изучаемой группы, составляет 15 тыс. единиц, объём выборки при бесповторном отборе рассчитывают следующим образом:

 единиц,

то есть выборка должна быть 8% ( %).

Как правило, цель выборочного обследования – определить пределы, в которых находится в генеральной совокупности не один, а несколько показателей. В таком случае дисперсия для каждого из них будет различна, соответственно будет различаться и необходимая численность выборки. Число обследуемых единиц будет максимально при изучении показателя с максимальной дисперсией. Соответственно и необходимая численность выборки должна быть принята на максимальном уровне из всех рассчитанных.

В таблице 1.5.1 приведены формулы для нахождения необходимой численности выборки при разных способах отбора, где средняя из групповых дисперсий для средней и для доли в генеральной совокупности;   − межсерийная дисперсия для средней и для доли в генеральной совокупности.

 

Задачи

6.1. Для определения средней длины детали необходимо провести выборочное обследование методом случайного повторного отбора. Какое количество деталей надо отобрать, чтобы ошибка выборки не превышала 2 мм с вероятностью 0,954 при среднем квадратическом отклонении 8 мм?

6.2. Определите численность выборки по следующим данным. Для определения средней цены говядины на рынках города предполагается произвести выборочную регистрацию цен. Известно, цены на говядину колеблются от 80 до 100 руб. за 1 кг. Сколько торговых точек необходимо обследовать, чтобы с вероятностью 0,954 ошибка выборки при определении средней цены не превышала 2 руб. за 1 кг?

 

6.3. Сколько рабочих завода нужно обследовать в порядке случайной выборки для определения средней заработной платы (по отрасли средняя заработная плата составляет 34 500 руб.), чтобы с вероятностью, равной 0,954, можно было гарантировать ошибку не более 0,1% при среднеквадратическом отклонении 20 рублей?

6.4. В порядке собственно-случайной выборки предлагается определить долю семей с числом детей три и более. Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала 0,02, если на основе предыдущих обследований известно, что дисперсия равна 0,2?

 

6.5. Сколько фирм необходимо проверить налоговой инспекции района, чтобы ошибка доли фирм, несвоевременно уплачивающих налоги, не превысила 5%? По данным предыдущей проверки, доли таких фирм составила 32%. Доверительную вероятность принять равной 0,954 (0,997).

 

6.6. На предприятии с числом работающих 2 500 человек провели выборочный опрос о занятиях спортом в выходные дни. Из 500 опрошенных 100 человек регулярно занимаются спортом в выходные дни. Какова численность работников предприятия, занимающихся спортом? Ответ дайте с вероятностью 0,90.

 

6.7. На основе выборочного обследования в отделении связи города предполагается определить долю писем частных лиц в общем объёме отправляемой корреспонденции. Никаких предварительных данных об удельном весе этих писем в общей массе отправляемой корреспонденции не имеется. Требуется определить численность выборки, если результаты выборки нужно дать с точностью до 1% и гарантировать это с вероятностью 0,95.


Таблица 1.6.1 − Формулы для нахождения необходимой численность выборки при разных способах отбора

 

Виды выборочного наблюдения

Способ отбора

Повторный

бесповторный

для средней для доли для средней для доли
1. Собственно-случайная выборка
2. Механическая выборка - -
3. Типическая выборка
4. Серийная выборка

 

Примечание. При серийном отборе на основе приведённых формул определяется число серий (r), которое необходимо обследовать, так как они являются единицей наблюдения при данном способе отбора. R  –  число серий в генеральной совокупности.


6.8. Для определения средней продолжительности телефонного разговора и доли разговоров, продолжительность которых превышает 5 мин, предполагается провести выборочное наблюдение методом случайной выборки. По данным аналогичных обследований, среднее квадратическое отклонение продолжительности разговора составило 3,5 мин, а доля телефонных разговоров, продолжительность которых превышает 5 мин, составила 0,4. Сколько телефонных разговоров необходимо обследовать для того, чтобы с вероятностью 0,954 (0,997) найти среднюю продолжительность телефонного разговора, с ошибкой, не превышающей 30 с, а также долю телефонных разговоров, продолжительность которых превышает 5 мин, с ошибкой, не превышающей 5%?

 

6.9. При обследовании жилищ в городе был произведён механический отбор по списку всех домов с долей отбора, равной 1/50. Из общего числа домов в выборке, равного 8 491, нуждались в ремонте? Ответ дайте с вероятностью 0,997.

 

6.10. Для установления среднего возраста 50 тыс. читателей библиотеки необходимо провести выборку из читательских карточек методом механического отбора. Предварительно установлено, что среднее квадратическое отклонение возраста читателей равно 10 годам. Опреде-лите необходимую численность выборки при условии, что с вероятностью 0,954 ошибка выборки будет не более двух лет.

 

6.11. Для определения среднего возраста 1 200 студентов факультета необходимо провести выборочное обследование методом случайного бесповторного отбора. Предварительно установлено, что среднее квадратическое отклонение возраста студентов равно 10 годам. Сколько студентов нужно обследовать, чтобы с вероятностью 0,954 средняя ошибка выборки не превышала 3 года?

 

6.12. На предприятии с числом установленных металлорежущих станков 120 единиц необходимо на основе выборочного обследования определить долю станков возрастом свыше 10 лет. Никаких предварительных данных об удельном весе этого оборудования в общей численности установленного оборудования нет.

Определить, каков должен быть объём выборки с механическим отбором, чтобы при вероятности 0,954 предельная ошибка выборки не превышала 5%.

 

6.13. Какова должна быть численность механической выборки для определения доли служащих, прошедших повышение квалификации по использованию вычислительной техники, чтобы с вероятностью 0,954 ошибка репрезентативности не превышала 10%? Общая численность служащих предприятия составляет 324 человека.

 

6.14. Для изучения успеваемости студентов экономического вуза по предмету статистика планируется провести обследование. Сколько студентов необходимо обследовать, если по данным предыдущих обследований известно, что коэффициент вариации успеваемости составляет 20%, средний балл – 3,9, а предельная ошибка с вероятностью 0,954 не должна превысить 0,3 балла.

 

6.15. В городе зарегистрировано 30 тыс. безработных. Для определения средней продолжительности безработицы организуется выборочное обследование. По данным прошлых лет известно, что коэффициент вариации продолжительности безработицы составляет 40%. Какое число безработных необходимо охватить выборочным наблюдением, чтобы с вероятностью 0,997 утверждать, что полученная ошибка выборки не превышает 5% средней продолжительности безработицы.

 

6.16. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1 000 и получены следующие данные об их доходе за октябрь:

Месячный доход 25 000 − 29 000 29 000 − 33 000 33 000 −37 000 41 000 − 45 000
Число рабочих 12 60 20 8

Определите: 1) среднемесячный размер дохода из работников данного предприятия, гарантируя результат с вероятностью 0,997; 2) долю рабочих предприятия, имеющих месячный доход 33 000 руб. и выше, гарантируя результат с вероятностью 0,954; 3) необходимую численность выборки при определении среднего месячного дохода работников предприятия, чтобы с вероятностью 0,954 предельная ошибка выборки не превышала 50 руб.; 4) необходимую численность выборки при определении доли рабочих с размером месячного дохода 33 000 руб. и выше, чтобы с вероятностью 0,954 предельная ошибка не превышала 4%.

 

6.17. Произведён 10%-й пропорциональный типический отбор рабочих со сдельной и повременной системами оплаты труда для изучения показателей выполнения сменного задания. Отбор единиц в каждой группе бесповторный. Выборка дала следующее распределение численности рабочих по проценту выполнения норм выработки:

Группа рабочих по оплате труда

Группа рабочих по проценту выполнения сменного задания, %

Итого рабочих

до 100 100 − 120 120 − 140 140 и выше
Рабочие сдельщики 20 150 80 30 280
Рабочие повременщики 40 100 60 20 220
Итого 60 250 140 50 500

Определите: 1) доверительные интервалы, в которых с вероятностью 0,954 заключён средний процент выполнения сменного задания для всех рабочих предприятия; 2) возможные пределы доли рабочих, выполняющих сменное задание не менее чем 120% (с вероятностью 0,954); 3) необходимую численность выборки при определении доли рабочих, выполняющих сменное задание не менее чем на 120%, чтобы с вероятностью 0,954 предельная ошибка выборки не превышала 3%.

6.18. 300 работников аппаратного цеха предприятия разделены на 15 бригад по 20 человек в каждой. При определении среднего стажа работы произведена 20%-я бесповторная серийная выборка. В выборку попали 3 бригады, в которых средний стаж работы составил: в первой – 8 лет, во второй – 12, в третьей – 10. Определите межсерийную дисперсию и объём выборки, при котором с вероятностью 0,997 средний стаж работы в отобранных сериях не будет отклоняться от среднего стажа всех работников более чем на 5 %.

 

6.19. Организована двухфазная механическая выборка. Из генеральной совокупности в 10 000 единиц на первой фазе отобрано 1 000 единиц. Установлено, что дисперсия исследованного на первой фазе признака равна 500. Определите: а) абсолютную ошибку на первой фазе выборки, гарантируя результат с вероятностью 0,997; б) сколько единиц нужно отобрать на второй фазе выборки, чтобы относительная ошибка не превышала 10%, гарантируя результат с вероятностью 0,954. Известно, что коэффициент вариации признака, исследуемого на второй фазе выборки равен 0,5.

 


Поделиться с друзьями:

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

Индивидуальные очистные сооружения: К классу индивидуальных очистных сооружений относят сооружения, пропускная способность которых...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.043 с.