Выборка: виды, алгоритмы формирования выборки. Объем и ошибка выборки. — КиберПедия 

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

Выборка: виды, алгоритмы формирования выборки. Объем и ошибка выборки.

2017-11-16 246
Выборка: виды, алгоритмы формирования выборки. Объем и ошибка выборки. 0.00 из 5.00 0 оценок
Заказать работу

Выборка или выборочная совокупность — это необходимый для социологического исследования минимум результатов (случаев, испытуемых, объектов, событий, образцов) отобранных с помощью определённой процедуры из генеральной совокупности.

Выборка – самая представительная часть ген. Сов-ти, в которой закон распределения признака соответствует таковому в генеральной совокупности.

Генеральная совокупность – объект исследования, который локализован территориально, во времени, по дем. И соц. Признакам и на который распространяются выводы исследования.

Единицы наблюдения – элементы выборочной совокупности, подлежащие изучению (респонденты).

Характеристики выборки:

· Качественная характеристика выборки – что именно мы выбираем и какие способы построения выборки мы для этого используем.

· Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

Объём выборки — количество единиц в выборочной совокупности. Из статистических соображений рекомендуетс 2020я, чтобы число случаев составляло не менее 30—35.

По способу отбора (способу формирования) выборки единиц из генеральной совокупности распространены следующие виды выборочного наблюдения:

o простая случайная выборка (собственно-случайная);

o типическая (стратифицированная);

o серийная (гнездовая);

o механическая;

o комбинированная;

o ступенчатая.

Простая случайная выборка (собственно-случайная) есть отбор единиц из генеральной совокупности путем случайного отбора, но при условии вероятности выбора любой единицы из генеральной совокупности. Отбор проводится методом жеребьевки или по таблице случайных чисел.

Типическая (стратифицированная) выборка предполагает разделение неоднородной генеральной совокупности на типологические или районированные группы по какому-либо существенному признаку, после чего из каждой группы производится случайный отбор единиц.

Для серийной (гнездовой) выборки характерно то, что генеральная совокупность первоначально разбивается на определенные равновеликие или неравновеликие серии (единицы внутри серий связаны по определенному признаку), из которых путем случайного отбора отбираются серии и затем внутри отобранных серий проводится сплошное наблюдение.

Механическая выборка представляет собой отбор единиц через равные промежутки (по алфавиту, через временные промежутки, по пространственному способу и т.д.). При проведении механического отбора генеральная совокупность разбивается на равные по численности группы, из которых затем отбирается по одной единице.

Комбинированная выборка основана на сочетании нескольких способов выборки.

Многоступенчатая выборка есть образование внутри генеральной совокупности вначале крупных групп единиц, из которых образуются группы, меньшие по объему, и так до тех пор, пока не будут отобраны те группы или отдельные единицы, которые необходимо исследовать.

Выборочный отбор может быть повторным и бесповторным. При повторном отборе вероятность выбора любой единицы не ограничена. При бесповторном отборе выбранная единица в исходную совокупность не возвращается.

Для отобранных единиц рассчитываются обобщенные показатели (средние или относительные) и в дальнейшем результаты выборочного исследования распространяются на всю генеральную совокупность.

Основной задачей при выборочном исследовании является определение ошибок выборки. Принято различать среднюю и предельную ошибки выборки. Для иллюстрации можно предложить расчет ошибки выборки на примере простого случайного отбора.

Расчет средней ошибки повторной простой случайной выборки производится следующим образом:

cредняя ошибка для средней

(11.1)

cредняя ошибка для доли

(11.2)

Расчет средней ошибки бесповторной случайной выборки:

средняя ошибка для средней

(11.3)

средняя ошибка для доли

(11.4)

Расчет предельной ошибки повторной случайной выборки:

предельная ошибка для средней

предельная ошибка для доли

(11.5)

где t - коэффициент кратности;

Расчет предельной ошибки бесповторной случайной выборки:

предельная ошибка для средней

(11.6)

предельная ошибка для доли

(11.7)

Следует обратить внимание на то, что под знаком радикала в формулах при бесповторном отборе появляется множитель, где N - численность генеральной совокупности.

Что касается расчета ошибки выборки в других видах выборочного отбора (например, типической и серийной), то необходимо отметить следующее.

Для типической выборки величина стандартной ошибки зависит от точности определения групповых средних. Так, в формуле предельной ошибки типической выборки учитывается средняя из групповых дисперсий, т.е.

(11.8)

При серийной выборке величина ошибки выборки зависит не от числа исследуемых единиц, а от числа обследованных серий (s) и от величины межгрупповой дисперсии:

(11.9)

Серийная выборка, как правило, проводится как бесповторная, и формула ошибки выборки в этом случае имеет вид

(11.10)

где - межсерийная дисперсия; s - число отобранных серий; S - число серий в генеральной совокупности.

Все вышеприведенные формулы применимы для большой выборки. Кроме большой выборки используются так называемые малые выборки (n < 30), которые могут иметь место в случаях нецелесообразности использования больших выборок.

При расчете ошибок малой выборки необходимо учесть два момента:

1) формула средней ошибки имеет вид

(11.11)

2) при определении доверительных интервалов исследуемого показателя в генеральной совокупности или при нахождении вероятности допуска той или иной ошибки необходимо использовать таблицы вероятности Стьюдента, где Р = S (t, n), при этом Р определяется в зависимости от объема выборки и t.

Ошибки выборки

При любом статистическом наблюдении (сплошном и выборочном) могут встретиться ошибки двух видов: регистрации и репрезентативности. Ошибки регистрации могут иметь случайный и систематический характер. Случайные ошибки складываются из множества различных неконтролируемых причин, носят непреднамеренный характер и обычно по совокупности уравновешивают друг друга (например, изменения показателей прибора при температурных колебаниях в помещении).

Систематические ошибки тенденциозны, так как нарушают правила отбора объектов в выборку (например, отклонения в измерениях при изменении настройки измерительного прибора).

Пример. Для оценки социального положения населения в городе предусмотрено обследовать 25% семей. Если при этом выбор каждой четвертой квартиры основан на ее номере, то существует опасность отобрать все квартиры только одного типа (например, однокомнатные), что обеспечит систематическую ошибку и исказит результаты; выбор же номера квартиры по жребию более предпочтителен, так как ошибка будет случайной.

Ошибки репрезентативности присущи только выборочному наблюдению, их невозможно избежать и они возникают в результате того, что выборочная совокупность не полностью воспроизводит генеральную. Значения показателей, получаемых по выборке, отличаются от показателей этих же величин в генеральной совокупности (или получаемых при сплошном наблюдении).

Ошибка выборочного наблюдения есть разность между значением параметра в генеральной совокупности и ее выборочным значением. Для среднего значения количественного признака она равна: , а для доли (альтернативного признака) — .

Ошибки выборки свойственны только выборочным наблюдениям. Чем больше эти ошибки, тем больше эмпирическое распределение отличается от теоретического. Параметры эмпирического распределения и являются случайными величинами, следовательно, ошибки выборки также являются случайными величинами, могут принимать для разных выборок разные значения и поэтому принято вычислять среднюю ошибку.

Средняя ошибка выборки есть величина , выражающая среднее квадратическое отклонение выборочной средней от математического ожидания. Эта величина при соблюдении принципа случайного отбора зависит прежде всего от объема выборки и от степени варьирования признака: чем больше и чем меньше вариация признака (следовательно, и значение ), тем меньше величина средней ошибки выборки . Соотношение между дисперсиями генеральной и выборочной совокупностей выражается формулой:

т.е. при достаточно больших можно считать, что . Средняя ошибка выборки показывает возможные отклонения параметра выборочной совокупности от параметра генеральной. В табл. 9.2 приведены выражения для вычисления средней ошибки выборки при разных методах организации наблюдения.

Таблица 9.2 Средняя ошибка (m) выборочных средней и доли для разных видов выборки

Где - средняя из внутригрупповых выборочных дисперсий для непрерывного признака;

- средняя из внутригрупповых дисперсий доли;

— число отобранных серий, — общее число серий;

,

где — средняя -й серии;

— общая средняя по всей выборочной совокупности для непрерывного признака;

,

где — доля признака в -й серии;

— общая доля признака по всей выборочной совокупности.

Однако о величине средней ошибки можно судить лишь с определенной, вероятностью Р (Р ≤ 1). Ляпунов А.М. доказал, что распределение выборочных средних , a следовательно, и их отклонений от генеральной средней, при достаточно большом числе приближенно подчиняется нормальному закону распределения при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.

Математически это утверждение для средней выражается в виде:

а для доли выражение (1) примет вид:

где - есть предельная ошибка выборки, которая кратна величине средней ошибки выборки , а коэффициент кратности — есть критерий Стьюдента ("коэффициент доверия"), предложенный У.С. Госсетом (псевдоним "Student"); значения для разного объема выборки хранятся в специальной таблице.

Значения функции Ф(t) при некоторых значениях t равны:

Следовательно, выражение (3) может быть прочитано так: с вероятностью Р = 0,683 (68,3%) можно утверждать, что разность между выборочной и генеральной средней не превысит одной величины средней ошибки m (t = 1), с вероятностью Р = 0,954 (95,4%) — что она не превысит величины двух средних ошибок m (t = 2), с вероятностью Р = 0,997 (99,7%) — не превысит трех значений m (t = 3). Таким образом, вероятность того, что эта разность превысит трехкратную величину средней ошибки определяет уровень ошибки и составляет не более 0,3%.

В табл. 9.3 приведены формулы для вычисления предельной ошибки выборки.

Таблица 9.3 Предельная ошибка (D) выборки для средней и доли (р) для разных видов выборочного наблюдения

Необходимый объем выборки

Таблица 9.4 Необходимый объем (n) выборки для разных видов организации выборочного наблюдения

 

 

21. Многоступенчатая выборка предполагает извлечение из генераль­ной совокупности сначала укрупненных групп единиц, затем групп, меньших по объему, и так до тех пор, пока не будут отобраны те группы (серии) или отдельные единицы, которые будут подвергну­ты наблюдению. Выборка может быть двухступенчатой, когда гене­ральная совокупность разбивается на группы и производится отбор групп, а затем внутри групп — отбор единиц наблюдения. На обе­их ступенях отбор может вестись в случайном порядке.

В отличие от типического отбора, где отбор производится из всех без исключения групп, при многоступенчатом отборе произ­водится отбор самих групп, и, следовательно, не все они попада­ют в выборку.

Число ступеней отбора может быть и более трех

 

 

 

 


Многоступенчатый способ формирования выборочной совокупности. Большинство выборок в социологии носит многоступенчатый характер обусловлено необходимостью экономить ресурсы и время, а так же организованным возможностям, но нужно помнить что с помощью числа отбора снижается репрезентативность, поэтому не используют больше 4-х мах ступеней Тип или способ диктуется целями и задачами отбора выбор типа отбора обосновывается в программе исследования процедуры(методы программы). Этапы построения выборки. 1)один алгоритм выборки зависит от сложности объекта об общих теоретических построения выборки. Объект конкретизирует, уточняет представление о (гс). В случае если полная основа выборки недоступна (т.е случайный отбор невозможен)значимые(выбор) задачи исследования с точки зрения критерия для построения и стратифицированной или квотной выборки чаще всего выступают со. Демократические признаки. 2 этап. Определение объёма выборки, величина выборочной совокупности Факторы - требования точность результатов исследования, чем точнее мы хотим получить результаты, тем больше объём. Степень точности выбирается заранее с помощью расчёта ошибок выборки. Чем меньше ошибка выборки (относительно параметров выборочной совокупности от генеральной), тем точнее исследование т.е выборка. Существует классификация по степени, если ошибки выборки 3% и меньше,такие сверх надёжные; 3-5% надёжное исследование, 5-10% прикидочное, 10-20% ориентировочное исследование, больше 20 неточный результат, требуется точность, а следует величина ошибки выборки определяется задачами исследования. -Степень однородности (гс), Чем однородней (гс), тем меньше объём выборки можно взять. -Предполагаем дробность анализа данным чем более дробный тем больше выборки надо взять т.е увеличение подгрупп в анализе ведёт к увеличению, объёма выборки.. 3 этап: Сбор сведений о распределение значимых признаков совокупности, выбор числа ступени отбора, определения способа и единиц отбора на каждой ступени. 4 этап: Составление основы выборки если на последний ступени предполагается случайный или механический отбор. Требования к основе выборки 1) Полнота (полный список всех единиц (ГС). 2) Отсутствия дублирования (повторения нескольких элементов). 3) Адекватность с реальностью. 4) Удобство в использовании. В качестве основы выборки могут выступать любые документы.(деканат, избирательные участки списки).
ВЫБОРКА МНОГОСТУПЕНЧАТАЯ

частный случай выборки кластерной, метод отбора, при котором на каждой, кроме последней, ступени построения выборки объекты группируются в некоторые структурные единицы (кластеры), среди которых и производится отбор. На всех предшествующих ступенях производится отбор кластеров, которые объединяют некоторое количество единиц наблюдения, но сами являются только единицами отбора (в англоязычной литературе по отношению к человеческим генеральным совокупностям иногда применяется термин "выборочная точка" - sampling point).
В.М. рекомендуется применять:
1) если генеральная совокупность велика и имеет сложную многоуровневую структуру;
2) если средства на исследование ограничены;
3) если в разных частях генеральной совокупности целесообразно применять различные методы отбора.

 


Поделиться с друзьями:

Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...

Своеобразие русской архитектуры: Основной материал – дерево – быстрота постройки, но недолговечность и необходимость деления...

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.035 с.