Числовые характеристики выборки — КиберПедия 

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Числовые характеристики выборки

2017-09-30 72
Числовые характеристики выборки 0.00 из 5.00 0 оценок
Заказать работу

Наиболее важную из содержащихся в распределении информации можно охарактеризовать при помощи численных величин, отвечающих на следующие вопросы:

1. Какая величина, лежащая в диапазоне наблюдённых значений, лучше всего характеризует наблюдения?

2. Насколько далеко друг от друга лежат наблюдённые значения?

3. В какой мере рассеивание, имеющее место по обеим сторонам от некоторого центрального значения, отличается от симметричного?

4. В какой мере рассеивание характеризуется необычно большими отклонениями?

В количественном выражении ответы на эти вопросы дают величины, известные под названием:

1) Характеристика расположения или среднее значение выборки;

2) Характеристика рассеивания или дисперсия;

3) Характеристика асимметрии или асимметрия;

4) Характеристика островершинности или эксцесс.

Последние две характеристики характеризуют форму распределения.

Математическое ожидание есть характеристика расположения значений случайной величины, среднее значение ее распределения. В этом качестве математическое ожидание служит некоторым "типичным" параметром распределения и его роль аналогична роли координаты центра тяжести распределения массы в механике.

Основным условием использования того или иного вида средних является определенная качественная однородность изучаемой совокупности объектов. Главной определяющей чертой такой однородности является справедливость предположения о том, что вариация рассматриваемого признака носит характер случайности по отношению к тем условиям, которые определяют основные черты характеризуемого с помощью средней распределения. Другими словами, отклонения значений признака от среднего уровня в однородной совокупности можно считать случайными. Используя различные средние в социологических исследованиях, необходимо иметь в виду, что выбор среднего в значительной мере зависит от типа тех шкал, по которым получены исходные данные.

Средняя арифметическая особо чувствительна к экстремальным (выделяющимся) значениям в одном из направлений, которые называются смещенными данными. Выделяющиеся большие значения увеличивают среднюю выше уровня действительного представляющего точку центра распределения данных. Особо малые значения признаков имеют противоположный эффект. Иногда для того чтобы исключить влияние экстремальных единиц данных, рассчитывается усеченная средняя. Для этого просто необходимо удалить 5% наибольших и 5% наименьших наблюдений до расчета средней арифметической.

Экстремальные наблюдения не влияют на медиану и моду, но эти показатели не столь полезны в дальнейшем математическом и статистическом анализе.

Средняя геометрическая лучше других подходит, когда подсчитываются "средние" темпы прироста в течение нескольких временных периодов.

Медиана – это такое значение признака, которое приходится на середину вариационного ряда. Таким образом, в ранжированном ряду распределения одна половина ряда имеет значения признака больше медианы, другая – меньше медианы, т.е. медиана разбивает выборку на две равные части. Медиана выборки определяется так:

Если объём выборки нечетное число, т.е. n=2k+1, то медиана является элементом со средним номером Ме=xk+1;

Если объём выборки четное число, т.е. n=2k, то Ме=(xk+xk+1)/2.

Рассмотрим примеры. Найти среднее, медиану выборки X={7, 3, 3 6, 4,5,1,2,1, 3, 4}. Объём выборки n=11. Строим вариационный ряд 1, 1, 2, 3, 3, 3, 4, 4, 5, 6, 7. Так как n=2k+1=2*5+1=11, то Ме=xk+1=x6=3.

(7+3+3+6+4+5+1+2+1+3+4)/11=3,5454.

Мода – это варианта выборки, которая имеет наибольшую частоту. Если имеется несколько значений с максимальной частотой, то распределение мультимодально. Если каждое значение встречается лишь один раз, то моды нет. Например, случайная величина распределённая по равномерному закону не имеет моды.

Определим выборочную моду выборки для нашего примера. Для этого построим таблицу частот.

zi               n
ni                

Из данной таблицы частот следует, что Мо=3, так как данный элемент наибольшую частоту равную трём.

Использование приложения MS Excel.

В приложении MS Excel имеется группа статистических функций. Например, для вычисления среднего используем функцию СРЕДНЕЕ (), для вычисления медианы используем функцию МЕДИАНА (). В скобках указываем диапазон ячеек для которых мы находим данные характеристики. Нужную информацию о статистических данных можно также получить, прибегнув к утилите Описательная статистика. Для этого открываем вкладку Данные, где выбираем пиктограмму Анализ данных. Появится окно Анализ данных. Из списка инструментов анализа выбираем Описательная статистика. В результате появляется диалоговое окно Описательная статистика, представленное на рис. 1. В том окне следует указать данные для анализа, область вывода результатов.

Рис. 1. Окно "Описательная статистика"

Основные числовые характеристики выборки:

– выборочное среднее;

– выборочная дисперсия;

– выборочное среднее квадратичное отклонение;

– коэффициент асимметрии;

– коэффициент эксцесса.

Анализируя назначение рассмотренных параметров, необходимо отметить следующее. Одни параметры характеризует средние величины, а другие – вариацию. Главное назначение средних величин (оценок начальных моментов и в первую очередь первого момента распределения) состоит в их обобщающей функции. Это обобщение позволяет заменить множество различных индивидуальных значений показателя средней величиной, характеризующей всю однородную совокупность. Иначе говоря, средняя величина является типической характеристикой варианты в конкретной выборке.


Поделиться с друзьями:

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...

Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.008 с.