История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...
Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначенные для поддерживания проводов на необходимой высоте над землей, водой...
Топ:
Генеалогическое древо Султанов Османской империи: Османские правители, вначале, будучи еще бейлербеями Анатолии, женились на дочерях византийских императоров...
Техника безопасности при работе на пароконвектомате: К обслуживанию пароконвектомата допускаются лица, прошедшие технический минимум по эксплуатации оборудования...
Отражение на счетах бухгалтерского учета процесса приобретения: Процесс заготовления представляет систему экономических событий, включающих приобретение организацией у поставщиков сырья...
Интересное:
Финансовый рынок и его значение в управлении денежными потоками на современном этапе: любому предприятию для расширения производства и увеличения прибыли нужны...
Влияние предпринимательской среды на эффективное функционирование предприятия: Предпринимательская среда – это совокупность внешних и внутренних факторов, оказывающих влияние на функционирование фирмы...
Национальное богатство страны и его составляющие: для оценки элементов национального богатства используются...
Дисциплины:
2017-08-23 | 453 |
5.00
из
|
Заказать работу |
|
|
Математическая статистика
ВВОДНЫЕ ЗАМЕЧАНИЯ
В теории вероятностей о вероятностях, законах распределения, параметрах случайных величин говорится как о чём-то данном, известном. Но встаёт вопрос: откуда их взять? Как найти параметры хотя бы приближённо? Как проверить предположение о том, что некоторая случайная величина распределена, например, по нормальному закону?
На эти и подобные им вопросы отвечает математическая статистика, причём информацию для ответов она берёт из наблюдений над случайными событиями и величинами. При этом наблюдения ведутся над реальными объектами и моделями, тогда как теория вероятностей изучает математические модели, в значительной степени идеализированные и абстрагированные. Соотношение между выводами математической теории и поведением реального мира приобретает уже не философский, а практический смысл. Можно сказать, что математическая статистика заведует связями теории вероятностей с внешним миром.
Ниже мы будем рассматривать одну единственную статистическую модель: предполагается, что существует случайная величина X, которую можно наблюдать повторно n раз в независимых опытах. Результатом таких наблюдений оказываются n значений, которые X приняла в n экспериментах: (x 1, x 2, ¼ ¼, xn), – так называемая выборка, n – объём выборки. На все вопросы о случайной величине X математическая статистика берётся отвечать по выборке.
В каждом опыте мы наблюдаем одну и ту же случайную величину X; все опыты по предположению независимы. Можно считать, что фактически мы наблюдаем n - мерную случайную величину (X 1, X 2, ¼, Xn) с независимыми компонентами, распределёнными одинаково – по тому же закону, что и X. Выборка (x 1, x 2, ¼, xn) есть наблюдённое значение случайной величины (X 1, X 2, ¼, Xn), выборка – одно из её возможных значений; её можно представить точкой в n -мерном евклидовом пространстве. Всё множество точек, которые могут быть выборками, образует так называемое выборочное пространство. По сути дела выборка – элементарное событие, а выборочное пространство – пространство элементарных событий W. Часто смотрят на выборку (x 1, x 2, ¼, xn) как на случайную величину и не вводят особого обозначения (X 1, X 2, ¼, Xn) для случайной величины.
|
Если X ~ N (a, s), то выборочным пространством оказывается всё евклидово пространство Rn. Если X ~P(l), то выборочное пространство совпадает с целочисленной решёткой главного координатного угла. Если X ~ R (0, 1), то W – единичный n -мерный куб.
Пусть X ~ F (x, q): F (x, q) – функция распределения случайной величины X. Тогда совместная функция распределения выборки:
F (x 1, x 2, ¼, xn)= F (xi, q).
Если X имеет плотность вероятности p (x, q), то совместная плотность вероятности выборки равна
p (x 1, x 2, ¼, xn)= p (xi, q).
Познакомимся с важнейшими задачами математической статистики и с их статистическими решениями.
V. ГРУППИРОВКА НАБЛЮДЕНИЙ
Если объём выборки очень велик, то обрабатывать весь массив собранных данных бывает иногда затруднительно. С целью облегчить вычислительную работу в таких случаях производят так называемую группировку наблюдений. Она бывает также необходима для некоторых статистических процедур.
Представим выборку (x 1, x 2, ¼, xn) в виде вариационного ряда: y 1£ y 2£
£¼£ yn. Величина yn - y 1 называется размахом выборки. Разобьём отрезок [ y 1, yn ] на N равных частей длины D= .
Поскольку неизбежно округление данных, следует договориться о концах интервалов: разбиваем весь отрезок [ y 1, yn ] на отрезки
D k =[ xk o- , xk o+ ),
где xk o– середина k -ого полузакрытого интервала. При таком разбиении последний интервал берём в виде
D N =[ xN o- , xN o+ ].
Обозначим через mk число наблюдений, попавших в k -й интервал D k. Числа x 1o< x 2o<¼< xN o называют интервальным вариационным рядом, mk – приписанные этим точкам частоты.
|
В принципе, можно строить интервальный вариационный ряд, производя, если это нужно, разбиение и на неравные интервалы.
Вся дальнейшая работа (например, построение эмпирической функции распределения, оценки и т. д.) осуществляется уже с интервальным вариационным рядом. При этом нужно не забывать, что группировка вносит в статистические вычисления дополнительную ошибку – ошибку на группировку.
Число интервалов N выбирают так, чтобы частоты mk были достаточно велики, а само число N не слишком велико.
Разбиение на неравные интервалы производят в том случае, если на оси x есть области очень бедные попавшими туда наблюдениями.
Математическая статистика
ВВОДНЫЕ ЗАМЕЧАНИЯ
В теории вероятностей о вероятностях, законах распределения, параметрах случайных величин говорится как о чём-то данном, известном. Но встаёт вопрос: откуда их взять? Как найти параметры хотя бы приближённо? Как проверить предположение о том, что некоторая случайная величина распределена, например, по нормальному закону?
На эти и подобные им вопросы отвечает математическая статистика, причём информацию для ответов она берёт из наблюдений над случайными событиями и величинами. При этом наблюдения ведутся над реальными объектами и моделями, тогда как теория вероятностей изучает математические модели, в значительной степени идеализированные и абстрагированные. Соотношение между выводами математической теории и поведением реального мира приобретает уже не философский, а практический смысл. Можно сказать, что математическая статистика заведует связями теории вероятностей с внешним миром.
Ниже мы будем рассматривать одну единственную статистическую модель: предполагается, что существует случайная величина X, которую можно наблюдать повторно n раз в независимых опытах. Результатом таких наблюдений оказываются n значений, которые X приняла в n экспериментах: (x 1, x 2, ¼ ¼, xn), – так называемая выборка, n – объём выборки. На все вопросы о случайной величине X математическая статистика берётся отвечать по выборке.
В каждом опыте мы наблюдаем одну и ту же случайную величину X; все опыты по предположению независимы. Можно считать, что фактически мы наблюдаем n - мерную случайную величину (X 1, X 2, ¼, Xn) с независимыми компонентами, распределёнными одинаково – по тому же закону, что и X. Выборка (x 1, x 2, ¼, xn) есть наблюдённое значение случайной величины (X 1, X 2, ¼, Xn), выборка – одно из её возможных значений; её можно представить точкой в n -мерном евклидовом пространстве. Всё множество точек, которые могут быть выборками, образует так называемое выборочное пространство. По сути дела выборка – элементарное событие, а выборочное пространство – пространство элементарных событий W. Часто смотрят на выборку (x 1, x 2, ¼, xn) как на случайную величину и не вводят особого обозначения (X 1, X 2, ¼, Xn) для случайной величины.
|
Если X ~ N (a, s), то выборочным пространством оказывается всё евклидово пространство Rn. Если X ~P(l), то выборочное пространство совпадает с целочисленной решёткой главного координатного угла. Если X ~ R (0, 1), то W – единичный n -мерный куб.
Пусть X ~ F (x, q): F (x, q) – функция распределения случайной величины X. Тогда совместная функция распределения выборки:
F (x 1, x 2, ¼, xn)= F (xi, q).
Если X имеет плотность вероятности p (x, q), то совместная плотность вероятности выборки равна
p (x 1, x 2, ¼, xn)= p (xi, q).
Познакомимся с важнейшими задачами математической статистики и с их статистическими решениями.
I. ОТНОСИТЕЛЬНАЯ ЧАСТОТА КАК ОЦЕНКА ВЕРОЯТНОСТИ
Пусть имеется событие A, вероятность которого P (A)= p – неизвестна, и мы хотим найти её хотя бы приблизительно. Из курса теории вероятностей ответ нам известен: хорошим приближением для вероятности является относительная частота события. Если в n независимых опытах событие A произошло m раз, то P (A)» . При этом:
1. В среднем мы не ошибаемся: M ()» p.
Это свойство оценки называется несмещённостью.
2. Дисперсия оценки как угодно мала при достаточно большом числе опытов: D ()= ®0 при n ®¥.
Дисперсия играет роль среднего квадрата ошибки.
3. Вероятность заметных отклонений относительной частоты от вероятности мала, поскольку по закону больших чисел Бернулли:
p Û P {| - p |<e}=1 для "e>0.
|
Это свойство оценки называется состоятельностью. Оно может быть усилено, поскольку по закону больших чисел Бореля:
P { ® p }=1.
Итак, относительная частота – несмещённая, состоятельная оценка для вероятности со сколь угодно малой среднеквадратической ошибкой.
Решение I задачи, таким образом, нам известно, и оно послужит нам удобным образцом для более сложных задач.
Разумеется, нужно понимать, что полученный ответ точно укладывается в рамки той единственной модели, которую мы взялись изучать в математической статистике.
Можно считать, что мы имеем здесь дело с биномиальной случайной величиной X, а выборка состоит из одного наблюдения m. Либо можно считать, что мы имеем дело здесь со случайной величиной Х=
1, если событие A произошло,
0, если событие A не произошло.
Очевидно, X – дискретная случайная величина с двумя возможными значениями 1 и 0, а вероятности этих значений p и q =1- p. Мы уже встречались с подобной величиной и выяснили, что MX = p, DX = pq.
Соответственно выборка (x 1, x 2, ¼, xn) состоит из m единиц и n - m нулей, выборочное пространство состоит из вершин n -мерного единичного куба, и
(x 1+ x 2+¼+ xn)= ,
так что ответ мы действительно получаем в терминах выборки:
p = P (A)» (x 1+ x 2+¼+ xn)= = .
II. ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ
КАК ОЦЕНКА ФУНКЦИИ РАСПРЕДЕЛЕНИЯ
Пусть функция распределения случайной величины X неизвестна. Обозначим её F (x). Требуется хотя бы приблизительно её найти. Получим выборку (x 1, x 2, ¼, xn) и по ней построим так называемую эмпирическую функцию распределения:
Fn (x)= , -¥< x <+¥,
где m (x) – число наблюдений в выборке, оказавшихся меньше x.
Убедимся в том, что эмпирическая функция распределения – хорошее приближение для F (x).
Расположим наблюдения в порядке возрастания, причём повторяющиеся наблюдения выпишем лишь один раз: получим возрастающую последовательность y 1< y 2<¼< yr, называемую вариационным рядом; члены её называются порядковыми статистиками. Так, y 1= xi – минимальная порядковая статистика – первый член вариационного ряда; yr = xi – максимальная порядковая статистика – последний член вариационного ряда. Пусть частота значения yi равна mi. Тогда очевидно:
0, если x £ y 1,
Fn(X)= mi, если yk < x £ yk +1, k =1, 2, ¼, r -1,
1, если x > yr.
Fn (x)= |
0, если x £ y 1,
, если yk < x £ yk +1, k =1, 2, ¼, n -1,
1, если x > yn.
Очевидно, Fn (x) – ступенчатая неотрицательная монотонная функция, имеющая разрывы в точках yi, где она совершает скачки величины . Она обладает всеми свойствами функции распределения и задаёт закон распределения дискретной случайной величины с возможными значениями yi и вероятностями . Она и решает нашу задачу приближённого описания F (x).
|
Действительно, рассмотрим событие A ={ X < x }.
Его вероятность P (A)= P { X < x }= F (x), его абсолютная частота m = m (x), его относительная частота равна Fn (x), и мы свели рассматриваемую II задачу к I, ответ на которую мы уже знаем.
Следовательно, для любого x эмпирическая функция распределения Fn (x) приближённо равна F (x), причём Fn (x) обладает следующими свойствами:
1. MFn (x)= F (x), т. е. Fn (x) – несмещённая оценка F (x);
2. DFn (x)= { F (x)[1- F (x)]} 0;
3. Fn (x) F (x) Û P {| Fn (x)- F (x)|<e}=1, "e>0. И даже:
P { Fn (x) F (x)}=1 – состоятельность оценки Fn (x).
Итак, эмпирическая функция распределения Fn (x) для любого x – несмещённая, состоятельная оценка F (x) со сколь угодно малой среднеквадратической ошибкой.
III. СРЕДНЕЕ ВЫБОРОЧНОЕ КАК ОЦЕНКА
МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ
Требуется по выборке (x 1, x 2, ¼, xn) оценить (т. е. приближённо найти) MX. Ответ нам уже известен: хорошим приближением для среднего значения случайной величины является среднее арифметическое наблюдений:
MX» = xi.
Очевидно, мы можем пользоваться теоремами о среднем арифметическом, применяя их к нашей выборке – последовательности одинаково распределённых независимых случайных величин.
Будем предполагать, что X имеет MX = a, и DX =s2.
1. В среднем мы не ошибаемся, поскольку = a (имеет место несмещённость).
2. Среднеквадратическая ошибка приближения как угодно мала при n ®¥, поскольку = ®0.
3. подчиняется закону больших чисел Чебышёва:
a, т. е. P {| - a |<e}=1, "e>0,
следовательно имеет место состоятельность.
В статистике принято называть средним выборочным. Таким образом, среднее выборочное – несмещённая состоятельная оценка для математического ожидания со сколь угодно малой дисперсией при достаточно большом объёме выборки.
|
|
Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...
Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...
История развития пистолетов-пулеметов: Предпосылкой для возникновения пистолетов-пулеметов послужила давняя тенденция тяготения винтовок...
Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!