История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...
Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...
Топ:
Техника безопасности при работе на пароконвектомате: К обслуживанию пароконвектомата допускаются лица, прошедшие технический минимум по эксплуатации оборудования...
Проблема типологии научных революций: Глобальные научные революции и типы научной рациональности...
Устройство и оснащение процедурного кабинета: Решающая роль в обеспечении правильного лечения пациентов отводится процедурной медсестре...
Интересное:
Распространение рака на другие отдаленные от желудка органы: Характерных симптомов рака желудка не существует. Выраженные симптомы появляются, когда опухоль...
Берегоукрепление оползневых склонов: На прибрежных склонах основной причиной развития оползневых процессов является подмыв водами рек естественных склонов...
Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...
Дисциплины:
2017-11-16 | 166 |
5.00
из
|
Заказать работу |
Случайные величины характеризуются числовыми характеристиками, в частности математическим ожиданием, дисперсией и др. При этом каждой характеристике случайной величины Х соответствует ее статистическая аналогия. Для математического ожидания – среднее арифметическая наблюдаемых значений.
n
M*[x] = x¯ = Σ xi \ n
i=1
x – значение случайной величины в i опыте
n – число опытов
Статистическая дисперсия – случайной величины x
n
D*[x] = Σ (xi - x¯)2 \ n
i=1
Важной статистической характеристикой является теснота связи между переменными. Если две случайные величины X, Y то связь между ними характеризуется корреляционным моментом.
n
Σ (xi - x¯) (yi -y¯)
K*[X,Y] = i=1____________________
n
Коэффициенты парной корреляции – это отношение корреляционного момента, к корню квадратному из произведения дисперсий случайных величин.
ζxy =. К* [X,Y].
√D*[X] D*[Y]
связи между Х и Y нет
связи между Х и Y нет, но есть какое-то направление
Чем теснее связь между переменными, тем меньше количество факторов мы должны включать в модели.
Если зависимость отличается функциональной, то на результирующую переменную оказывает влияние множества факторов. Задача построение модели – поиск наиболее адекватной формы модели. При этом необходимо стремиться к типичности количества факторов включающих в модель. Причины этого является проблемы мультиколлинеарности (в модель должны включаться независимые друг от друга факторы следовательно изучаем разные стороны процесса). Достичь этого в принципе невозможно. Обязательно между ними есть статистическая связь, в экономических процессах – это особенно наглядно. Должны отбирать факторы по наибольшему влиянию на результат операций фактор, и наименьшего влияния друг на друга. Само по себе технология построения корреляционных моделей не является сложной, но проходит несколько этапов:
1. постановка задачи
2. сбор исходной информации
3. предварительная обработка исходной информации
4. построение модели
5. оценка адекватности и точности построенных моделей.
Если случайные величины X,Y некоррелированы, то произведение отклонений (xi-x¯)*(yi-y¯) будет носить случайный характер с математическим ожиданием à к 0. В этом случае ζxy = 1 (отклонения будут упорядочены)
В конкретных исследованиях, как правило работают с выборочной совокупностью. Всегда выборочная совокупность меньше, чем генеральная. В результате всегда получаем характеристики худшие чем те, если бы имели в распоряжении генеральная совокупность. В результате работы с выборочной совокупностью, мы вынуждены подбирать закон распределения следовательно это называется выравниванием статистического ряда. В результате выравнивания имеют 2 гипотезы:
1. расхождение между теоретическим законом распределения и статистическим распределением объясняется случайными обстоятельствами, связанными с ограниченным числом наблюдений
2. расхождения являются существенными и связано с тем, что теоретическое распределение плохо выравнивает подобранное статистическое.
Для проверки гипотез служит критерий согласия. Наиболее часто используется х Пирсона, т2 Стьюдента f-критерий Фишера. Согласно этим критериям вычисляется мера расхождения между теоретическими и статистическими расхождениями.
При малом количестве наблюдений рекомендуется выявить доверительный интервал и доверительную вероятность.
Доверительный интервал рассчитывают только для несмещенных оценок, то есть оценок которые совпадают со статистическим данными средними
Постановка задачи – наиболее важный момент в построении корреляционных моделей. От точности поставленной задачи в дальнейшем будет зависеть вся работа. В качестве уточнения постановки задачи проводится теоретический и логический анализ результирующего и определяющего факторов. Здесь определяется границы выборочной совокупности и определяется круг факторов, которые будут исследоваться.
Сбор исходной информации. Самая трудоемкая работа. Исходная информация формируется в виде таблиц, в которых содержатся значения результирующего и определяющего факторов. После сбора необходимо приступить к статистической оценке значимости факторов, связано с тем, что необходимо уменьшить объем исходной информации и уменьшить количество факторов, включаемых в модель.
Статистическая оценка значимости проводится расчета коэффициентов парной корреляции. В результате получается корреляционные матрицы, которые потом подвергаются визуальному анализу.
Построение эмпирических уравнений регрессии (для определения характера влияния определенных факторов на результирующую). Для каждого факторного признака Xij на график наносится точки с координатами yi xij
yi xij | xi1 | xi2 | … | xim |
y1 | x11 | x12 | … | x1m |
y2 | x21 | x22 | … | x2m |
y3 | x31 | x32 | … | x3m |
… | … | … | … | … |
yn | xn1 | xn2 | … | xnm |
Затем определяется минимальное и максимальное значение А отрезок [xjmin, xjmax] делиться на ряд интервалов. В результате получаем
∆x = (xjmax - xjmin) \ N
N – число интервалов.
Для каждого интервала (т.е. ∆x) определяется точка составляющая средним значением у, х. Затем на графике эти средние значения соединяются отрезками, мы получаем эмпирическую линию регрессии, при необходимости эта регрессия может быть сглажена. В результате получаем некоторую линию, которая отражает характер влияния определенного фактора на результирующую. Зная характер, можно выбрать форму сглаживающей кривой. На этом этап предварительной обработки информации заканчивается.
расчетный этап. Как правило в социально-экономических исследованиях используют многофакторные модели, но в некоторых случаях полезными являются и однофакторные модели. Однофакторные модели, как правило строятся при помощи метода наименьших квадратов. Зависимости, которые используются:
· линейная у = а0 + а1х
· степенная у = а0хa1
· у = a0 * ea1x
Строится многофакторная модель – следующим шагом. В качестве основных сглаживающих функций выступают линейные многочлены и мультисистемные функции
Метод расчета – метод наименьших квадратов. Используется матрицы. Надо проводить в начале выравнивание.
Оценка адекватности и точности построения моделей.
Адекватность полученных моделей, оценивается при помощи нескольких показателей. Полноту учета всех факторов, влияющих на результирующий признак характеризуется коэффициент множественной корреляции, он определяется:
________
R = √1 – D\Dy
D0 – остаточная дисперсия, т.е. это характеристика, которая показывает рассеяние случайной величины
Yi – относительную уравнения регрессии
Dy - дисперсия Y относительно среднего значения
Используется коэффициент детерминации – это коэффициент множественной корреляции в квадрате (R),он показывает долю изменчивости результативного признака за счет всех факторов, включенных в модель. Точность модели можно оценить по средней относительной ошибке.
n
Scp = 1\n Σ |(yi - ypi)| * 100%\yi
i=1
Sср показывает на сколько процентов расчетные значения в среднем отклоняются от фактических. Можно рассчитать доверительный интервал, который показывает пределы возможных значений у. Величина доверительного интервала определяется:
∆ = y ± tσ*
t – доверительная вероятность, она зависит от уровня риска
σ – среднее квадратическое отклонение i-го значения у от истинного
При этом считается что yi распределены по нормальному закону с одинаковой дисперсией, а за ее оценку принимается значение остаточной дисперсии.
Для оценки адекватности используется критерий согласия.
Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...
История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...
Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...
Адаптации растений и животных к жизни в горах: Большое значение для жизни организмов в горах имеют степень расчленения, крутизна и экспозиционные различия склонов...
© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!