Тема 3. Применение корреляционно-регрессионных моделей в прогнозировании — КиберПедия 

Индивидуальные очистные сооружения: К классу индивидуальных очистных сооружений относят сооружения, пропускная способность которых...

Биохимия спиртового брожения: Основу технологии получения пива составляет спиртовое брожение, - при котором сахар превращается...

Тема 3. Применение корреляционно-регрессионных моделей в прогнозировании

2017-11-16 154
Тема 3. Применение корреляционно-регрессионных моделей в прогнозировании 0.00 из 5.00 0 оценок
Заказать работу

Случайные величины характеризуются числовыми характеристиками, в частности математическим ожиданием, дисперсией и др. При этом каждой характеристике случайной величины Х соответствует ее статистическая аналогия. Для математического ожидания – среднее арифметическая наблюдаемых значений.

n

M*[x] = x¯ = Σ xi \ n

i=1

x – значение случайной величины в i опыте

n – число опытов

 

Статистическая дисперсия – случайной величины x

n

D*[x] = Σ (xi - x¯)2 \ n

i=1

Важной статистической характеристикой является теснота связи между переменными. Если две случайные величины X, Y то связь между ними характеризуется корреляционным моментом.

 


n

Σ (xi - x¯) (yi -y¯)

K*[X,Y] = i=1____________________

n

Коэффициенты парной корреляции – это отношение корреляционного момента, к корню квадратному из произведения дисперсий случайных величин.

 

ζxy =. К* [X,Y].

√D*[X] D*[Y]

 

 

связи между Х и Y нет

 

связи между Х и Y нет, но есть какое-то направление

 

 

Чем теснее связь между переменными, тем меньше количество факторов мы должны включать в модели.

Если зависимость отличается функциональной, то на результирующую переменную оказывает влияние множества факторов. Задача построение модели – поиск наиболее адекватной формы модели. При этом необходимо стремиться к типичности количества факторов включающих в модель. Причины этого является проблемы мультиколлинеарности (в модель должны включаться независимые друг от друга факторы следовательно изучаем разные стороны процесса). Достичь этого в принципе невозможно. Обязательно между ними есть статистическая связь, в экономических процессах – это особенно наглядно. Должны отбирать факторы по наибольшему влиянию на результат операций фактор, и наименьшего влияния друг на друга. Само по себе технология построения корреляционных моделей не является сложной, но проходит несколько этапов:

1. постановка задачи

2. сбор исходной информации

3. предварительная обработка исходной информации

4. построение модели

5. оценка адекватности и точности построенных моделей.

Если случайные величины X,Y некоррелированы, то произведение отклонений (xi-x¯)*(yi-y¯) будет носить случайный характер с математическим ожиданием à к 0. В этом случае ζxy = 1 (отклонения будут упорядочены)

 

 

В конкретных исследованиях, как правило работают с выборочной совокупностью. Всегда выборочная совокупность меньше, чем генеральная. В результате всегда получаем характеристики худшие чем те, если бы имели в распоряжении генеральная совокупность. В результате работы с выборочной совокупностью, мы вынуждены подбирать закон распределения следовательно это называется выравниванием статистического ряда. В результате выравнивания имеют 2 гипотезы:

1. расхождение между теоретическим законом распределения и статистическим распределением объясняется случайными обстоятельствами, связанными с ограниченным числом наблюдений

2. расхождения являются существенными и связано с тем, что теоретическое распределение плохо выравнивает подобранное статистическое.

Для проверки гипотез служит критерий согласия. Наиболее часто используется х Пирсона, т2 Стьюдента f-критерий Фишера. Согласно этим критериям вычисляется мера расхождения между теоретическими и статистическими расхождениями.

При малом количестве наблюдений рекомендуется выявить доверительный интервал и доверительную вероятность.

Доверительный интервал рассчитывают только для несмещенных оценок, то есть оценок которые совпадают со статистическим данными средними

 

 

Постановка задачи – наиболее важный момент в построении корреляционных моделей. От точности поставленной задачи в дальнейшем будет зависеть вся работа. В качестве уточнения постановки задачи проводится теоретический и логический анализ результирующего и определяющего факторов. Здесь определяется границы выборочной совокупности и определяется круг факторов, которые будут исследоваться.

Сбор исходной информации. Самая трудоемкая работа. Исходная информация формируется в виде таблиц, в которых содержатся значения результирующего и определяющего факторов. После сбора необходимо приступить к статистической оценке значимости факторов, связано с тем, что необходимо уменьшить объем исходной информации и уменьшить количество факторов, включаемых в модель.

Статистическая оценка значимости проводится расчета коэффициентов парной корреляции. В результате получается корреляционные матрицы, которые потом подвергаются визуальному анализу.

Построение эмпирических уравнений регрессии (для определения характера влияния определенных факторов на результирующую). Для каждого факторного признака Xij на график наносится точки с координатами yi xij

 

yi xij xi1 xi2 xim
y1 x11 x12 x1m
y2 x21 x22 x2m
y3 x31 x32 x3m
yn xn1 xn2 xnm

 

Затем определяется минимальное и максимальное значение А отрезок [xjmin, xjmax] делиться на ряд интервалов. В результате получаем

 

∆x = (xjmax - xjmin) \ N

 

N – число интервалов.

Для каждого интервала (т.е. ∆x) определяется точка составляющая средним значением у, х. Затем на графике эти средние значения соединяются отрезками, мы получаем эмпирическую линию регрессии, при необходимости эта регрессия может быть сглажена. В результате получаем некоторую линию, которая отражает характер влияния определенного фактора на результирующую. Зная характер, можно выбрать форму сглаживающей кривой. На этом этап предварительной обработки информации заканчивается.

расчетный этап. Как правило в социально-экономических исследованиях используют многофакторные модели, но в некоторых случаях полезными являются и однофакторные модели. Однофакторные модели, как правило строятся при помощи метода наименьших квадратов. Зависимости, которые используются:

· линейная у = а0 + а1х

· степенная у = а0хa1

· у = a0 * ea1x

Строится многофакторная модель – следующим шагом. В качестве основных сглаживающих функций выступают линейные многочлены и мультисистемные функции

Метод расчета – метод наименьших квадратов. Используется матрицы. Надо проводить в начале выравнивание.

Оценка адекватности и точности построения моделей.

Адекватность полученных моделей, оценивается при помощи нескольких показателей. Полноту учета всех факторов, влияющих на результирующий признак характеризуется коэффициент множественной корреляции, он определяется:

________

R = √1 – D\Dy

 

D0 – остаточная дисперсия, т.е. это характеристика, которая показывает рассеяние случайной величины

Yi – относительную уравнения регрессии

Dy - дисперсия Y относительно среднего значения

 

Используется коэффициент детерминации – это коэффициент множественной корреляции в квадрате (R),он показывает долю изменчивости результативного признака за счет всех факторов, включенных в модель. Точность модели можно оценить по средней относительной ошибке.

n

Scp = 1\n Σ |(yi - ypi)| * 100%\yi

i=1

Sср показывает на сколько процентов расчетные значения в среднем отклоняются от фактических. Можно рассчитать доверительный интервал, который показывает пределы возможных значений у. Величина доверительного интервала определяется:

 

∆ = y ± tσ*

 

t – доверительная вероятность, она зависит от уровня риска

σ – среднее квадратическое отклонение i-го значения у от истинного

При этом считается что yi распределены по нормальному закону с одинаковой дисперсией, а за ее оценку принимается значение остаточной дисперсии.

Для оценки адекватности используется критерий согласия.

 


Поделиться с друзьями:

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...

История развития пистолетов-пулеметов: Предпосылкой для возникновения пистолетов-пулеметов послужила давняя тенденция тяготения винтовок...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.012 с.