Навигация:

Главная Случайная страница Обратная связь ТОП Интересно знать Избранные Новые материалы

Топ:

Техника безопасности при работе на пароконвектомате: К обслуживанию пароконвектомата допускаются лица, прошедшие технический минимум по эксплуатации оборудования...

Проблема типологии научных революций: Глобальные научные революции и типы научной рациональности...

Устройство и оснащение процедурного кабинета: Решающая роль в обеспечении правильного лечения пациентов отводится процедурной медсестре...

Интересное:

Распространение рака на другие отдаленные от желудка органы: Характерных симптомов рака желудка не существует. Выраженные симптомы появляются, когда опухоль...

Берегоукрепление оползневых склонов: На прибрежных склонах основной причиной развития оползневых процессов является подмыв водами рек естественных склонов...

Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...

Дисциплины:

Автоматизация Антропология Археология Архитектура Аудит Биология Бухгалтерия Военная наука Генетика География Геология Демография Журналистика Зоология Иностранные языки Информатика Искусство История Кинематография Компьютеризация Кораблестроение Кулинария Культура Лексикология Лингвистика Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлургия Метрология Механика Музыкология Науковедение Образование Охрана Труда Педагогика Политология Правоотношение Предпринимательство Приборостроение Программирование Производство Промышленность Психология Радиосвязь Религия Риторика Социология Спорт Стандартизация Статистика Строительство Теология Технологии Торговля Транспорт Фармакология Физика Физиология Философия Финансы Химия Хозяйство Черчение Экология Экономика Электроника Энергетика Юриспруденция

Тема 3. Применение корреляционно-регрессионных моделей в прогнозировании

2017-11-16

166

0.00 из 5.00 0 оценок

Заказать работу

⇐ ПредыдущаяСтр 5 из 11Следующая ⇒

Случайные величины характеризуются числовыми характеристиками, в частности математическим ожиданием, дисперсией и др. При этом каждой характеристике случайной величины Х соответствует ее статистическая аналогия. Для математического ожидания – среднее арифметическая наблюдаемых значений.

M*[x] = x¯ = Σ xi \ n

ⁱ⁼¹

x – значение случайной величины в i опыте

n – число опытов

Статистическая дисперсия – случайной величины x

D*[x] = Σ (xi - x¯)² \ n

ⁱ⁼¹

Важной статистической характеристикой является теснота связи между переменными. Если две случайные величины X, Y то связь между ними характеризуется корреляционным моментом.

Σ (xi - x¯) (yi -y¯)

K*[X,Y] = ⁱ^{=1____________________}

Коэффициенты парной корреляции – это отношение корреляционного момента, к корню квадратному из произведения дисперсий случайных величин.

ζxy =. К* [X,Y].

√D*[X] D*[Y]

связи между Х и Y нет

связи между Х и Y нет, но есть какое-то направление

Чем теснее связь между переменными, тем меньше количество факторов мы должны включать в модели.

Если зависимость отличается функциональной, то на результирующую переменную оказывает влияние множества факторов. Задача построение модели – поиск наиболее адекватной формы модели. При этом необходимо стремиться к типичности количества факторов включающих в модель. Причины этого является проблемы мультиколлинеарности (в модель должны включаться независимые друг от друга факторы следовательно изучаем разные стороны процесса). Достичь этого в принципе невозможно. Обязательно между ними есть статистическая связь, в экономических процессах – это особенно наглядно. Должны отбирать факторы по наибольшему влиянию на результат операций фактор, и наименьшего влияния друг на друга. Само по себе технология построения корреляционных моделей не является сложной, но проходит несколько этапов:

1. постановка задачи

2. сбор исходной информации

3. предварительная обработка исходной информации

4. построение модели

5. оценка адекватности и точности построенных моделей.

Если случайные величины X,Y некоррелированы, то произведение отклонений (xi-x¯)*(yi-y¯) будет носить случайный характер с математическим ожиданием à к 0. В этом случае ζxy = 1 (отклонения будут упорядочены)

В конкретных исследованиях, как правило работают с выборочной совокупностью. Всегда выборочная совокупность меньше, чем генеральная. В результате всегда получаем характеристики худшие чем те, если бы имели в распоряжении генеральная совокупность. В результате работы с выборочной совокупностью, мы вынуждены подбирать закон распределения следовательно это называется выравниванием статистического ряда. В результате выравнивания имеют 2 гипотезы:

1. расхождение между теоретическим законом распределения и статистическим распределением объясняется случайными обстоятельствами, связанными с ограниченным числом наблюдений

2. расхождения являются существенными и связано с тем, что теоретическое распределение плохо выравнивает подобранное статистическое.

Для проверки гипотез служит критерий согласия. Наиболее часто используется х Пирсона, т2 Стьюдента f-критерий Фишера. Согласно этим критериям вычисляется мера расхождения между теоретическими и статистическими расхождениями.

При малом количестве наблюдений рекомендуется выявить доверительный интервал и доверительную вероятность.

Доверительный интервал рассчитывают только для несмещенных оценок, то есть оценок которые совпадают со статистическим данными средними

Постановка задачи – наиболее важный момент в построении корреляционных моделей. От точности поставленной задачи в дальнейшем будет зависеть вся работа. В качестве уточнения постановки задачи проводится теоретический и логический анализ результирующего и определяющего факторов. Здесь определяется границы выборочной совокупности и определяется круг факторов, которые будут исследоваться.

Сбор исходной информации. Самая трудоемкая работа. Исходная информация формируется в виде таблиц, в которых содержатся значения результирующего и определяющего факторов. После сбора необходимо приступить к статистической оценке значимости факторов, связано с тем, что необходимо уменьшить объем исходной информации и уменьшить количество факторов, включаемых в модель.

Статистическая оценка значимости проводится расчета коэффициентов парной корреляции. В результате получается корреляционные матрицы, которые потом подвергаются визуальному анализу.

Построение эмпирических уравнений регрессии (для определения характера влияния определенных факторов на результирующую). Для каждого факторного признака Xij на график наносится точки с координатами yi xij

yi ^xij	x_i1	x_i2	…	x_im
y₁	x₁₁	x₁₂	…	x_1m
y₂	x₂₁	x₂₂	…	x_2m
y₃	x₃₁	x₃₂	…	x_3m
…	…	…	…	…
y_n	x_n1	x_n2	…	x_nm

Затем определяется минимальное и максимальное значение А отрезок [x_jmin, x_jmax] делиться на ряд интервалов. В результате получаем

∆x = (x_jmax - x_jmin₎ \ N

N – число интервалов.

Для каждого интервала (т.е. ∆x) определяется точка составляющая средним значением у, х. Затем на графике эти средние значения соединяются отрезками, мы получаем эмпирическую линию регрессии, при необходимости эта регрессия может быть сглажена. В результате получаем некоторую линию, которая отражает характер влияния определенного фактора на результирующую. Зная характер, можно выбрать форму сглаживающей кривой. На этом этап предварительной обработки информации заканчивается.

расчетный этап. Как правило в социально-экономических исследованиях используют многофакторные модели, но в некоторых случаях полезными являются и однофакторные модели. Однофакторные модели, как правило строятся при помощи метода наименьших квадратов. Зависимости, которые используются:

· линейная у = а₀ + а₁х

· степенная у = а₀х^a1

· у = a_{0 *}e^a1x

Строится многофакторная модель – следующим шагом. В качестве основных сглаживающих функций выступают линейные многочлены и мультисистемные функции

Метод расчета – метод наименьших квадратов. Используется матрицы. Надо проводить в начале выравнивание.

Оценка адекватности и точности построения моделей.

Адекватность полученных моделей, оценивается при помощи нескольких показателей. Полноту учета всех факторов, влияющих на результирующий признак характеризуется коэффициент множественной корреляции, он определяется:

________

R = √1 – D\Dy

D₀ – остаточная дисперсия, т.е. это характеристика, которая показывает рассеяние случайной величины

Yi – относительную уравнения регрессии

Dy - дисперсия Y относительно среднего значения

Используется коэффициент детерминации – это коэффициент множественной корреляции в квадрате (R),он показывает долю изменчивости результативного признака за счет всех факторов, включенных в модель. Точность модели можно оценить по средней относительной ошибке.

Scp = 1\n Σ |(y_i - y_pi)| * 100%\y_i

ⁱ⁼¹

Sср показывает на сколько процентов расчетные значения в среднем отклоняются от фактических. Можно рассчитать доверительный интервал, который показывает пределы возможных значений у. Величина доверительного интервала определяется:

∆ = y ± tσ*

t – доверительная вероятность, она зависит от уровня риска

σ – среднее квадратическое отклонение i-го значения у от истинного

При этом считается что yi распределены по нормальному закону с одинаковой дисперсией, а за ее оценку принимается значение остаточной дисперсии.

Для оценки адекватности используется критерий согласия.

⇐ Предыдущая 1 2 3 456 7 8 9 10 Следующая ⇒

Поделиться с друзьями:

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...

Адаптации растений и животных к жизни в горах: Большое значение для жизни организмов в горах имеют степень расчленения, крутизна и экспозиционные различия склонов...