Пусть у нас имеются данные о доходах (X) и спрос на некоторый товар (Y) за ряд лет (n)
ГОД
n
| ДОХОД
X
| СПРОС
Y
|
| x1
| y1
|
| x2
| y2
|
| x3
| y3
|
...
| ...
| ...
|
n
| xn
| yn
|
Предположим, что между X и Y существует линейная взаимосвязь, т.е.

Для того, чтобы найти уравнение регрессии, прежде всего нужно исследовать тесноту связи между случайными величинами X и Y, т.е. корреляционную зависимость.
Пусть:
x
, х
, . . . ,хn- совокупность значений независимого, факторного признака;
y
, y
. . . ,yn – совокупность соответствующих значений зависимого, результативного признака;
n – количество наблюдений.
Для нахождения уравнения регрессии вычисляются следующие величины:
1. Средние значения
для экзогенной переменной.
для эндогенной переменной$
2. Отклонения от средних величин
,
$
3. Величины дисперсии и среднего квадратичного отклонения
,
.

Величины дисперсии и среднего квадратичного отклонения характеризуют разброс наблюдаемых значений вокруг среднего значения. Чем больше дисперсия, тем больше разброс.
4. Вычисление корреляционного момента (коэффициента ковариации):

Корреляционный момент отражает характер взаимосвязи между xиy. Если
, то взаимосвязь прямая. Если
, то взаимосвязь обратная.
5. Коэффициент корреляции вычисляется по формуле:
.
Доказано, что коэффициент корреляции находится в интервале от минус единицы до плюс единицы (
). Коэффициент корреляции в квадрате (
) называется коэффициентом детерминации.
Если
, то вычисления продолжаются.
6. Вычисления параметров регрессионного уравнения.
Коэффициент bнаходится по формуле:

После чего можно легко найти параметр a:

Коэффициенты aиbнаходятся методом наименьших квадратов, основная идея которого состоит в том, что за меру суммарной погрешности принимается сумма квадратов разности (остатков) между фактическими значениями результативного признака
и его расчетными значениями
, полученными при помощи уравнения регрессии
.
При этом величины остатков находятся по формуле:
, где
фактическое значение y;
расчетное значение y.
Пример. Пусть у нас имеются статистические данные о доходах (X) и спросе (Y). Необходимо найти корреляционную зависимость между ними и определить параметры уравнения регрессии.
ГОД
n
| ДОХОД
X
| СПРОС
Y
|
|
|
|
|
|
|
|
|
|
|
| 10,3
|
|
| 10,5
|
|
|
|
Предположим, что между нашими величинами существует линейная зависимость.
Тогда расчеты лучше всего выполнить в Excel, используя статистические функции;
СРЗНАЧ – для вычисления средних значений;
ДИСП – для нахождения дисперсии;
СТАНДОТКЛОН – для определения среднего квадратичного отклонения;
КОРЕЛЛ – для вычисления коэффициента корреляции.
Корреляционный момент можно вычислить, найдя отклонения от средних значений для ряда X и ряда Y , затем при помощи функции СУММПРОИЗВ определить сумму их произведений, которую необходимо разделить на n-1.
Результаты вычислений можно свести в таблицу.