Лабораторная - Корреляционно-регрессионный анализ - файл n1.doc

Лабораторная - Корреляционно-регрессионный анализ
скачать (216 kb.)
Доступные файлы (1):
n1.doc216kb.01.06.2012 07:43скачать

n1.doc

Цель: закрепление теоретического и практического материала по теме множественная регрессия, приобретение навыков построения и анализа многофакторных эконометрических моделей в модуле Множественная регрессия.

1. Необходимо проверить наличие линейной множественной связи между соответствующими показателями (доход банка и объем средства юридических лиц (Х1) и объем средства физических лиц (Х2)) в модуле Multіple Regressіon ППП Statіstіca. Построить линейную многофакторную эконометрическую модель. Рассчитать ее характеристики (среднее квадратичное отклонение параметров модели, дисперсию и среднее квадратичное отклонение ошибок модели, коэффициенты множественной корреляции и детерминации коэффициенты).

2. Проверить статистическую значимость параметров модели, коэффициенту множественной корреляции. Проверить адекватность модели в целом.

3. Проанализировать модель с точки зрения мультиколинеарности. Рассчитать матрицу парных корреляций для факторов.

4. Проанализировать ошибки модели. Проверить модель на наличие автокорреляции.

6. Спрогнозировать ситуацию на 1 шаг вперед.

Вариант 10



Y

X1

X2

1

77,25

13,38

8,87

2

64,68

10,5

10,9

3

74,68

11,9

11,6

4

70,29

12,8

8,3

5

72,68

12,4

10,9

6

100,69

12,7

18,2

7

98,59

14,4

12,9

8

91,48

13,9

13,1

9

99,68

14,5

13,9

10

102,68

14,7

12,6

11

96,36

14,8

10,9

12

57,69

9,4

11,9

13

113,03

15,9

13,3

14

114,68

16,2

14

15

115,61

16,8

11,9




Найти прогнозное значение дохода банка и доверительные интервалы, если объем средства юридических лиц (Х1 пр) будет составлять 22 млн. грн., а объем средства физических лиц (Х2 пр) - 15 млн. грн.
Ход работы:

1. Ввод исходных данных.

Для построения и всестороннего анализа множественных линейных экономических моделей в Statistica предусмотрен модуль Multiple Regression.

Вносим исходные данные для построения модели. Заходим в меню Множественная регрессия и заносим зависимую и независимые переменные для построения многофакторной регрессионной модели.



Рис. 1. Окно множественной регрессии

2. Построение линейной многофакторной модели.

Построим линейную многофакторную модель и определим все ее характеристики (параметры модели, среднеквадратическое отклонение параметров модели, дисперсию и среднеквадратическое отклонение ошибок модели, коэффициенты множественной корреляции и детерминации). Проверим статистическую значимость модели и адекватность параметров модели по критерию Фишера.



Рис.2. Результаты регрессионного анализа

Во вкладке Advanced выбираем Summary: Regression Results.



Рис.3. Результаты регрессионного анализа

Проанализируем полученные результаты модели:

R = коэффициент множественной корреляции. Если значение не стремится к единице, то модель не адекватна.

R?= - коэффициент детерминации модели, стремится к 1. Показывает, что вариация зависимой переменной зависит от вариации независимой переменной.

Adjusted R?= - скорректированный коэффициент детерминации.

F(2,12) = 0,47 - критерий адекватности Фишера. Если полученное значение меньше табличного, значит модель статистически не значима. Так как вычисленное значение F –отношения - F факт при заданном уровне значимости больше критического (табличного) F табл , т.е. F факт > F табл = F(2,n-2), то признаётся статистическая значимость уравнения регрессии, т.е. связь между рассматриваемыми признаками есть и результаты наблюдений не противоречат предположению о её линейности.

dF- число степеней свободы

P = – вероятность ошибки для критерию Фишера. Если p>0.05, то модель статистически не значима.

Std. Error of estimate = - среднее квадратическое отклонение ошибок модели. Если значение велико, то модель не адекватна.

B = (-53,35;7,8;3,03) - параметры модели, значит уравнение регрессии имеет вид: Y = -53,35+7,8х1+ 3,03x2.

Std. Error of Bеta = - среднее квадратическое отклонение параметров модели.

t(12) = - значимость параметров по критерию Стьюдента. =0,05 при к=n-2=13 степенях свободы критерий Стьютента tтабл. = 2,16. tрас. =11,12> tтабл. Так как вычисленное значение t – статистики - |tфакт| при заданном уровне значимости ? больше критического (табличного) t табл,, можно говорить о принятии гипотезы H1. Это подтверждает статистическую значимость коэффициента регрессии.

Р-level =– вероятность к критерию Стьюдента. Если p>0.05, то модель статистически не значима.

В целом, предложенная модель адекватна исследуемому процессу.

3. Проверка модели на наличие мультиколинеарности.

Одним из способов проверки модели на мультиколинеарность является расчет матрицы парных корреляций. Для этого в окне Review Descriptive Statistics во вкладке Quick выбираем Correlation.



Рис.4. Выбор опции Descriptive statistics / Correlation



Рис.5. Матрица парных корреляций

4. Расчет и исследование ошибок модели.

Для дальнейшего анализа необходимо рассчитать теоретические значения зависимой переменной и ошибки модели, привести результаты исследования модели по критерию Дарбина-Уотсона и нециклического коэффициента автокорреляции.

Рассчитаем теоретические значения зависимой переменной. Для этого построим гистограмму и график распределения ошибок на нормальной вероятностной бумаге.

В модуле множественной регрессии во вкладке Residuals выбираем Descriptive Statistics. В открывшимся окне во вкладке Advanced выбираем Matrix plot of correlations.



Рис. 6. Диаграммы и гистограммы рассеивания переменных

Чтобы рассчитать и проанализировать остатки, в нижней части окна результатов регрессионного анализа есть опция Perform residual analysis (Всесторонний анализ остатков). Инициировав данную опцию мы получим меню для анализа ошибок модели.

Кнопка анализа ошибок Summary: Residuals & Predicted отображает наблюдаемые значения зависимой переменной (Observed value), теоретические значения зависимой переменной (Predicted value) и ошибки модели (Residual), как разницу наблюдаемых и теоретических значений.



Рис.7. Анализ ошибок модели

Для выполнения прогнозов по полученному уравнению необходимо показать, что регрессионная модель адекватна результатам наблюдений. С этой целью можно воспользоваться критерием Дарбина-Уотсона, согласно которого, рассчитанный системой Statistica коэффициент dрасч необходимо сравнить с табличным значением dтабл (для совокупности объемом n=15, уровня значимости a=0,05 и двух оцениваемых параметров регрессии, значение dтабл=1,54). Если dрасч>dтабл, то полученная модель адекватна и пригодна для прогнозирования. Для определения dрасч в Statistica в окне Residual Analysis на вкладке Advanced необходимо выбрать опцию Durbin-Watson statistic:




Рис.7 Автокорреляция ошибок модели

5. Расчет прогноза значений зависимых переменных и доверительных интервалов изменения.

Чтобы рассчитать прогнозные значения зависимой переменной, в нижней части окна результатов регрессионного анализа есть опция Predict dependent variable. Выбираем значения для параметров модели.



Рис.12. Выбор значений параметров модели



Рис.13. Результаты прогнозирования

Прогнозное значение у =163, 85. Доверительный интервал прогноза от 158,21 до 169,5. Модель прогноза можно считать хорошей, так как доверительный интервал не широкий.
Вывод: прогнозное значение дохода банка при объемах средств юридических лиц 22 млн. грн. и при объеме средств физических лиц 22 млн. грн., составило 163,85 млн. грн. Интервал прогноза равен 158,21 и 169,5 млн. грн.

Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации