Лабораторная работа - расчет параметров линейной регрессии - файл n1.doc

Лабораторная работа - расчет параметров линейной регрессии
скачать (390 kb.)
Доступные файлы (1):
n1.doc390kb.09.09.2012 03:42скачать

n1.doc

Варианты заданий контрольной работы №1
В таблице 7 приведены данные по территориям региона за 199Х год. Число k рассчитывается по формуле k = 100 + 10i + j, k = 100 + 1017 +17=287,

где i, j две последние цифры зачетной книжки соответственно.

Требуется:

1. Построить поле корреляции.

2. Для характеристики зависимости у от х:

а) построить линейное уравнение парной регрессии у от х;

б) оценить тесноту связи с помощью показателей корреляции и коэффициента детерминации;

в) оценить качество линейного уравнения с помощью средней ошибки аппроксимации;

г) дать оценку силы связи с помощью среднего коэффициента эластичности и бета – коэффициента;

д) оценить статистическую надежность результатов регрессионного моделирования с помощью F – критерия Фишера.

е) оценить статистическую значимость параметров регрессии и корреляции.

3. Проверить результаты, полученные в п. 2 с помощью ППП Excel.

4. Рассчитать параметры показательной парной регрессии. Проверить результаты с помощью ППП Excel. Оценить статистическую надежность указанной модели с помощью F – критерия Фишера.

5. Обоснованно выбрать лучшую модель и рассчитать по ней прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от среднего уровня. Определить доверительный интервал прогноза при уровне значимости  = 0,05.

k = 100 + 10i + j, k = 100 + 101+7=287




K=

117

номер зачетной книжки 17

I =

1




J=

7




№ региона

Среднедушевой прожиточный минимум в день, руб.

Среднедневная

 

х

зарплата, руб.

 

x

у

y

1

97

k +2i

119

2

79

k – 4j

89

3

86

k + j

124

4

77

k – 3i

114

5

104

k + i

118

6

69

k – 5i

112

7

100

k j

110

8

93

k + 2j

131

9

81

k i

116

10

102

k + 4i

121

11

74

k – 3j

96

12

90

k

117




Для расчета параметров линейной регрессии строим расчетную таблицу

 

x

y

X*У

x2

y2



(у-)

A1

(y-)2

(x-)2

(-)2

(y-)2

 

1

2

3

4

5

6

7

8

9

10

11

 

 

 

 

1*2

1*1

2*2

а+в*1

ст.2-6

7/2*100%

7*7)2

1-хср)2

уср-6)2

 

1,00

97,00

119,00

11543,00

9409,00

14161,00

118,41

0,59

0,49

0,34

87,11

20,22

25,84

2,00

79,00

89,00

7031,00

6241,00

7921,00

109,74

-20,74

-23,30

430,21

75,11

17,43

620,84

3,00

86,00

124,00

10664,00

7396,00

15376,00

113,11

10,89

8,78

118,51

2,78

0,64

101,67

4,00

77,00

114,00

8778,00

5929,00

12996,00

108,78

5,22

4,58

27,27

113,78

26,41

0,01

5,00

104,00

118,00

12272,00

10816,00

13924,00

121,79

-3,79

-3,21

14,33

266,78

61,92

16,67

6,00

69,00

112,00

7728,00

4761,00

12544,00

104,92

7,08

6,32

50,07

348,44

80,87

3,67

7,00

100,00

110,00

11000,00

10000,00

12100,00

119,86

-9,86

-8,96

97,19

152,11

35,30

15,34

8,00

93,00

131,00

12183,00

8649,00

17161,00

116,49

14,51

11,08

210,65

28,44

6,60

291,84

9,00

81,00

116,00

9396,00

6561,00

13456,00

110,70

5,30

4,56

28,04

44,44

10,32

4,34

10,00

102,00

121,00

12342,00

10404,00

14641,00

120,82

0,18

0,15

0,03

205,44

47,68

50,17

11,00

74,00

96,00

7104,00

5476,00

9216,00

107,33

-11,33

-11,80

128,43

186,78

43,35

321,01

12,00

90,00

117,00

10530,00

8100,00

13689,00

115,04

1,96

1,67

3,84

5,44

1,26

9,51

итого

1052,00

1367,00

120571,00

93742,00

157185,00

1367,00

0,00

-9,64

1108,91

1516,67

352,00

1460,92

среднее

87,67

113,92

10047,58

7811,83

13098,75

113,92

0,00

-0,80

92,41

126,39

29,33

121,74

бетта

0,48

 

 

 

 

 

 

 

 

 

 

 

альфа

71,7

 

 

 

 

 

 

 

 

 

 

 

сигма

11,2

11,0

 

 

 

 

 

 

 

 

 

 

сигма2

126,39

121,74

 

 

 

 

 

 

 

 

 

 


2 а) Построим линейное уравнение парной регрессии у по х. Используя данные таблицы 3, имеем

,

.

Тогда линейное уравнение парной регрессии имеет вид .

Оно показывает, что с увеличением среднедушевого прожиточного минимума на 1 руб. средняя зарплата возрастает в среднем на 0.48 руб.

2 б) Тесноту линейной связи оценим с помощью линейного коэффициента парной корреляции

.

Найдем коэффициент детерминации.

Это означает, что 24 % вариации заработной платы у объясняется вариацией фактора х – среднедушевого прожиточного минимума.
2 в) Для оценки качества полученной модели найдем среднюю ошибку аппроксимации

.

В среднем, расчетные значения отклоняются от фактических на -0.80%. Качество построенной модели оценивается как хорошее, т.к. значение – менее 8 %.

2 г) Для оценки силы связи признаков у и х найдем средний коэффициент эластичности

.

таким образом, в среднем на 0,37% по совокупности изменится среднедневная зарплата от своей средней величины при изменении среднедушевого прожиточного минимума в день одного трудоспособного на 1%. Бета–коэффициент ,

показывает, что среднее квадратическое отклонение среднедневной зарплаты изменится в среднем на 49% от своего значения при изменении прожиточного минимума в день одного трудоспособного на величину его среднего квадратического отклонения.
2 д) Для оценки статистической надежности результатов используем F – критерий Фишера.

Выдвигаем нулевую гипотезу Но о статистической незначимости полученного линейного уравнения. Рассчитаем фактическое значение F–критерия при заданном уровне значимости = 0,05

.

Сравнивая табличное Fтабл = 4,96 и фактическое значения, отмечаем, что , что указывает на необходимость принять выдвинутую гипотезу Но.
2 е) Оценку статистической значимости параметров регрессии проведем с помощью t – статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей.

Выдвигаем гипотезу H0 о статистически незначимом отличии показателей регрессии от нуля:

= = rxy = 0.

Табличное значение t – статистики tтабл для числа степеней свободы df = n – 2 = 12 – 2 = 10

при заданном уровне значимости  = 0,05 составляет 2,23.

Определим величину случайных ошибок , , .

Найдем соответствующие фактические значения t – критерия Стьюдента , , .

Фактические значения t – статистики меньше табличного значения tтабл= 2,23 , , ,

поэтому гипотеза H0 о статистически незначимом отличии показателей регрессии от нуля отклоняется, т.е. параметры ,  и rxy не случайно отличаются от нуля, а статистически значимы.

Для расчета доверительных интервалов для параметров  и  определим их предельные ошибки

, .

Доверительные интервалы для параметра : (13,69 – 130,29), для параметра : (-0,188; 1,143).

С вероятностью р = 1 –  = 1 – 0,05 = 0,95

можно утверждать, что параметры  и , находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
3. Проверим результаты, полученные в п. 2 с помощью ППП Excel.

Параметры парной регрессии вида определяет встроенная стат.функция ЛИНЕЙН.

Раскрывая таблицу , затем комбинацию клавиш ++.

Выводится дополнительная регрессионная статистика:

Значение коэффициента 

0,481758

71,68253

Значение коэффициента 

Ср.вадратич.отклонение 

0,270398

23,89901

Среднее квадратич. отклонение 

Коэффициент детерминации R2

0,240948

10,53049

Cреднеквадратическое отклонение у

F – статистика

3,174325

10

Число степеней свободы

Регрессионная сумма квадратов

352,0047

1108,912

Остаточная сумма квадратов


С помощью инструмента анализа данных Регрессия, помимо результатов регрессионной статистики, дисперсионного анализа и доверительных интервалов получаем остатки и графики подбора линии регрессии, остатков и нормальной вероятности.

Результаты регрессионного анализа для данных рассматриваемой задачи

Регрессионная статистика

Множественный R

0,475703

R-квадрат

0,226293

Нормированный R-квадрат

0,140326

Стандартная ошибка

11,0981

Наблюдения

11




Дисперсионный анализ













 

df

SS

MS

F

Значимость F




Регрессия

1

324,2162

324,2162

2,632311

0,139158




Остаток

9

1108,511

123,1679










Итого

10

1432,727

 

 

 







Пересе-

чение 

Коэф-ты

Станд-ая

ошибка

t-

стат-ка

P-

Значение

Нижние

95%

Верхние

95%

Нижние

95,0%

Верхние

95,0%

Y

71,99412

25,77252

2,793445

0,020936

13,69262

130,2956

13,69262

130,2956

х

0,477555

0,294344

1,62244

0,139158

-0,1883

1,143406

-0,1883

1,143406




ВЫВОД ОСТАТКА




Наблюдение

Предсказанное 119

Остатки

1

109,7209

-20,7209

2

113,0638

10,93618

3

108,7658

5,234173

4

121,6598

-3,6598

5

104,9454

7,054611

6

119,7496

-9,74958

7

116,4067

14,5933

8

110,676

5,323954

9

120,7047

0,295306

10

107,3332

-11,3332

11

114,974

2,025962



Сравнивая полученные вручную и с помощью ППП Excel. данные, убеждаемся в правильности выполненных действий.
4. Построению показательной модели предшествует процедура линеаризации переменных.

Прологарифмируем обе части уравнения (2), получим .

Введем обозначения , , .

Тогда уравнение запишется в виде .

Параметры полученной линейной модели рассчитываем аналогично тому, как это было сделано выше. Используем данные расчетной таблицы ниже




x

y

x * y

x2

y2



(у-)

A1

(y-)2

(x-)2

(-)2

(-Y)2

1

97

4,7791

463,57

9409,00

22,84

4,7719

0,0072

0,1503

0,0001

87,11

11912,57

0,002

2

79

4,4886

354,60

6241,00

20,15

4,6919

-0,2032

4,5275

0,0413

75,11

11930,06

0,058

3

86

4,8203

414,54

7396,00

23,24

4,7230

0,0973

2,0181

0,0095

2,78

11923,26

0,008

4

77

4,7362

364,69

5929,00

22,43

4,6830

0,0532

1,1241

0,0028

113,78

11932,00

0,000

5

104

4,7707

496,15

10816,00

22,76

4,8031

-0,0324

0,6792

0,0010

266,78

11905,77

0,002

6

69

4,7185

325,58

4761,00

22,26

4,6474

0,0711

1,5075

0,0051

348,44

11939,78

0,000

7

100

4,7005

470,05

10000,00

22,09

4,7853

-0,0848

1,8043

0,0072

152,11

11909,66

0,001

8

93

4,8752

453,39

8649,00

23,77

4,7541

0,1211

2,4830

0,0147

28,44

11916,46

0,021

9

81

4,7536

385,04

6561,00

22,60

4,7008

0,0528

1,1115

0,0028

44,44

11928,12

0,001

10

102

4,7958

489,17

10404,00

23,00

4,7942

0,0016

0,0334

0,0000

205,44

11907,72

0,004

11

74

4,5643

337,76

5476,00

20,83

4,6696

-0,1053

2,3062

0,0111

186,78

11934,92

0,028

12

90

4,7622

428,60

8100,00

22,68

4,7408

0,0214

0,4489

0,0005

5,44

11919,37

0,001

итого

1052,00

56,77

4983,15

93742,00

268,65

56,7650

0,00

18,1939

0,0959

1516,67

143059,68

0,126

средн

87,6667

4,7304

415,26

7811,83

22,39

4,7304

0,0000

1,5162

0,0080

126,39

11921,64

0,010

?

0,0044

 

 

 

 

 

 

 

 

 

 

 

?

4,3404

 

 

 

 

 

 

 

 

 

 

 

?

11,242

0,102

 

 

 

 

 

 

 

 

 

 


Построим линейное уравнение парной регрессии Y по х. Используя данные таблицы, имеем

, .

Получим линейное уравнение регрессии .

Тесноту полученной линейной модели характеризует линейный коэффициент парной корреляции .

Коэффициент детерминации при этом равен .

Это означает, что почти 24% вариации фактора Y объясняется вариацией фактора х.

Средняя ошибка линейной аппроксимации составляет

.

Проведя потенцирование уравнения, получим искомую нелинейную (показательную) модель .

Результаты вычисления параметров показательной кривой можно проверить с помощью ППП Excel, для чего используем встроенную статистическую функцию ЛГРФПРИБЛ.
Результат вычисления функции ЛГРФПРИБЛ

1,00446

76,73601

0,00252

0,222291

0,23836

0,097947

3,12949

10

0,03002

0,095935


Для расчета индекса корреляции нелинейной регрессии воспользуемся вспомогательной

 

x

y



(y-)2

(x-)2

(y-)2

1

97,00

119,00

118,41

0,34

87,11

25,84

2

79,00

89,00

109,74

430,21

75,11

620,84

3

86,00

124,00

113,11

118,51

2,78

101,67

4

77,00

114,00

108,78

27,27

113,78

0,01

5

104,00

118,00

121,79

14,33

266,78

16,67

6

69,00

112,00

104,92

50,07

348,44

3,67

7

100,00

110,00

119,86

97,19

152,11

15,34

8

93,00

131,00

116,49

210,65

28,44

291,84

9

81,00

116,00

110,70

28,04

44,44

4,34

10

102,00

121,00

120,82

0,03

205,44

50,17

11

74,00

96,00

107,33

128,43

186,78

321,01

12

90,00

117,00

115,04

3,84

5,44

9,51

итого

1052,00

1367,00

1367,00

1108,91

1516,67

1460,92

среднее

87,67

113,92

113,92

92,41

126,39

121,74


.

Найдем коэффициент детерминации .

Это означает, что 24 % вариации заработной платы у объясняется вариацией фактора х – среднедушевого прожиточного минимума.

Рассчитаем фактическое значение F – критерия при заданном уровне значимости  = 0,05 .

Сравнивая табличное Fтабл = 4,96 и фактическое значения, отмечаем, что , что указывает на необходимость принять гипотезу Но о статистически незначимых параметрах уравнения.
5. Так как коэффициенты детерминации, соответствующие линейной и показательной моделям практически равны (около 24 % вариации заработной платы у объясняется вариацией фактора х – среднедушевого прожиточного минимума в обеих моделях), то нет весомых оснований отдать предпочтение какой либо модели. Тем не менее, прогнозное значение результата рассчитаем по показательной модели (<).

По условию задачи прогнозное значение фактора выше его среднего уровня на 5%, тогда оно составляет , и прогнозное значение зарплаты при этом составит руб.

Найдем ошибку прогноза

и доверительный интервал прогноза при уровне значимости  = 0,05.

Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит .

Доверительный интервал прогноза ( ).


литература



1. Доугерти К. Введение в эконометрику.– М.: Финансы и статистика, 1999.
2. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика: Начальный курс.– М.: Дело, 2001.
3. Эконометрика. Под ред. И. И. Елисеевой.– М.: Финансы и статистика, 2001.
4. Афанасьев В. Н., Юзбашев М. М. Анализ временных рядов и прогнозирование.– М.: Финансы и статистика, 2001.
5. Экономико–математические методы и прикладные модели. Под ред. В. В. Федосеева.– М.: ЮНИТИ, 2001.
5. Экономико–математические методы и модели. Под ред. А. В. Кузнецова.– Минск: БГЭУ, 2000.
4. Кулинич Е. И. Эконометрика.– М.: Финансы и статистика, 2001.








Варианты заданий контрольной работы №1
Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации