Контрольная работа по эконометрике - файл n1.docx

Контрольная работа по эконометрике
скачать (194 kb.)
Доступные файлы (1):
n1.docx194kb.18.09.2012 13:59скачать

n1.docx



Задача 1

"Парная регрессия и корреляция"

2. Имеются данные по 12 группам населения о среднегодовом доходе и уровне потребления мяса жителями штата Канзас (США):

К заданию 5) X*=51,4.




Среднегодовой

доход

в среднем

по группе,

тыс. дол.

Х

Годовое

Потребление

мяса на душу

населения

в среднем

по группе, кг.

У

1

2

3

1

41,5

41,2

2

29,6

35,3

3

31,8

40,7

4

69,8

55,1

5

100,5

80,1

6

93,3

65,9

7

82,1

64,2

8

77,4

70,5

9

55,7

61,1

10

38,9

51,7

11

45,2

59,4

12

60,2

65,8


1). Для условия задачи поле корреляции выглядит следующим образом:
Между годовым потреблением мяса на душу населения (Y) и среднегодовым доходом населения (X) визуально определяется прямая линейная зависимость.

2). Определим параметры уравнения парной линейной регрессии. Вычисления удобно организовать в таблицу. При этом сначала рассчитываются средние значения и по данным столбцов 2 и 3. Затем в столбцах 4 и 5 рассчитываются , , i = 1, …, n, и в столбце 8 их произведение.





Средне-годовой

доход

в среднем

по группе,

тыс. дол.

Х

Годовое

Потребление

мяса на душу

населения

в среднем

по группе, кг.

У

х-

у-





(х-)

(у-)



e

1

2

3

4

5

6

7

8

9

10

1

41,5

41,2

-19

-16,38

361

268,30

311,22

48,26

-7,06

2

29,6

35,3

-30,9

-22,28

954,81

496,39

688,45

42,43

-7,13

3

31,8

40,7

-28,7

-16,88

823,69

284,93

484,45

43,51

-2,81

4

69,8

55,1

9,3

-2,48

86,49

6,15

-23,06

62,13

-7,03

5

100,5

80,1

40

22,52

1600

507,15

900,8

77,17

2,92

6

93,3

65,9

32,8

8,32

1075,84

69,22

272,89

73,64

-7,74

7

82,1

64,2

21,6

6,62

466,56

43,82

142,99

68,15

-3,95

8

77,4

70,5

16,9

12,92

285,61

166,92

218,34

65,85

4,62

9

55,7

61,1

-4,8

3,52

23,04

12,39

-16,89

55,22

5,82

10

38,9

51,7

-21,6

-5,88

466,56

34,57

127

46,99

4,71

11

45,2

59,4

-15,3

1,82

234,09

3,31

27,84

50,07

9,31

12

60,2

65,8

-0,3

8,22

0,09

67,56

-2,46

57,42

8,34

Сум

ма

726

691

0

0,00

6377,78

1960,71

3131,57

690,84

0

Сред

нее

60,5

57,58























По формуле получим: =3131,57/6377,78=0,49.
По формуле получим: =57,58?0,49= 27,93.

Оцененное уравнение регрессии запишется в виде = 27,93+0,49X.

Интерпретация коэффициента регрессии. С увеличением среднегодового дохода населения на 1 тыс.долл. годовое потребление мяса на душу населения увеличится на 0,49кг.
3). Расчет линейного коэффициента корреляции проведем по формуле .

С учетом вычислений в столбцах 6, 7 и 8 таблицы, получим:

r= 3131,57/() = 0,88.

Т.е. связь между изучаемыми переменными прямая (коэффициент корреляции положителен) линейная.

Определим коэффициент детерминации R2=0,882=0,774. Т.е. 77,4% вариации годового потребления мяса объясняется вариацией среднегодового дохода населения.

4). Оценим статистическую значимость коэффициента регрессии .

Рассчитаем дисперсию ошибки регрессии по формуле с учетом столбца 10 таблицы: =475,61/(12-2)= 47,561.

Рассчитаем стандартную ошибку коэффициента регрессии по формуле :

= = = 0,0908.

Тогда по формуле фактическое значение t статистики составит t=0,49/0,0908= 5,396.

По таблице находим для уровня значимости по условию 1?0,95=0,05 и числа степеней свободы 10: t0,05;10=2,228. Поскольку t0,05;10<t, то коэффициент регрессии  значим, т.е. наличие статистической связи между среднегодовым доходом и годовым потреблением мяса на душу населения статистически подтверждается.

Для проверки значимости уравнения регрессии в целом воспользуемся формулой:

F = F= = 34,24.

Поскольку табличное значение F распределения Фишера F0,05;1;10=4,96 меньше расчетного, то гипотеза о статистической незначимости коэффициента регрессии должна быть отвергнута.

5). Рассчитаем прогнозное значение для X*. Полученный интервал будет характеризовать значения результативного признака (выручки) при заданном значении факторного признака (среднегодовой доход) для отдельной наблюдаемой единицы. Построим точечный прогноз:

= 27,93+0,4951,4 = 53,116

Построим 95% доверительный интервал для прогноза по формуле .

Определим сначала = + = 0,096

И, следовательно: 53,116 2,228 = 53,116 16,083

или 37,033 69,199.
Таким образом, с вероятностью 0,95 можно утверждать, что прогнозное значение годового потребления мяса на душу населения в среднем по группе, среднегодовой доход которой за месяц составит 51,4 тыс.долл. будет находиться в интервале от 37,033 до 69,199 кг.

Задача 2

"Множественная регрессия и корреляция"
2. Приведены данные о тарифах на размещение одной страницы цветной рекламы в ведущих американских журналах (тыс. долл.), численности планируемой аудитории (млн. чел.), проценте мужчин-читателей.


Издание

Тариф,

тыс. долл.

Численность

планируемой

аудитории,

млн. чел.

Процент

Мужчин

-читателей,

%




У





Business Week

115,1

5,9

71,1

Cosmopolitan

97,1

17

15,2

Elle

53,6

4,1

8,5

Fortune

61,5

4,6

69,1

Forbes

55,3

5,2

70,3

Life

68,9

16,8

49,7

People

130

41,3

33,1

Reader's Digest

197

56,4

40,3

Newsweek

145,1

24,7

55

National Geographic

167

36,5

59,6

Seventeen

77,5

6,3

8,5

The New Yorker

63,1

4,3

44,3

Time

158

29,9

53,9

TV Guide

135

51,9

40,1

Vogue

65,8

10,1

11,3

Сумма

1590

315

630

Среднее



106



21

42


Задание.

1). Определите парные и частные коэффициенты корреляции. Сделайте выводы.

2). Постройте линейное уравнение множественной регрессии и поясните смысл его параметров. Рассчитайте скорректированный коэффициент детерминации.

3). Проверьте значимость уравнения регрессии на 95% уровне.

4). Рассчитайте коэффициенты эластичности. Дайте их интерпретацию.

5). Постройте 95% доверительные интервалы для коэффициентов регрессии. Проверьте значимость каждого из коэффициентов.


2. Приведены данные о тарифах на размещение одной страницы цветной рекламы в ведущих американских журналах (тыс. долл.), численности планируемой аудитории (млн. чел.), проценте мужчин-читателей.





Тариф

тыс. долл.

Численность

планируемой

аудитории,

млн. чел.

Процент

Мужчин

Чита

телей,

%

-







У-



-

(У-)

(У-)

-






У
































1

115,1

5,9

71,1

-15,1

228,01

29,1

846,81

9,09

82,62

-137,25

264,51

-439,41

2

97,1

17

15,2

-4

16

-26,8

718,24

-8,9

79,21

35,6

238,52

107,2

3

53,6

4,1

8,5

-16,9

285,61

-33,5

1122,25

-52,4

2745,76

885,56

1755,4

566,15

4

61,5

4,6

69,1

-16,4

268,96

27,1

734,41

-44,5

1980,25

729,8

-1205,95

-444,44

5

55,3

5,2

70,3

-15,8

249,64

28,3

800,89

-50,7

2570,49

801,06

-1434,81

-447,14

6

68,9

16,8

49,7

-4,2

17,64

7,7

59,29

-37,1

1376,41

155,82

-285,67

-32,34

7

130

41,3

33,1

20,3

412,09

-8,9

79,21

24

576

487,2

-213,6

-180,67

8

197

56,4

40,3

35,4

1253,16

-1,7

2,89

91

8281

3221,4

-154,7

-60,18

9

145,1

24,7

55

3,7

13,69

13

169

39,1

1528,81

144,67

508,3

48,1

10

167

36,5

59,6

15,5

240,25

17,6

309,76

61

3721

945,5

1073,6

272,8

11

77,5

6,3

8,5

-14,7

216,09

-33,5

1122,25

-28,5

812,25

418,95

954,75

492,45

12

63,1

4,3

44,3

-16,7

278,89

2,3

5,29

-42,9

1840,41

716,43

-98,67

-38,41

13

158

29,9

53,9

8,9

79,21

11,9

141,61

52

2704

462,8

618,8

105,91

14

135

51,9

40,1

30,9

954,81

-1,9

3,61

29

841

896,1

-55,1

-58,71

15

65,8

10,1

11,3

-10,9

118,81

-30,7

942,49

-40,2

1616,04

438,18

1234,14

334,63

Сумма

1590

315

630

0

4632,86

0

7058

0

30755,25

10201,82

3199,52

225,94

Среднее



106



21



42






























Решение.

1). Рассчитаем средние значения переменных =106, =21 и =42. Определим парные коэффициенты корреляции по формулам.

= = 0,854

= = 0,217

= = 0,39

Значение парного коэффициента корреляции свидетельствует о сильной линейной связи между переменными Y и X1. Связь между X2 и Y существенно слабее. Кроме того, теснота связи между X1 и X2 небольшая. Таким образом, можно сделать предварительное заключение, что численность мужчин-читателей, существенно не влияет на рост тарифов на размещение одной страницы цветной рекламы в ведущих американских журналах.
Расчет частных коэффициентов корреляции по формулам дает соответственно:

= = 0,857

= = = -0,242.

= = = 0,403.
Коэффициенты частной корреляции дают более точную характеристику тесноты зависимости двух признаков, чем коэффициенты парной корреляции, так как "очищают" парную зависимость от взаимодействия данной пары переменных с другими переменными, представленными в модели. Наиболее тесно связаны Y и X1. Другие взаимосвязи существенно слабее. При сравнении коэффициентов парной и частной корреляции видно, что из-за влияния межфакторной зависимости между X1 и X2 происходит завышение оценки тесноты связи между переменными.
2). Построим линейное уравнение множественной регрессии



Вычислим сначала = 45,28

= = 17,57 = =21,69


Затем получим оценки уравнения регрессии:




= = = 2,93

= = = -1,46

106 – 2,93 * 21 – (-1,46)*42 = 106 – 61,53+ 61,32 = 105,79

Уравнение регрессии имеет вид: =105,79+2,93X1+(-1,46)X2.
Интерпретация коэффициентов регрессии. Константа оценивает агрегированное влияние прочих (кроме учтенных в модели X1 и X2) факторов на результат Y и означает, что тариф на размещение одной страницы цветной рекламы в ведущих американских журналах (тыс. долл.), без учета численности планируемой аудитории составил бы 105,79 тыс.у.е.
Рассчитаем скорректированный коэффициент детерминации по формуле

= 1 – = 0,658

Т.о. 65,8% вариации зависимой переменной объясняется вариацией независимых переменных.


3). Проверим значимость уравнения регрессии на 95% уровне. Рассчитаем фактическое значение F статистики по формуле :

=0,746/(1?0,746)(15?3)/2=17,62.

Для определения табличного значения F0,05; 2; 12 воспользуемся таблицами распределения Фишера для заданного уровня значимости 0,05, принимая во внимание, что число степеней свободы большей дисперсии равно 2, а число степеней свободы меньшей дисперсии равно 12, F0,05; 2; 12=3,89.

Так как 17,62=F>F0,05; 2; 12=3,89, то нулевая гипотеза отклоняется, и с вероятностью 0,95 можно говорить о статистической значимости уравнения регрессии.
4). Рассчитаем коэффициенты эластичности.

=2,93.21/106=0,58.

= -1,46.42/106= - 0,57.

Значения коэффициентов эластичности позволяют сделать вывод о большем влиянии на тариф на размещение одной страницы цветной рекламы в ведущих американских журналах численности планируемой аудитории, нежели процента мужчин-читателей. В частности, при изменении фактора X1 на 1% от своего среднего значения и при фиксированном воздействии на Y другого фактора, включенного в уравнение регрессии, величина тарифа изменится на 0,58% от среднего значения.
5). Построим 95% доверительные интервалы для коэффициентов регрессии.

Вычислим стандартные ошибки коэффициентов

= : = 0,44, аналогично = : = 0,35.

Тогда с учетом t0,05; 12=2,179 получим:

= (15-3) = 2,932,179 = 2,93 или – 8,5714,43

= (15-3) = 0,162,1790,35 = 0,16 9,15 или - 8,999,31
Проверка значимости каждого из коэффициентов: поскольку доверительный интервал для 1 и 2 включает в себя ноль, то коэффициент 1 и коэффициент 2 не значимы на 95% уровне.
Задача 3

"Временные ряды в эконометрических исследованиях"

2.Динамика импорта КНР характеризуется поквартальными данными за 1999-2002 гг., млрд. $


Год/

Квартал

1999

2000

2001

2002

I

II

III

IV

I

II

III

IV

I

II

III

IV

I

Значение импорта

19,3

24,0

28,4

36,6

18,7

22,3

30,2

38,1

25,3

33,6

34,7

41,7

29,8

К заданию 2) – прогноз на 4 квартал 2002 г.
Решение:

1). Построим график ряда динамики.

На графике отчетливо видно, что значение импорта изменяется под воздействием сезонных колебаний. Заметен рост в 4 квартале каждого года (соответственно 4, 8, 12 кварталы), а затем снижение товарооборота в первом квартале каждого года (соответственно 5, 9, 13 кварталы).

Построение аддитивной модели начнем с выделения сезонной компоненты временного ряда.
В нашем случае =4 и h=n/=13/4=3,25.
Применим формулу .
Для этого просуммируем уровни ряда по 1-му кварталу по всем трём годам 19,3+18,7+25,3+29,8 = 93,1 и найдем среднее значение 93,1/4=23,275, и аналогично для остальных кварталов. Получим расчетную таблицу. Среднее значение по всем 13-ти наблюдениям равно 31,58. Вычитая из средних значений по кварталам 31,58, получим последнюю строку расчетной таблицы, в которой и содержатся значения сезонной компоненты St.





I

II

III

IV

1999

19,3

24,0

28,4

36,6

2000

18,7

22,3

30,2

38,1

2001

25,3

33,6

34,7

41,7

2002

29,8










Среднее по

одноименным

кварталам

23,3

26,6

31,1

38,8

St

- 8,28

- 4,98

- 0,47

7,22


Устраним сезонную компоненту из исходных уровней ряда и получим zi= в

столбце 4 расчетной таблицы, которая дана ниже.

Далее рассчитаем значения представленные в столбце 5 расчетной таблицы. Поскольку первые разности являются примерно одинаковыми (см. столбец 5), считаем, что ряд z имеет линейный тренд. Рассчитаем значения тренда Т. Модель тренда имеет вид . Расчет параметров уравнения проведем по формуле. Необходимые предварительные расчеты приведены в таблице в столбцах 6-8: столбец 7 получается путем возведения в квадрат значений столбца 6, столбец 8 равен произведению столбца 4 на столбец 6.

i

yi

Si



?i

t

t2

zt

T

Ei

Ei/yi

| Ei/yi |

1

2

3

4

5

6

7

8

9

10

11

12

1

19,3

- 8,28

27,58

-

-6

36

-165,48

28,208

-0,628

-0,03025

0,03025

2

24,0

- 4,98

28,98

1,4

-5

25

-144,9

29,325

-0,344

-0,01433

0,01433

3

28,4

- 0,47

28,87

-0,11

-4

16

-115,48

30,442

-1,572

-0,05535

0,05535

4

36,6

7,22

43,82

14,95

-3

9

-131,46

31,559

12,22

0,33387

0,33387

5

18,7

- 8,28

26,98

-16,84

-2

4

-53,96

32,676

-5,696

-0,30459

0,30459

6

22,3

- 4,98

27,28

0,3

-1

1

-27,28

33,793

-6,513

-0,29206

0,29206

7

30,2

- 0,47

30,67

3,39

0

0

0

34,91

-4,24

-0,14039

0,14039

8

38,1

7,22

45,32

14,65

1

1

45,32

36,027

9,293

0,24391

0,24391

9

25,3

- 8,28

33,58

-11,74

2

4

67,16

37,144

-3,564

-0,14086

0,14086

10

33,6

- 4,98

38,58

5

3

9

115,74

38,261

0,318

0,00946

0,00946

11

34,7

- 0,47

35,17

-3,41

4

16

140,68

39,378

-4,208

-0,12126

0,12126

12

41,7

7,22

48,92

13,75

5

25

244,6

40,495

8,425

0,20203

0,20203

13

29,8

- 8,28

38,08

-10,84

6

36

228,48

41,612

-3,532

-0,11852

0,11852

Сумма

453,83

10,5

0

182

203,42

453,83

-0,041

-0,42834

2,00688


Параметры уравнения линейного тренда: b = = 1,117 a = = 34,91

Таким образом, уравнение тренда имеет вид: T=34,91+1,117t.

Подставляя в уравнение тренда последовательно соответствующие значения t, получим значения тренда для каждого уровня временного ряда (столбец 9 расчетной таблицы), например, для t=?9,5 получим
T(?6)= 34,91+1,117(-6) = 28,208

T(?5)= 34,91+1,117(-5) = 29,325

T(?4)= 34,91+1,117(-4) = 30,442

T(?3)= 34,91+1,117(-3) = 31,559

T(?2)= 34,91+1,117(-2) = 32,676

T(?1)= 34,91+1,117(-1) = 33,793

T(0)= 34,91+1,117(0) = 34,91

T(1)= 34,91+1,117(1) = 36,027

T(2)= 34,91+1,117(2) = 37,144

T(3)= 34,91+1,117(3) = 38,261

T(4)= 34,91+1,117(4) = 39,378

T(5)= 34,91+1,117(5) = 40,495

T(6)= 34,91+1,117(6) = 41,612



После выделения тренда остаток E получается как разность между z и T (разность значений в столбцах 4 и 9) и представлен в столбце 10 расчетной таблицы.
2). Полученное уравнение временного ряда может быть использовано для краткосрочного прогнозирования. Так, если необходимо спрогнозировать значение импорта для 4 квартала 2002 года, то определим t=9, так как для 1 квартала 2002 года t=6, соответственно для 4 квартала 2002 года 9. Подставим значение t в уравнение тренда:
T(9)= 34,91+1,117∙(9)= 44,963.
С учетом того, что сезонная компонента равна для 4-го квартала 7,22, получим окончательно
44,963 +7,22 = 52,183
Таким образом, в четвёртом квартале 2002 года прогнозируется импорт 52,183 млрд. $.


3). Проверим качество полученной модели.

Рассчитаем среднюю процентную ошибку по формуле .

Расчет суммы приведен в столбце 11 таблицы выше. Таким образом:

MPE=(-0,42834)∙100/13= - 3,2949%, что гораздо меньше 5%.

Рассчитаем среднюю абсолютную процентную ошибку по формуле . Расчет суммы приведен в столбце 12 таблицы выше.
Таким образом: MАPE=(2,00688)∙100/13 = 15,4375%,

и поскольку MAPE<20%, то модель подогнана с хорошей точностью.

Средняя ошибка, рассчитанная по формуле с учетом суммы в столбце 10 таблицы, суть ME= -0,041/13 = - 0,003.

Задача 4

"Системы эконометрических уравнений"
2. Модель мультипликатора-акселератора:



где C – расходы на потребление, R – доход, I – инвестиции, t – текущий период, t-1 – предыдущий период.
1). Определить эндогенные, экзогенные, лаговые и предопределенные переменные модели.

2). Записать приведенную форму модели.
Решение.

1). Эндогенными переменными являются Ct, Yt, Rt. Экзогенные переменные - rt и Gt. Лаговые переменные Ct-1 и Rt-1. Предопределенные переменные rt, Ct-1 и Rt-1.

2). Приведенную форму модели можно получить путем алгебраических преобразований. Подставим выражение для Rt из третьего уравнения системы в первое и второе:

1) = +(+)++

2) = +(+) +

Выражая It из второго из уравнений и подставляя формулу для него в первое уравнение, получим:

=








(
) = (






++

-






+


Таким образом, приведенная форма модели имеет вид:





"Парная регрессия и корреляция"
Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации