Контрольная работа по эконометрике - файл n1.docx
Контрольная работа по эконометрикескачать (194 kb.)
Доступные файлы (1):
n1.docx
Задача
1
"Парная регрессия и корреляция" 2. Имеются данные по 12 группам населения о среднегодовом доходе и уровне потребления мяса жителями штата Канзас (США):
К заданию 5)
X*=51,4.
-
| Среднегодовой доход в среднем по группе, тыс. дол. Х | Годовое Потребление мяса на душу населения в среднем по группе, кг. У |
1 | 2 | 3 |
1 | 41,5 | 41,2 |
2 | 29,6 | 35,3 |
3 | 31,8 | 40,7 |
4 | 69,8 | 55,1 |
5 | 100,5 | 80,1 |
6 | 93,3 | 65,9 |
7 | 82,1 | 64,2 |
8 | 77,4 | 70,5 |
9 | 55,7 | 61,1 |
10 | 38,9 | 51,7 |
11 | 45,2 | 59,4 |
12 | 60,2 | 65,8 |
1). Для условия задачи поле корреляции выглядит следующим образом:
Между годовым потреблением мяса на душу населения (
Y) и среднегодовым доходом населения (
X) визуально определяется прямая линейная зависимость.
2). Определим параметры уравнения парной линейной регрессии. Вычисления удобно организовать в таблицу. При этом сначала рассчитываются средние значения

и

по данным столбцов 2 и 3. Затем в столбцах 4 и 5 рассчитываются

,

,
i = 1, …,
n, и в столбце 8 их произведение.
| Средне-годовой доход в среднем по группе, тыс. дол. Х | Годовое Потребление мяса на душу населения в среднем по группе, кг. У | х- | у- |
 |
 | (х- )
(у- ) |
 | e |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
1 | 41,5 | 41,2 | -19 | -16,38 | 361 | 268,30 | 311,22 | 48,26 | -7,06 |
2 | 29,6 | 35,3 | -30,9 | -22,28 | 954,81 | 496,39 | 688,45 | 42,43 | -7,13 |
3 | 31,8 | 40,7 | -28,7 | -16,88 | 823,69 | 284,93 | 484,45 | 43,51 | -2,81 |
4 | 69,8 | 55,1 | 9,3 | -2,48 | 86,49 | 6,15 | -23,06 | 62,13 | -7,03 |
5 | 100,5 | 80,1 | 40 | 22,52 | 1600 | 507,15 | 900,8 | 77,17 | 2,92 |
6 | 93,3 | 65,9 | 32,8 | 8,32 | 1075,84 | 69,22 | 272,89 | 73,64 | -7,74 |
7 | 82,1 | 64,2 | 21,6 | 6,62 | 466,56 | 43,82 | 142,99 | 68,15 | -3,95 |
8 | 77,4 | 70,5 | 16,9 | 12,92 | 285,61 | 166,92 | 218,34 | 65,85 | 4,62 |
9 | 55,7 | 61,1 | -4,8 | 3,52 | 23,04 | 12,39 | -16,89 | 55,22 | 5,82 |
10 | 38,9 | 51,7 | -21,6 | -5,88 | 466,56 | 34,57 | 127 | 46,99 | 4,71 |
11 | 45,2 | 59,4 | -15,3 | 1,82 | 234,09 | 3,31 | 27,84 | 50,07 | 9,31 |
12 | 60,2 | 65,8 | -0,3 | 8,22 | 0,09 | 67,56 | -2,46 | 57,42 | 8,34 |
Сум ма | 726 | 691 | 0 | 0,00 | 6377,78 | 1960,71 | 3131,57 | 690,84 | 0 |
Сред нее | 60,5 | 57,58 |
|
|
|
|
|
|
|
По формуле

получим:

=3131,57/6377,78=
0,49. По формуле
получим:

=57,58?0,49

=
27,93.
Оцененное уравнение регрессии запишется в виде
= 27,93+0,49X. Интерпретация коэффициента регрессии. С увеличением среднегодового дохода населения на 1 тыс.долл. годовое потребление мяса на душу населения увеличится на 0,49кг.
3). Расчет линейного коэффициента корреляции проведем по формуле

.
С учетом вычислений в столбцах 6, 7 и 8 таблицы, получим:
r= 3131,57/(

) =
0,88. Т.е. связь между изучаемыми переменными прямая (коэффициент корреляции положителен) линейная.
Определим коэффициент детерминации
R2=0,88
2=
0,774. Т.е. 77,4% вариации годового потребления мяса объясняется вариацией среднегодового дохода населения.
4). Оценим статистическую значимость коэффициента регрессии .
Рассчитаем дисперсию ошибки регрессии по формуле

с учетом столбца 10 таблицы:

=475,61/(12-2)=
47,561. Рассчитаем стандартную ошибку коэффициента регрессии по формуле

:
=

=

=
0,0908.
Тогда по формуле

фактическое значение
t статистики составит
t=0,49/0,0908=
5,396. По таблице находим для уровня значимости по условию 1?0,95=0,05 и числа степеней свободы 10:
t0,05;10=2,228. Поскольку
t0,05;10<
t, то коэффициент регрессии значим, т.е. наличие статистической связи между среднегодовым доходом и годовым потреблением мяса на душу населения статистически подтверждается.
Для проверки значимости уравнения регрессии в целом воспользуемся формулой:
F =
F=

=
34,24.
Поскольку табличное значение
F распределения Фишера
F0,05;1;10=4,96 меньше расчетного, то гипотеза о статистической незначимости коэффициента регрессии должна быть отвергнута.
5). Рассчитаем прогнозное значение

для
X*. Полученный интервал будет характеризовать значения результативного признака (выручки) при заданном значении факторного признака (среднегодовой доход) для отдельной наблюдаемой единицы. Построим точечный прогноз:
= 27,93+0,49
51,4 = 53,116 Построим 95% доверительный интервал для прогноза по формуле

.
Определим сначала

=

+
= 0,096 И, следовательно: 53,116

2,228
= 53,116
16,083 или
37,033
69,199.Таким образом, с вероятностью 0,95 можно утверждать, что прогнозное значение годового потребления мяса на душу населения в среднем по группе, среднегодовой доход которой за месяц составит
51,4 тыс.долл. будет находиться в интервале от
37,033 до 69,199 кг.
Задача 2
"Множественная регрессия и корреляция"2. Приведены данные о тарифах на размещение одной страницы цветной рекламы в ведущих американских журналах (тыс. долл.), численности планируемой аудитории (млн. чел.), проценте мужчин-читателей.
Издание | Тариф, тыс. долл. | Численность планируемой аудитории, млн. чел. | Процент Мужчин -читателей, % |
| У |
 |
 |
Business Week | 115,1 | 5,9 | 71,1 |
Cosmopolitan | 97,1 | 17 | 15,2 |
Elle | 53,6 | 4,1 | 8,5 |
Fortune | 61,5 | 4,6 | 69,1 |
Forbes | 55,3 | 5,2 | 70,3 |
Life | 68,9 | 16,8 | 49,7 |
People | 130 | 41,3 | 33,1 |
Reader's Digest | 197 | 56,4 | 40,3 |
Newsweek | 145,1 | 24,7 | 55 |
National Geographic | 167 | 36,5 | 59,6 |
Seventeen | 77,5 | 6,3 | 8,5 |
The New Yorker | 63,1 | 4,3 | 44,3 |
Time | 158 | 29,9 | 53,9 |
TV Guide | 135 | 51,9 | 40,1 |
Vogue | 65,8 | 10,1 | 11,3 |
Сумма | 1590 | 315 | 630 |
Среднее |
 106 |
 21 | 42 |
Задание. 1). Определите парные и частные коэффициенты корреляции. Сделайте выводы.
2). Постройте линейное уравнение множественной регрессии и поясните смысл его параметров. Рассчитайте скорректированный коэффициент детерминации.
3). Проверьте значимость уравнения регрессии на 95% уровне.
4). Рассчитайте коэффициенты эластичности. Дайте их интерпретацию.
5). Постройте 95% доверительные интервалы для коэффициентов регрессии. Проверьте значимость каждого из коэффициентов.
2. Приведены данные о тарифах на размещение одной страницы цветной рекламы в ведущих американских журналах (тыс. долл.), численности планируемой аудитории (млн. чел.), проценте мужчин-читателей.
-
| Тариф тыс. долл. | Численность планируемой аудитории, млн. чел. | Процент Мужчин Чита телей, % |
- |
 |
 |
 | У- |
 |
-
(У- ) |
(У- ) |
-
 |
| У |
 |
 |
|
|
|
|
|
|
|
|
|
1 | 115,1 | 5,9 | 71,1 | -15,1 | 228,01 | 29,1 | 846,81 | 9,09 | 82,62 | -137,25 | 264,51 | -439,41 |
2 | 97,1 | 17 | 15,2 | -4 | 16 | -26,8 | 718,24 | -8,9 | 79,21 | 35,6 | 238,52 | 107,2 |
3 | 53,6 | 4,1 | 8,5 | -16,9 | 285,61 | -33,5 | 1122,25 | -52,4 | 2745,76 | 885,56 | 1755,4 | 566,15 |
4 | 61,5 | 4,6 | 69,1 | -16,4 | 268,96 | 27,1 | 734,41 | -44,5 | 1980,25 | 729,8 | -1205,95 | -444,44 |
5 | 55,3 | 5,2 | 70,3 | -15,8 | 249,64 | 28,3 | 800,89 | -50,7 | 2570,49 | 801,06 | -1434,81 | -447,14 |
6 | 68,9 | 16,8 | 49,7 | -4,2 | 17,64 | 7,7 | 59,29 | -37,1 | 1376,41 | 155,82 | -285,67 | -32,34 |
7 | 130 | 41,3 | 33,1 | 20,3 | 412,09 | -8,9 | 79,21 | 24 | 576 | 487,2 | -213,6 | -180,67 |
8 | 197 | 56,4 | 40,3 | 35,4 | 1253,16 | -1,7 | 2,89 | 91 | 8281 | 3221,4 | -154,7 | -60,18 |
9 | 145,1 | 24,7 | 55 | 3,7 | 13,69 | 13 | 169 | 39,1 | 1528,81 | 144,67 | 508,3 | 48,1 |
10 | 167 | 36,5 | 59,6 | 15,5 | 240,25 | 17,6 | 309,76 | 61 | 3721 | 945,5 | 1073,6 | 272,8 |
11 | 77,5 | 6,3 | 8,5 | -14,7 | 216,09 | -33,5 | 1122,25 | -28,5 | 812,25 | 418,95 | 954,75 | 492,45 |
12 | 63,1 | 4,3 | 44,3 | -16,7 | 278,89 | 2,3 | 5,29 | -42,9 | 1840,41 | 716,43 | -98,67 | -38,41 |
13 | 158 | 29,9 | 53,9 | 8,9 | 79,21 | 11,9 | 141,61 | 52 | 2704 | 462,8 | 618,8 | 105,91 |
14 | 135 | 51,9 | 40,1 | 30,9 | 954,81 | -1,9 | 3,61 | 29 | 841 | 896,1 | -55,1 | -58,71 |
15 | 65,8 | 10,1 | 11,3 | -10,9 | 118,81 | -30,7 | 942,49 | -40,2 | 1616,04 | 438,18 | 1234,14 | 334,63 |
Сумма | 1590 | 315 | 630 | 0 | 4632,86 | 0 | 7058 | 0 | 30755,25 | 10201,82 | 3199,52 | 225,94 |
Среднее |
 106 |
 21 |
 42 |
|
|
|
|
|
|
|
|
|
Решение. 1). Рассчитаем средние значения переменных

=
106,

=
21 и

=
42. Определим парные коэффициенты корреляции по формулам.

=
= 0,854 
=

=
0,217 
=

=
0,39 Значение парного коэффициента корреляции свидетельствует о сильной линейной связи между переменными
Y и
X1. Связь между
X2 и
Y существенно слабее. Кроме того, теснота связи между
X1 и
X2 небольшая. Таким образом, можно сделать предварительное заключение, что численность мужчин-читателей, существенно не влияет на рост тарифов на размещение одной страницы цветной рекламы в ведущих американских журналах.
Расчет частных коэффициентов корреляции по формулам дает соответственно:

=

=
0,857 
=

=

= -
0,242. 
=

=

=
0,403.Коэффициенты частной корреляции дают более точную характеристику тесноты зависимости двух признаков, чем коэффициенты парной корреляции, так как "очищают" парную зависимость от взаимодействия данной пары переменных с другими переменными, представленными в модели. Наиболее тесно связаны
Y и
X1. Другие взаимосвязи существенно слабее. При сравнении коэффициентов парной и частной корреляции видно, что из-за влияния межфакторной зависимости между
X1 и
X2 происходит завышение оценки тесноты связи между переменными.
2). Построим линейное уравнение множественной регрессии
Вычислим сначала

=
45,28 
=

=
17,57 
=

=
21,69 Затем получим оценки уравнения регрессии:

=

=

=
2,93

=

=

=
-1,46
106 – 2,93 * 21 – (-1,46)*42 = 106 – 61,53+ 61,32 = 105,79Уравнение регрессии имеет вид:
=105,79+2,93X1+(-1,46)X2.Интерпретация коэффициентов регрессии. Константа оценивает агрегированное влияние прочих (кроме учтенных в модели
X1 и
X2) факторов на результат
Y и означает, что тариф на размещение одной страницы цветной рекламы в ведущих американских журналах (тыс. долл.), без учета численности планируемой аудитории составил бы 105,79 тыс.у.е.
Рассчитаем скорректированный коэффициент детерминации по формуле
= 1 –

=
0,658 Т.о. 65,8% вариации зависимой переменной объясняется вариацией независимых переменных.
3). Проверим значимость уравнения регрессии на 95% уровне. Рассчитаем фактическое значение F статистики по формуле :

=0,746/(1?0,746)
(15?3)/2=
17,62. Для определения табличного значения
F0,05; 2; 12 воспользуемся таблицами распределения Фишера для заданного уровня значимости 0,05, принимая во внимание, что число степеней свободы большей дисперсии равно 2, а число степеней свободы меньшей дисперсии равно 12,
F0,05; 2; 12=3,89.
Так как 17,62=
F>
F0,05; 2; 12=3,89, то нулевая гипотеза отклоняется, и с вероятностью 0,95 можно говорить о статистической значимости уравнения регрессии.
4). Рассчитаем коэффициенты эластичности.

=2,93
.21/106=
0,58. 
= -1,46
.42/106
= - 0,57. Значения коэффициентов эластичности позволяют сделать вывод о большем влиянии на тариф на размещение одной страницы цветной рекламы в ведущих американских журналах численности планируемой аудитории, нежели процента мужчин-читателей. В частности, при изменении фактора
X1 на 1% от своего среднего значения и при фиксированном воздействии на
Y другого фактора, включенного в уравнение регрессии, величина тарифа изменится на 0,58% от среднего значения.
5). Построим 95% доверительные интервалы для коэффициентов регрессии.
Вычислим стандартные ошибки коэффициентов

=

:
= 0,44, аналогично

=

:

=
0,35. Тогда с учетом t
0,05; 12=2,179 получим:

=

(15-3)

= 2,93

2,179

= 2,93

или – 8,57

14,43

=

(15-3)

= 0,16

2,179

0,35 = 0,16

9,15 или - 8,99

9,31
Проверка значимости каждого из коэффициентов: поскольку доверительный интервал для
1 и
2 включает в себя ноль, то коэффициент
1 и коэффициент
2 не значимы на 95% уровне.
Задача 3
"Временные ряды в эконометрических исследованиях" 2.Динамика импорта КНР характеризуется поквартальными данными за 1999-2002 гг., млрд. $
Год/ Квартал | 1999 | 2000 | 2001 | 2002 |
I | II | III | IV | I | II | III | IV | I | II | III | IV | I |
Значение импорта | 19,3 | 24,0 | 28,4 | 36,6 | 18,7 | 22,3 | 30,2 | 38,1 | 25,3 | 33,6 | 34,7 | 41,7 | 29,8 |
К заданию 2) – прогноз на 4 квартал 2002 г.
Решение: 1). Построим график ряда динамики.
На графике отчетливо видно, что значение импорта изменяется под воздействием сезонных колебаний. Заметен рост в 4 квартале каждого года (соответственно 4, 8, 12 кварталы), а затем снижение товарооборота в первом квартале каждого года (соответственно 5, 9, 13 кварталы).
Построение аддитивной модели начнем с выделения сезонной компоненты временного ряда.
В нашем случае =4 и
h=
n/=13/4=3,25.
Применим формулу

.
Для этого просуммируем уровни ряда по 1-му кварталу по всем трём годам 19,3+18,7+25,3+29,8 = 93,1 и найдем среднее значение 93,1/4=23,275, и аналогично для остальных кварталов. Получим расчетную таблицу. Среднее значение по всем 13-ти наблюдениям равно 31,58. Вычитая из средних значений по кварталам 31,58, получим последнюю строку расчетной таблицы, в которой и содержатся значения сезонной компоненты
St.
-
| I | II | III | IV |
1999 | 19,3 | 24,0 | 28,4 | 36,6 |
2000 | 18,7 | 22,3 | 30,2 | 38,1 |
2001 | 25,3 | 33,6 | 34,7 | 41,7 |
2002 | 29,8 |
|
|
|
Среднее по одноименным кварталам | 23,3 | 26,6 | 31,1 | 38,8 |
St | - 8,28 | - 4,98 | - 0,47 | 7,22 |
Устраним сезонную компоненту из исходных уровней ряда и получим
zi=

в
столбце 4 расчетной таблицы, которая дана ниже.
Далее рассчитаем значения

представленные в столбце 5 расчетной таблицы. Поскольку первые разности являются примерно одинаковыми (см. столбец 5), считаем, что ряд
z имеет линейный тренд. Рассчитаем значения тренда
Т. Модель тренда имеет вид

. Расчет параметров уравнения проведем по формуле. Необходимые предварительные расчеты приведены в таблице в столбцах 6-8: столбец 7 получается путем возведения в квадрат значений столбца 6, столбец 8 равен произведению столбца 4 на столбец 6.
i | yi | Si |
 | ?i | t | t2 | zt | T | Ei | Ei/yi | | Ei/yi | |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
1 | 19,3 | - 8,28 | 27,58 | - | -6 | 36 | -165,48 | 28,208 | -0,628 | -0,03025 | 0,03025 |
2 | 24,0 | - 4,98 | 28,98 | 1,4 | -5 | 25 | -144,9 | 29,325 | -0,344 | -0,01433 | 0,01433 |
3 | 28,4 | - 0,47 | 28,87 | -0,11 | -4 | 16 | -115,48 | 30,442 | -1,572 | -0,05535 | 0,05535 |
4 | 36,6 | 7,22 | 43,82 | 14,95 | -3 | 9 | -131,46 | 31,559 | 12,22 | 0,33387 | 0,33387 |
5 | 18,7 | - 8,28 | 26,98 | -16,84 | -2 | 4 | -53,96 | 32,676 | -5,696 | -0,30459 | 0,30459 |
6 | 22,3 | - 4,98 | 27,28 | 0,3 | -1 | 1 | -27,28 | 33,793 | -6,513 | -0,29206 | 0,29206 |
7 | 30,2 | - 0,47 | 30,67 | 3,39 | 0 | 0 | 0 | 34,91 | -4,24 | -0,14039 | 0,14039 |
8 | 38,1 | 7,22 | 45,32 | 14,65 | 1 | 1 | 45,32 | 36,027 | 9,293 | 0,24391 | 0,24391 |
9 | 25,3 | - 8,28 | 33,58 | -11,74 | 2 | 4 | 67,16 | 37,144 | -3,564 | -0,14086 | 0,14086 |
10 | 33,6 | - 4,98 | 38,58 | 5 | 3 | 9 | 115,74 | 38,261 | 0,318 | 0,00946 | 0,00946 |
11 | 34,7 | - 0,47 | 35,17 | -3,41 | 4 | 16 | 140,68 | 39,378 | -4,208 | -0,12126 | 0,12126 |
12 | 41,7 | 7,22 | 48,92 | 13,75 | 5 | 25 | 244,6 | 40,495 | 8,425 | 0,20203 | 0,20203 |
13 | 29,8 | - 8,28 | 38,08 | -10,84 | 6 | 36 | 228,48 | 41,612 | -3,532 | -0,11852 | 0,11852 |
Сумма | 453,83 | 10,5 | 0 | 182 | 203,42 | 453,83 | -0,041 | -0,42834 | 2,00688 |
Параметры уравнения линейного тренда: b =
= 1,117 a =

=
34,91 Таким образом, уравнение тренда имеет вид:
T=34,91+1,117
t.
Подставляя в уравнение тренда последовательно соответствующие значения
t, получим значения тренда для каждого уровня временного ряда (столбец 9 расчетной таблицы), например, для
t=?9,5 получим
T(?6)= 34,91+1,117(-6) =
28,208 T(?5)= 34,91+1,117(-5) =
29,325 T(?4)= 34,91+1,117(-4) =
30,442 T(?3)= 34,91+1,117(-3) =
31,559 T(?2)= 34,91+1,117(-2) =
32,676 T(?1)= 34,91+1,117(-1) =
33,793 T(0)= 34,91+1,117(0) =
34,91 T(1)= 34,91+1,117(1) =
36,027 T(2)= 34,91+1,117(2) =
37,144 T(3)= 34,91+1,117(3) =
38,261 T(4)= 34,91+1,117(4) =
39,378 T(5)= 34,91+1,117(5) =
40,495 T(6)= 34,91+1,117(6) =
41,612 После выделения тренда остаток
E получается как разность между
z и
T (разность значений в столбцах 4 и 9) и представлен в столбце 10 расчетной таблицы.
2). Полученное уравнение временного ряда может быть использовано для краткосрочного прогнозирования. Так, если необходимо спрогнозировать значение импорта для 4 квартала 2002 года, то определим
t=9, так как для 1 квартала 2002 года
t=6, соответственно для 4 квартала 2002 года 9. Подставим значение
t в уравнение тренда:
T(9)= 34,91+1,117∙(9)=
44,963.
С учетом того, что сезонная компонента равна для 4-го квартала 7,22, получим окончательно
44,963 +7,22 = 52,183Таким образом, в четвёртом квартале 2002 года прогнозируется импорт
52,183 млрд. $.
3). Проверим качество полученной модели.
Рассчитаем среднюю процентную ошибку по формуле

.
Расчет суммы приведен в столбце 11 таблицы выше. Таким образом:
MPE=(-0,42834)∙100/13=
- 3,2949%, что гораздо меньше 5%.
Рассчитаем среднюю абсолютную процентную ошибку по формуле

. Расчет суммы приведен в столбце 12 таблицы выше.
Таким образом:
MАPE=(2,00688)∙100/13 =
15,4375%, и поскольку
MAPE<20%, то модель подогнана с хорошей точностью.
Средняя ошибка, рассчитанная по формуле

с учетом суммы в столбце 10 таблицы, суть
ME=
-0,041/13 =
- 0,003. Задача 4
"Системы эконометрических уравнений" 2. Модель мультипликатора-акселератора:
где
C – расходы на потребление,
R – доход,
I – инвестиции,
t – текущий период,
t-1 – предыдущий период.
1). Определить эндогенные, экзогенные, лаговые и предопределенные переменные модели.
2). Записать приведенную форму модели.
Решение. 1). Эндогенными переменными являются
Ct,
Yt, R
t. Экзогенные переменные -
rt и
Gt. Лаговые переменные
Ct-1 и R
t-1. Предопределенные переменные
rt,
Ct-1 и R
t-1.
2). Приведенную форму модели можно получить путем алгебраических преобразований. Подставим выражение для R
t из третьего уравнения системы в первое и второе:
1)

=

+

(

+

)+

+
2)

=

+

(

+

) +
Выражая
It из второго из уравнений и подставляя формулу для него в первое уравнение, получим:

=




(


) =

(






+

+


-


+
Таким образом, приведенная форма модели имеет вид:

"Парная регрессия и корреляция"