Контрольная работа по эконометрике. Вариант№1 - файл n1.doc

Контрольная работа по эконометрике. Вариант№1
скачать (832.5 kb.)
Доступные файлы (1):
n1.doc833kb.19.09.2012 12:54скачать

n1.doc

  1   2
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ



Санкт-Петербургский государственный университет сервиса и экономики


Контрольная работа по эконометрике.

Вариант №1.


Выполнила:

Проверил:

Санкт-Петербург

2012
Вариант №1.

Задача №1.

По территориям Южного федерального округа РФ приводятся данные за 2000 год:

Территории федерального округа

Валовой региональный продукт, млрд. руб., Y

Инвестиции в основной капитал, млрд. руб., X

1. Респ. Адыгея

5,1

1,264

2. Респ. Дагестан

13,0

3,344

3. Респ. Ингушетия

2,0

0,930

4. Кабардино-Балкарская Респ.

10,5

2,382

5. Респ. Калмыкия

2,1

6,689

6. Карачаево-Черкесская Респ.

4,3

0,610

7. Респ. Северная Осетия – Алания

7,6

1,600

8. Краснодарский край1)

109,1

52,773

9. Ставропольский край

43,4

15,104

10. Астраханская обл.

18,9

12,633

11. Волгоградская обл.

50,0

10,936

12. Ростовская обл.

69,0

20,014

Итого, 

225,9

75,506

Средняя

20,536

6,8642

Среднее квадратическое отклонение, 

21,852

6,4427

Дисперсия, D

477,50

41,5079


1) Предварительный анализ исходных данных выявил наличие одной территории (Краснодарский край) с аномальными значениями признаков. Эта территория исключена из дальнейшего анализа. Значения показателей в итоговых строках приведены без учёта указанной аномальной единицы.

Задание:

1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.

2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.

3. Рассчитайте параметры а1 и а0 парной линейной функции и линейно-логарифмической функции

4. Оцените тесноту связи с помощью показателей корреляции (ryx и ?ylnx) и детерминации (r2yx и ?2ylnx), проанализируйте их значения.

5. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости =0,05.

6. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.

7. По лучшему уравнению регрессии рассчитайте теоретические значения результата (), по ним постройте теоретическую линию регрессии и определите среднюю ошибку аппроксимации - ?'ср., оцените её величину.

8. Рассчитайте прогнозное значение результата, если прогнозное значение фактора () составит 1,062 от среднего уровня ().

9. Рассчитайте интегральную и предельную ошибки прогноза (для =0,05), определите доверительный интервал прогноза (; ), а также диапазон верхней и нижней границ доверительного интервала (), оценив точность выполненного прогноза.

1. Расположим территории по возрастанию см табл.1


таблица 1

Территории федерального округа

Валовой региональный продукт, млрд. руб., Y

Инвестиции в основной капитал, млрд. руб., X

6. Карачаево-Черкесская Респ.

4,3

0,61

3. Респ. Ингушетия

2

0,93

1. Респ. Адыгея

5,1

1,264

7. Респ. Северная Осетия – Алания

7,6

1,6

4. Кабардино-Балкарская Респ.

10,5

2,382

2. Респ. Дагестан

13

3,344

5. Респ. Калмыкия

2,1

6,689

11. Волгоградская обл.

50

10,936

10. Астраханская обл.

18,9

12,633

9. Ставропольский край

43,4

15,104

12. Ростовская обл.

69

20,014

8. Краснодарский край1)

109,1

52,773

Дисперсия, D

477,5

41,5079

Итого, 

225,9

75,506

Среднее квадратическое отклонение, 

21,852

6,4427

Средняя

20,536

6,8642


Построим уравнение прямой:, отражающей линейную форму зависимости результата Y от фактора X.

Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка ?, ?а0 и ?а1. Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X. См. табл.2
Расчёт определителя системы выполним по формуле:

11*975 – 75,506*75,506 = 5023,85;

Расчёт определителя свободного члена уравнения выполним по формуле:

225,9*975 – 2927,9*75,506 = -821,52.

Расчёт определителя коэффициента регрессии выполним по формуле:

11*2927,9 – 225,9*75,506 = 15150,1.

таблица 2



























А

1

2

3

4

5

6

7

8

1

0,61

4,3

0,4

2,6

1,7

2,6

6,8

13

2

0,93

2

0,9

1,9

2,6

-0,6

0,4

3

3

1,264

5,1

1,6

6,5

3,7

1,4

2,0

7

4

1,6

7,6

2,6

12,2

4,7

2,9

8,4

14

5

2,382

10,5

5,7

25

7,0

2,5

6,3

12

6

3,344

13

11,2

43,5

9,9

3,1

9,6

15

7

6,689

2,1

44,7

14,1

6,5

-4,4

19,4

22

8

10,936

50

119,6

546,8

32,8

17,2

295,8

84

9

12,633

18,9

159,6

238,8

37,9

-19,9

396,0

97

10

15,104

43,4

228,1

655,5

45,4

-2

4,0

100

11

20,014

69

400,6

1381

60,2

8,8

77,4

43

Итого

75,506

225,9

975

2927,9

 

 

833

410

Средняя

6,8642

20,536





 

 

 

37,3

Сигма

6,4427

21,852













Дисперсия, D

41,5079

477,5













?=

5023,85















0=

-821,52




-0,164











1=

15150,1




3,016













Расчёт параметров уравнения регрессии даёт следующие результаты:

; .

В конечном счёте,получаем теоретическое уравнение регрессии следующего вида:


В уравнении коэффициент регрессии а1 = 3,016 означает, что при увеличении доходов населения на 1 тыс. руб. (от своей средней) объём розничного товарооборота возрастет на 3,016 млрд. руб. (от своей средней).

Свободный член уравнения а0 = -0,164 оценивает влияние прочих факторов, оказывающих воздействие на объём розничного товарооборота.
Относительную оценку силы связи даёт общий (средний) коэффициент эластичности:



В нашем случае, когда рассматривается линейная зависимость, расчётная формула преобразуется к виду:



Это означает, что при изменении общей суммы доходов населения на 1% от своей средней оборот розничной торговли увеличивается на 1,01 процента от своей средней.
Для оценки тесноты связи рассчитаем линейный коэффициент парной корреляции:



Коэффициент корреляции, равный 0,889, показывает, что выявлена весьма тесная зависимость между общей суммой доходов населения за год и оборотом розничной торговли за год. Коэффициент детерминации, равный 0,79, устанавливает, что вариация оборота розничной торговли на 79% из 100% предопределена вариацией общей суммы доходов населения; роль прочих факторов, влияющих на розничный товарооборот, определяется в 21%, что является сравнительно небольшой величиной.
Для оценки статистической надёжности выявленной зависимости дохода от доли занятых рассчитаем фактическое значение F-критерия Фишера – Fфактич. и сравним его с табличным значением – Fтабл. По результатам сравнения примем решения по нулевой гипотезе , то есть, либо примем, либо отклоним её с вероятностью допустить ошибку, которая не превысит 5% (или с уровнем значимости ?=0,05). ; где - число факторов в уравнении; - число изучаемых объектов.

Фактическое значение критерия показывает, что факторная вариация результата почти в 34 раза больше остаточной вариации, сформировавшейся под влиянием случайных причин. Очевидно, что подобные различия не могут быть случайными, а являются результатом систематического взаимодействия оборота розничной торговли и общей суммы доходов населения. Для обоснованного вывода сравним полученный результат с табличным значением критерия: при степенях свободы d.f.1=k=1 и d.f.2=n-k-1=11-1-1=9 и уровне значимости ?=0,05.
В силу того, что , нулевую гипотезу о статистической незначимости выявленной зависимости оборота розничной торговли от общей суммы доходов населения и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.

Определим теоретические значения результата Yтеор. Для этого в полученное уравнение

последовательно подставим фактические значения фактора X и выполним расчёт.

Например, . См. гр. 5 расчётной таблицы. По парам значений Yтеор. и Xфакт. строится теоретическая линия регрессии, которая пересечётся с эмпирической регрессией в нескольких точках. См. график 1.
Оценку качества модели дадим с помощью скорректированной средней ошибки аппроксимации:

.

В нашем случае, скорректированная ошибка аппроксимации составляет 37,3%. Она указывает на невысокое качество построенной линейной модели и ограничивает её использование для выполнения точных прогнозных расчётов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения ).
Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. Для преобразования нелинейной функции в линейную введём новую переменную , которая линейно связана с результатом. Следовательно, для определения параметров модели будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка. См. расчётную таблицу №3.
Расчёт определителей второго порядка даёт следующие результаты:

; ; . Отсюда получаем параметры уравнения:



Полученное уравнение имеет вид:.



Оценочные показатели позволяют сделать вывод, что линейно-логарифмическая функция описывает изучаемую связь хуже, чем линейная модель: оценка тесноты выявленной связи ?=0,824 (сравните с 0,889), скорректированная средняя ошибка аппроксимации здесь выше и составляет 48%, то есть возможности использования для прогноза данной модели более ограничены.

Таким образом, можно прийти к выводу, что по сравнению с линейной моделью данное уравнение менее пригодно для описания изучаемой связи.


таблица 3






























А

1

2

3

4

5

6

7

8

9

1

0,61

-0,494

4,3

0,244

-2,124

-6,3

10,6

112,36

0,52

2

0,93

-0,073

2

0,005

-0,146

-0,2

2,2

4,84

0,11

3

1,264

0,234

5,1

0,055

1,193

4,3

0,8

0,64

0,04

4

1,6

0,470

7,6

0,221

3,572

7,8

-0,2

0,04

0,01

5

2,382

0,868

10,5

0,753

9,114

12,7

-2,2

4,84

0,11

6

3,344

1,207

13

1,457

15,691

18,6

-5,6

31,36

0,27

7

6,689

1,900

2,1

3,61

3,990

28,7

-26,6

707,56

1,30

8

10,936

2,392

50

5,722

119,600

35,9

14,1

198,81

0,69

9

12,633

2,536

18,9

6,431

47,930

38,0

-19,1

364,81

0,93

10

15,104

2,715

43,4

7,371

117,831

40,6

2,8

7,84

0,14

11

20,014

2,996

69

8,976

206,724

44,8

24,2

585,64

1,18

Итого

 

14,753

225,9

34,845

523,376

 

 

 

528

Средняя

 

1,369

20,536



47,58

 

 

 

48

Сигма

 

1,23

21,852

 

 

 

 

 

 

Дисперсия, D

 

1,51

477,5

 

 

 

 

 

 


Заключительным этапом решения данной задачи является выполнение прогноза и его оценка.

Если предположить, что прогнозное значение средней суммы доходов населения, по всем областям возрастёт с =6,864 млрд. руб.на 6,2% и составит 7,29 млрд. руб., то есть Xпрогнозн.= 6,864*1,062=7,29, тогда прогнозное значение результата сформируется на уровне:Yпрогнозн. =-0,164+3,016*7,29=21,82 (млрд. руб.). То есть, прирост фактора на 6,2% приводит к приросту результата на 6,25 процента (.

Рассчитаем интегральную ошибку прогноза - , которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии-и ошибки прогноза положения регрессии -. То есть, .

В нашем случае , где k- число факторов в уравнении, которое в данной задаче равно 1. Тогда (млрд. руб.).

Ошибка положения регрессии составит: =

= = 0,058 (млрд. руб.).

Интегральная ошибка прогноза составит: = = 9,62 (млрд. руб.).

Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,26*9,62 =21,74 (млрд. руб.). Табличное значение t-критерия для уровня значимости ?=0,05 и для степеней свободы n-k-1 = 11-1-1=9 составит 2,26. Следовательно, ошибка большинства реализаций прогноза не превысит млрд. руб.

Это означает, что фактическая реализация прогноза будет находиться в доверительном интервале . Верхняя граница доверительного интервала составит

= 21,82 + 21,74 = 43,65(млрд. руб.).

Нижняя граница доверительного интервала составит:

= 21.82 – 21,74 = 0,08(млрд. руб.).
Относительная величина различий значений верхней и нижней границ составит: = раза. Это означает, что верхняя граница в 544,5 раза больше нижней границы, то есть точность выполненного прогноза весьма невелика, но его надёжность на уровне 95% оценивается как высокая. Причиной небольшой точности прогноза является повышенная ошибка аппроксимации. Здесь её значение выходит за границу 5-7% из-за недостаточно высокой типичности линейной регрессии, которая проявляется в присутствии единиц с высокой индивидуальной ошибкой. Если удалить территории с предельно высокой ошибкой (например, Ростовскую область с ), тогда качество линейной модели и точность прогноза по ней заметно повысятся.

Задача № 2.

Проводится анализ значений социально-экономических показателей по территориям Северо-Западного федерального округа РФ за 2000 год:

Y – Валовой региональный продукт, млрд. руб.;

X1 – Инвестиции 2000 года в основной капитал, млрд. руб.;

X2 – Среднегодовая стоимость основных фондов в экономике, млрд. руб.;

X3 – Кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам, млрд. руб.

Требуется изучить влияние указанных факторов на стоимость валового регионального продукта.

Предварительный анализ исходных данных по 10 территориям выявил наличие одной территории (г.Санкт-Петербург) с аномальными значениями признаков. Эта единица должна быть исключена из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанной аномальной единицы.
При обработке исходных данных получены следующие значения:

А) - линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -?:

N=9.




Y

X1

X2

X3

Y

1

0,7677

0,8653

0,4237

X1

0,7677

1

0,8897

0,0157

X2

0,8653

0,8897

1

-0,0179

X3

0,4237

0,0157

-0,0179

1

Средняя

31,92

8,87

121,18

0,5683

?

14,61

5,198

48,19

0,6942


Б) - коэффициентов частной корреляции




Y

X1

X2

X3

Y

1

-0,1462

0,8737

0,8791

X1

-0,1462

1

0,5562

0,1612

X2

0,8737

0,5562

1

-0,7842

X3

0,8791

0,1612

-0,7842

1


Задание:

1. По значениям линейных коэффициентов парной и частной корреляции выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Проведите окончательный отбор информативных факторов во множественную регрессионную модель.

2. Выполните расчёт бета коэффициентов () и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов () силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.

3. По значениям -коэффициентов рассчитайте параметры уравнения в естественной форме (a1, a2 и a0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности -.

4. Оцените тесноту множественной связи с помощью R и R2, а статистическую значимость уравнения и тесноту выявленной связи - через F-критерий Фишера (для уровня значимости =0,05).

5. Рассчитайте прогнозное значение результата, предполагая, что прогнозные значения факторов составят 102,1 процента от их среднего уровня.

6. Основные выводы оформите аналитической запиской.

Решение.

1. По коэффициентам парной корреляции можно сделать вывод, что валовой региональный продукт наиболее тесно связан со среднегодовой стоимостью основных активов, также тесно связан с инвестициями 2000 года в основной капитал.

  1. Поэтому для уточнения окончательного вывода выполним расчёт серии коэффициентов частной корреляции Y с тремя возможными комбинациями факторных признаков: для Y с и с , Y с и с а также для Y c и .

Расчёты частных коэффициентов корреляции выполним по следующим формулам:





Как видим, факторы и , действительно, тесно связаны с результатом, а между собой практически не взаимодействуют.

Расчёт аналогичных показателей по следующей паре факторов приводит к иным результатам:




В данном случае, межфакторное взаимодействие оценивается как заметное ( )




Первая и вторая пары сильно связаны с результатом, а третья практически не связана, поэтому ее можно исключить.

В паре (X1 и X3 ) связь между факторами средняя, а во второй (X2 и X3 ) – сильная, поэтому в большей мере отвечает требованиям МНК первая пара. Указанные обстоятельства позволяют использовать X1 и X3 в качестве информативных факторов уравнения множественной регрессии.
2. Выполним расчет бета коэффициентов



В этом случае, исходное уравнение приобретает вид: . Выполним расчёт -коэффициентов, используя значения известных по условию линейных коэффициентов парной корреляции.

;
;

В результате получено уравнение в стандартизованном масштабе:

В большей степени валовой региональный продукт зависит от первого фактора.

3. Используя значения -коэффициентов, можно рассчитать параметров уравнения в естественной форме:



.


Окончательное уравнение: :

С увеличением фактора x1 на 1 млрд. руб. результат увеличивается на 2,139 млрд. руб., с увеличением фактора x3 на 1 млрд. руб. результат увеличивается на 8,665 млрд. руб.

Выполним расчет средних коэффициентов эластичности

;

С увеличением первого фактора на 1% результат увеличивается на 0,595, второго – на 0,154. То есть первый фактор более сильно влияет на результат.

Рассчитаем множественный коэффициент корреляции



В нашем случае 2-х факторной зависимости расчёт строится следующим образом:

.



Можно сделать вывод, что 75,9% вариации валового регионального продукта обусловлено влиянием первого и третьего фактора, оставшиеся 24,1% вариации результата сформировались под влиянием прочих причин, роль которых незначительна.

4. Оценка статистической значимости или надёжности установленной формы зависимости, её параметров, оценок её силы и тесноты является важным этапом анализа результатов. Для выполнения оценки формулируется нулевая гипотеза, которая рассматривает предположение о случайной природе полученных результатов. То есть, .

Для проверки выдвинутой нулевой гипотезы используется F-критерия Фишера. Его фактическое значение определяется, исходя из соотношения факторной и останочной дисперсий и их степеней свободы: d.f.1=k и d.f.2=n-k-1; где: n –число изучаемых единиц; k – число ограничений, которые накладываются на исходные данные при расчёте данного показателя. Здесь k равно числу факторов уравнения, то есть k=2.

.

В нашем случае, когда рассматривается зависимость результата от двух факторов, расчёт выглядит следующим образом:

.

Fфактич =9,54> Fтабл. = 4,74, можно с высокой степенью надёжности отклонить нулевую гипотезу, а в качестве альтернативы – согласиться с утверждением, что проверяемые параметры множественной регрессионной модели неслучайны, что коэффициенты уравнения и показатели тесноты связи не являются случайными величинами.

5. ;
млрд.руб.
Выводы:

Наиболее сильно валовой региональный продукт в большей степени зависит от инвестиций 2000 года в основной капитал, также сильно зависит от среднегодовой стоимости основных фондов в экономике, в слабой степени от кредитов, предоставленных в 2000 году предприятиям, организациям, банкам и физическим лицам.

С помощью корреляционного анализа было получено следующее уравнение связи, не включающее слабо влияющий на результат второй фактор:
Так как уравнение построено с высокой степенью надежности, то по нему был сделан прогноз:
То есть при инвестировании 2000 года в основной капитал 9,056 млрд. руб. и объеме кредитов, предоставленных в 2000 году предприятиям, организациям, банкам и физическим лицам 0,5802 млрд. руб., валовой региональный продукт составит 15,14 млрд. руб.

Задача № 7.

Данные о стоимости экспорта () и импорта () Индии, млрд. $, приводятся за 1990-1999 гг.

В уровнях рядов выявлены линейные тренды:

для экспорта - , а для импорта –

По указанным трендам произведено выравнивание каждого ряда, то есть рассчитаны теоретические значения их уровней: и .


Годы

Экспорт (St)

Импорт (Kt)

Sфакт.

=

K факт..



1990

18,0

16,4

23,6

18,5

1991

17,7

18,7

20,4

21,4

1992

19,6

21,0

23,6

24,3

1993

21,6

23,3

22,8

27,2

1994

25,1

25,6

26,8

30,1

1995

30,8

27,9

34,5

33,0

1996

33,1

30,2

37,4

35,9

1997

34,2

32,5

41,0

38,8

1998

32,9

34,8

42,2

41,7

1999

36,3

37,1

44,9

44,6
  1   2


МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации