Контрольная работа по эконометрике. Решение в Word и Excel - файл n2.rtf

Контрольная работа по эконометрике. Решение в Word и Excel
скачать (43.2 kb.)
Доступные файлы (2):
n1.xlsxскачать
n2.rtf759kb.28.01.2012 20:20скачать

n2.rtf

Задание II. N=3.

  1. Постройте уравнение множественной регрессии в линейной форме с полным набором факторов. Оцените параметры модели.

  2. Оцените статистическую значимость уравнения регрессии с помощью критерия Фишера.

  3. Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы мультиколлинеарны, удалите зависимые факторы .

  4. Постройте уравнение регрессии со статистически значимыми факторами.

Оцените статистическую значимость нового уравнения регрессии с помощью критерия Фишера.
Имеются данные о деятельности крупнейших компаний США в 1996 г.


п/п1234567891011121314151617181920212223242511111111111111111111111113.94.73.74.75.64.37.14.69.93.44.34.94.94.43.43.84.83.94.14.92.14.353.63.7134.318.94340.925709.8408.92855.38201144372.482412.2217300.73783.62.330.00490.003-0.0014-0.07052.60.0030.01780.00540.0295111111111111111111111111113.934.318.94340.925114709.8408.92855.3820?n?y?x1 ?x2 ?x3 ?x4 -yx1 x2 x3 x4 Y3.94.73.74.75.64.37.14.69.93.44.34.94.94.43.43.84.83.94.14.92.14.353.63.7 1.810.00380.0023-0.0011-0.0548

Чистый доход,
млрд. долл. США, y0,9+N1,7+N0,7+N1,7+N2,6+N1,3+N4,1+N1,6+N6,9+N0,4+N1,3+N1,9+N1,9+N1,4+N0,4+N0,8+N1,8+N0,9+N1,1+N1,9+N-0,9+N1,3+N2,0+N0,6+N0,7+N34.316.47.5132315140.120.9168.459.830.116.412.822.59.83015.420.715.724.416.516.47.218.5

Матрица XT

116.413.764.740.5709.856253.0228979.55207737.5924397.6

Находим обратную матрицу (XTX)-1

0.00490.0006-0.0006-0.0001-0.0001Уравнение регрессии (оценка уравнения регрессии)

Y = 2.5988 + 0.003X1 + 0.0178X2 + 0.0054X3 + 0.0295X4

Модель регрессии в стандартном масштабе.

Модель регрессии в стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам:

где хji - значение переменной хji в i-ом наблюдении.

Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения принимается ее среднее квадратическое отклонение S.

Если связь между переменными в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением:

ty = ??jtxj

Для оценки ?-коэффциентов применим МНК. При этом система нормальных уравнений будет иметь вид:

rx1y=?1+rx1x2•?2 + ... + rx1xm•?m

rx2y=rx2x1•?1 + ?2 + ... + rx2xm•?m

...

rxmy=rxmx1•?1 + rxmx2•?2 + ... + ?m

Найденные из данной системы ?–коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам:

2.

Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =... = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).

Для ее проверки используют F-критерий Фишера.

Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y.

Более объективной оценкой является скорректированный коэффициент детерминации:

Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.

Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:

H0: ?1 = ?2 = ... = ?m = 0.

Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера.

Если F < Fkp = F? ; n-m-1, то нет оснований для отклонения гипотезы H0.

Табличное значение при степенях свободы k1 = 4 и k2 = n-m-1 = 25 - 5 -1 = 20, Fkp(4;20) = 2.87

Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно.

3.

Матрица парных коэффициентов корреляции.

Число наблюдений n = 25. Число независимых переменных в модели равно 4, а число регрессоров с учетом единичного вектора равно числу неизвестных коэффициентов. С учетом признака Y, размерность матрицы становится равным 6. Матрица, независимых переменных Х имеет размерность (25 х 6). Матрица ХT Х определяется непосредственным умножением или по следующим предварительно вычисленным суммам.

Матрица составленная из Y и X

3.94.73.74.75.64.37.14.69.93.44.34.94.94.43.43.84.83.94.14.92.14.353.63.714.716.413.764.740.5114569.564372.482412.2217300.73783.6?y?y2 ?yx1 ?yx2 ?yx3 ?yx4 y10.850.760.830.27Y(x)4.484.444.224.144.734.057.754.579.283.73.964.283.994.984.423.814.594.174.434.044.274.044.063.64 0.00380.0005-0.0005-0.0001-0.0001

Оборот капитала,
млрд. долл. США, x131,3+N13,4+N4,5+N10,0+N20,0+N15,0+N137,1+N17,9+N165,4+N2,0+N6,8+N27,1+N13,4+N9,8+N19,5+N6,8+N27,0+N12,4+N17,7+N12,7+N21,4+N13,5+N13,4+N4,2+N15,5+N18.913.718.54.821.85.89920.160.61.4818.913.212.612.23.2136.91511.91.68.611.51.95.817.518.52438.5408.928979.5517040.9399755.4414229.060.003-0.00060.00080.0001-0.000234.316.47.5132315140.120.9168.459.830.116.412.822.59.83015.420.715.724.416.516.47.218.513.77.518.52438.5709.84372.4856253.0228979.55207737.5924397.6?x1 ?x1 y?x1 2 ?x1 x2 ?x1 x3 ?x1 x4 x1 0.8510.90.910.25?-0.580.26-0.520.560.870.25-0.650.03250.62-0.30.340.620.91-0.58-1.02-0.01260.21-0.27-0.330.86-2.170.260.94-0.0016-0.3 0.0023-0.00050.00060-0.0001

Использованный капитал,
млрд. долл. США, x218,913,718,54,821,85,899,020,160,61,48,018,913,212,612,23,213.06,915,011,91,68,611.51,95,84364.72450.210696.634785.67454.126.841.761.821210533.51429614059.313170.765.423.180.81134.850.238.92855.3207737.5999755.44861839.8795617.91-0.0014-0.00010.00010018.913.718.54.821.85.89920.160.61.4818.913.212.612.23.2136.91511.91.68.611.51.95.814.7134.850.238.9408.92412.2228979.5517040.9399755.4414229.06?x2 ?x2 y?x2 x1 ?x2 2 ?x2 x3 ?x2 x4 x2 0.760.910.710.35(Y-Yср)20.440.01960.740.01961.080.06766.450.001628.521.350.06760.120.120.02561.350.580.05760.440.210.126.050.06760.190.920.7449.72-0.0011-0.0001000

Численность служащих,
тыс. чел., x343,064.724,050,2106,096,6347,085,6745,04,126,841,761,8212,0105,033,5142,096,0140,059,3131,070,765,423.180,840.940.538.538.937.326.53736.836.335.335.33526.233.132.732.130.529.825.429.329.229.229.127.927.212321.810637.382024397.614229.0695617.9127434.2-0.0705-0.0001-0.000200.00224364.72450.210696.634785.67454.126.841.761.821210533.51429614059.313170.765.423.180.815.62321.810637.32855.317300.7207737.5999755.44861839.8795617.91?x3 ?x3 y?x3 x1 ?x3 x2 ?x3 2 ?x3 x4 x3 0.830.910.7110.12

se2 = (Y - X*s)T(Y - X*s) = 12.1

Несмещенная оценка дисперсии равна:

Оценка среднеквадратичного отклонения равна (стандартная ошибка для оценки Y):

Найдем оценку ковариационной матрицы вектора k = S • (XTX)-1

-0.0548-0.0001-0.000100.0017

Рыночня капитлизация компании,
млрд. долл. США, x440,940,538,538,937,326,537,036,836.335.335,335,026,233,132,732,130,529,825,429,329,229,229,127,927,2 

РЕШЕНИЕ:

1.

Линейное уравнение множественной регрессии имеет вид:

Y = ?0 + ?1X1 + ?2X2 + ... + ?mXm + ?

где X = X(X1, X2, ..., Xm) - вектор независимых (объясняющих) переменных; ? - вектор параметров (подлежащих определению); ? - случайная ошибка (отклонение); Y - зависимая (объясняемая) переменная, ?0 - свободный член, определяющий значение Y, в случае, когда все объясняющие переменные Xj равны 0..

Эмпирическое уравнение множественной регрессии представим в виде:

Y = b0 + b1X1 + b1X1 + ... + bmXm + e, Здесь b0, b1, ..., bm - оценки теоретических значений ?0, ?1, ?2, ..., ?m коэффициентов регрессии (эмпирические коэффициенты регрессии); e - оценка отклонения ?.

Для оценки параметров уравнения множественной регрессии применяют МНК – метод наименьших квадратов.

Оценка уравнения регрессии.

Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения:

s = (XTX)-1XTY.Матрица X

Матрица Y

1111111111111111111115140.120.9168.459.830.116.412.822.59.83015.420.715.724.416.516.47.218.55.89920.160.61.4818.913.212.612.23.2136.91511.91.68.611.51.95.896.634785.67454.126.841.761.821210533.51429614059.313170.765.423.180.826.53736.836.335.335.33526.233.132.732.130.529.825.429.329.229.229.127.927.2

Умножаем матрицы, (XTX)

В матрице, (XTX) число 25, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X

Умножаем матрицы, (XTY)

Вектор оценок коэффициентов регрессии равен

s = (XTX)-1XTY =

40.940.538.538.937.326.53736.836.335.335.33526.233.132.732.130.529.825.429.329.229.229.127.927.2

Транспонированная матрица.

111111111111111111114.37.14.69.93.44.34.94.94.43.43.84.83.94.14.92.14.353.63.715140.120.9168.459.830.116.412.822.59.83015.420.715.724.416.516.47.218.55.89920.160.61.4818.913.212.612.23.2136.91511.91.68.611.51.95.896.634785.67454.126.841.761.821210533.51429614059.313170.765.423.180.826.53736.836.335.335.33526.233.132.732.130.529.825.429.329.229.229.127.927.2

Матрица ATA.

8203783.624397.614229.0695617.9127434.2

Полученная матрица имеет следующее соответствие:

?x4 ?x4 y?x4 x1 ?x4 x2 ?x4 x3 ?x4 2

Найдем парные коэффициенты корреляции.

Для y и x1

Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции

Для y и x2

Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции

Для y и x3

Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции

Для y и x4

Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции

Для x1 и x2

Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции

Для x1 и x3

Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции

Для x1 и x4

Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции

Для x2 и x3

Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции

Для x2 и x4

Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции

Для x3 и x4

Средние значения

Дисперсия

Среднеквадратическое отклонение

Коэффициент корреляции

Матрица парных коэффициентов корреляции.

x4 0.270.250.350.121

Анализ первой строки этой матрицы позволяет произвести отбор факторных признаков, которые могут быть включены в модель множественной корреляционной зависимости. Факторные признаки, у которых ryxi < 0.5 исключают из модели.

Коллинеарность – зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:

r(xjy) > r(xkxj) ; r(xky) > r(xkxj).

Если одно из неравенств не соблюдается, то исключается тот параметр xk или xj, связь которого с результативным показателем Y оказывается наименее тесной.

При оценке мультиколлинеарности факторов следует учитывать, что чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии.

Для отбора наиболее значимых факторов xi учитываются следующие условия:

- связь между результативным признаком и факторным должна быть выше межфакторной связи;

- связь между факторами должна быть не более 0.7;

- при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними.

4. Анализ параметров уравнения регрессии.

Перейдем к статистическому анализу полученного уравнения регрессии: проверке значимости уравнения и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации

Для несмещенной оценки дисперсии проделаем следующие вычисления:

Несмещенная ошибка ? = Y - Y(x) = Y - X*s (абсолютная ошибка аппроксимации)


Дисперсии параметров модели определяются соотношением S 2i = Kii, т.е. это элементы, лежащие на главной диагонали
Показатели тесноты связи факторов с результатом.

Если факторные признаки различны по своей сущности и (или) имеют различные единицы измерения, то коэффициенты регрессии bj при разных факторах являются несопоставимыми. Поэтому уравнение регрессии дополняют соизмеримыми показателями тесноты связи фактора с результатом, позволяющими ранжировать факторы по силе влияния на результат.

К таким показателям тесноты связи относят: частные коэффициенты эластичности, частные коэффициенты корреляции.

Частные коэффициенты эластичности.

С целью расширения возможностей содержательного анализа модели регрессии используются частные коэффициенты эластичности, которые определяются по формуле


Частный коэффициент эластичности |E1| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частный коэффициент эластичности |E2| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частный коэффициент эластичности |E3| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частный коэффициент эластичности |E4| < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частные коэффициенты корреляции.

Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (y и xi) при условии, что влияние на них остальных факторов (xj) устранено.


Теснота связи умеренная


Теснота связи не сильная


Теснота связи сильная


Теснота связи низкая.


Теснота связи не сильная


Теснота связи сильная


Теснота связи низкая.


Теснота связи умеренная


Теснота связи сильная


Теснота связи низкая.


Теснота связи низкая.


Теснота связи не сильная


Теснота связи умеренная


Теснота связи не сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи низкая.


Теснота связи низкая.


Теснота связи не сильная


Теснота связи низкая.


Теснота связи не сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи низкая.


Теснота связи умеренная


Теснота связи сильная


Теснота связи низкая.


Теснота связи низкая.


Теснота связи не сильная


Теснота связи низкая.


Теснота связи умеренная


Теснота связи сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи сильная


Теснота связи низкая.


Теснота связи умеренная


Теснота связи сильная


Теснота связи низкая.


Теснота связи низкая.


Теснота связи низкая.


Теснота связи низкая.


Теснота связи низкая.


Теснота связи не сильная


Теснота связи низкая.


Теснота связи низкая.


Теснота связи не сильная


Теснота связи низкая.


Теснота связи низкая.


Теснота связи не сильная


Теснота связи низкая.


Теснота связи низкая.


Теснота связи низкая.
Индекс множественной корреляции (множественный коэффициент корреляции).

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции.

В отличии от парного коэффициента корреляции, который может принимать отрицательные значения, он принимает значения от 0 до 1.

При значении R близком к 1, уравнение регрессии лучше описывает фактические данные и факторы сильнее влияют на результат. При значении R близком к 0 уравнение регрессии плохо описывает фактические данные и факторы оказывают слабое воздействие на результат.
Связь между признаком Y факторами X сильная

Значимость коэффициента корреляции.
По таблице Стьюдента находим Tтабл

Tкрит(n-m-1;?/2) = (20;0.025) = 1.725

Поскольку Tнабл > Tкрит , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически - значим

Интервальная оценка для коэффициента корреляции (доверительный интервал).
Доверительный интервал для коэффициента корреляции

r(0.786;0.9538)

Коэффициент детерминации.

R2= 0.86992 = 0.7568

т.е. в 75.68 % случаев изменения х приводят к изменению y.

Таким образом, точность подбора уравнения регрессии – высокая.

Оценка значения результативного признака при заданных значениях факторов.

Y(0.0,0.0,0.0,0.0,) = 2.5988 + 0.003 * 0.0 + 0.0178 * 0.0 + 0.0054 * 0.0 + 0.0295 * 0.0 = 2.5988.





Приднестровье, г. Каменка, преподаватель Кушнир Анжела Ивановна стр.



Задание II. N =3
Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации