Расчетно-графическая работа: построение модели парной линейной регрессии - файл n1.docx

приобрести
Расчетно-графическая работа: построение модели парной линейной регрессии
скачать (65 kb.)
Доступные файлы (1):
n1.docx65kb.23.08.2012 16:35скачать

n1.docx

Исходные данные:


N п/п

Регион

Среднедушевые денежные расходы населения за месяц, тыс. руб. (Y)

Сальдированный финансовый результат, млн. руб. (X)

1

Архангельская область

5,26

7,85

2

Вологодская область

4,91

6,94

3

Калининградская область

4,69

6,21

4

Ленинградская область

3,72

6,78

5

Мурманская область

7,60

10,40

6

Новгородская область

4,09

5,56

7

Псковская область

3,01

4,67




  1. Построение линейной модели парной регрессии.


Уравнение линейной модели имеет вид: y = a + bx.

Вспомогательная таблица.


Регион, N

Y

X



XY

















1

5,260

7,850

61,623

41,291

0,934

0,873

0,506

0,256

5,459

0,199

3,782

0,040

2

4,910

6,940

48,164

34,075

0,024

0,001

0,156

0,024

4,773

0,137

2,798

0,019

3

4,690

6,210

38,564

29,125

-0,706

0,498

-0,064

0,004

4,222

0,468

9,978

0,219

4

3,720

6,780

45,968

25,222

-0,136

0,018

-1,034

1,070

4,652

0,932

25,052

0,868

5

7,600

10,400

108,160

79,040

3,484

12,140

2,846

8,098

7,382

0,218

2,865

0,047

6

4,090

5,560

30,914

22,740

-1,356

1,838

-0,664

0,441

3,732

0,358

8,759

0,128

7

3,010

4,670

21,809

14,057

-2,246

5,043

-1,744

3,043

3,060

0,050

1,677

0,003

Всего

33,280

48,410

355,201

245,550




20,411

0,000

12,936







54,912

1,324

Среднее значение

4,754

6,916

50,743

35,079



















7,845







Отсюда получаем, что а = -0,462 и b = 0,754, следовательно, линейное уравнение регрессии имеет вид:
у = -0,462 +0,754x,
Где y – результирующая переменная (среднедушевые денежные расходы населения за месяц); x – фактор (сальдированный финансовый результат); a и b - числовые параметры уравнения. Параметр b – коэффициент регрессии, показывающий, как в среднем изменится результативный признак, если факторный признак увеличится на единицу.

Таким образом, данное уравнение имеет следующий смысл: при повышении среднедушевых денежных расходов населения на 0,754 тыс. руб. сальдированный финансовый результат региона повышается на 1 млн. руб.
Определим тесноту связи по шкале Чеддока:

Поскольку линейный коэффициент парной корреляции () положителен и близок к 1, можно сделать вывод о существовании прямой тесной связи между переменными.
Для оценки качества связи найдем коэффициент детерминации:

Следовательно, изменение среднедушевых денежных расходов на 89,8 % объясняется вариацией сальдированного финансового результата и на 10,2 % влиянием прочих факторов. Другими словами, точность подбора уравнения регрессии 89,8 % -высокая.

Найдем среднюю ошибку аппроксимации:


Это означает, что в среднем расчётные значения среднедушевых денежных расходов для линейной модели отличаются от фактических значений на 5,7 %.
Так же для линейной парной регрессии параметры a и b могут быть определены и другими способами:














При использовании нетрадиционных способов определения коэффициентов результаты получаются примерно равными соответствующим значениям коэффициентов, найденными ранее, традиционным способом.
С помощью F – критерия Фишера дадим оценку значимости уравнения регрессии:


  1. Выдвигаем нулевую гипотезу о статистической незначимости параметров регрессии и показателя корреляции.




  1. Сравниваем фактическое и табличное, значения критерия Fфакт > Fтабл.


Fт = 6,608



- количество факторов, n – число наблюдений.


  1. Fф > Fт, следовательно, нулевую гипотезу отклоняем и делаем вывод о статистической значимости между x и y и надежности полученной модели.



С помощью t – критерия Стьюдента дадим оценку значимости коэффициентов линейной регрессии (a и b) и линейного коэффициента парной корреляции:
1. Выдвигаем нулевую гипотезу о статистически незначимом отличии показателей от нуля; а = b = rxy=0;


  1. Табличное значение t-критерия зависит от числа степеней свободы и заданного уровня значимости а.


tт = 2,571


  1. Найдем фактические значения t-критерия. С этой целью, сначала определяются случайные ошибки параметров линейной регрессии и коэффициента корреляции:













4. Сравниваем фактические значения t-критерия с табличным значением:

Т.к. tb и tr больше tт, значит, значения этих параметров сформировались под влиянием систематически действующего фактора х. И поскольку. ta < tт, то признаётся случайная природа формирования этого параметра.

С целью оценки отличия реальных показателей от рассчитанных показателей построим доверительные интервалы. Для этого необходимо определить предельную ошибку параметров:




Доверительные интервалы:



Полученные оценки уравнения регрессии позволяют использовать его для прогноза.

Для определения границ интервала вычислим стандартную ошибку прогнозного значения и на её основе рассчитаем предельную ошибку (хпр = 11):









2. Построение степенной модели парной регрессии.
Уравнение степенной модели имеет вид: y = a * xb.
Для построения этой модели необходимо произвести линеаризацию переменных. Произведём логарифмирование обеих частей уравнения:

lg y = lg a + b lg x. Обозначим Y = lg y, X = lg x, A = lg a. Тогда уравнение примет вид:
Y = A + bX - линейное уравнение регрессии
Рассчитаем его параметры, используя данные таблицы:

Регион, N

y

x



XY

Y=log y

X=log x











1

5,260

7,850

0,801

0,645

0,721

0,895

5,400

0,140

0,020

2,671

0,256

2

4,910

6,940

0,708

0,581

0,691

0,841

4,737

0,173

0,030

3,520

0,024

3

4,690

6,210

0,629

0,532

0,671

0,793

4,209

0,481

0,231

10,255

0,004

4

3,720

6,780

0,691

0,474

0,571

0,831

4,621

0,901

0,812

24,223

1,070

5

7,600

10,400

1,034

0,896

0,881

1,017

7,284

0,316

0,100

4,159

8,098

6

4,090

5,560

0,555

0,456

0,612

0,745

3,742

0,348

0,121

8,507

0,441

7

3,010

4,670

0,448

0,320

0,479

0,669

3,108

0,098

0,010

3,269

3,043

Всего

33,280

48,410

4,866

3,905

4,625

5,792




2,458

1,324

56,604

12,936

Среднее

4,754

6,916

0,695

0,558

0,661

0,827



















Отсюда получаем, что A = -0,219 и b = 1,064.Следовательно, линейное уравнение регрессии будет иметь вид:
Y = -0,219 + 1,064x.
Перейдём к исходным переменным х и у, выполнив потенцирование данного уравнения:

Получим уравнение степенной модели регрессии:



Определим тесноту связи с помощью индекса корреляции:

Поскольку линейный коэффициент парной корреляции () положителен и близок к 1, можно сделать вывод о существовании прямой тесной связи между переменными.
Для оценки качества связи найдем коэффициент детерминации:

Следовательно, изменение среднедушевых денежных расходов на 86,1 % объясняется вариацией сальдированного финансового результата и на 13,9% влиянием прочих факторов. Другими словами, точность подбора уравнения регрессии 86,1 % -высокая.
Найдем среднюю ошибку аппроксимации:

Это означает, что в среднем расчётные значения среднедушевых денежных расходов для линейной модели отличаются от фактических значений на 8,086 %.
С помощью F – критерия Фишера дадим оценку значимости уравнения регрессии:


  1. Выдвигаем нулевую гипотезу о статистической незначимости параметров регрессии и показателя корреляции.

  2. Сравниваем фактическое и табличное, значения критерия Fфакт > Fтабл.


Fт = 6,608



- количество факторов, n – число наблюдений.


  1. Fф > Fт, следовательно, нулевую гипотезу отклоняем и делаем вывод о статистической значимости между x и y и надежности полученной модели.


3. Построение показательной модели парной регрессии.

Уравнение показательной модели имеет вид: y = a * bx.

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведём логарифмирование обеих частей уравнения:

lg y = lg a + x lg b.

Обозначим

Y = lg y, B = lg b, A = lg a.

Тогда уравнение примет вид:

Y = A + Bx - линейное уравнение регрессии
Рассчитаем его параметры, используя данные таблицы:

Регион, N

y

x

Y

Yx

















1

5,260

7,850

0,721

5,660

61,623

0,060

0,004

0,934

0,873

5,253

0,007

0,000

2

4,910

6,940

0,691

4,796

48,164

0,030

0,001

0,024

0,001

4,595

0,315

0,099

3

4,690

6,210

0,671

4,168

38,564

0,010

0,000

-0,706

0,498

4,127

0,563

0,317

4

3,720

6,780

0,571

3,868

45,968

-0,090

0,008

-0,136

0,018

4,488

0,768

0,589

5

7,600

10,400

0,881

9,160

108,160

0,220

0,048

3,484

12,140

7,644

0,044

0,002

6

4,090

5,560

0,612

3,401

30,914

-0,049

0,002

-1,356

1,838

3,750

0,340

0,115

7

3,010

4,670

0,479

2,235

21,809

-0,182

0,033

-2,246

5,043

3,290

0,280

0,078

Всего

33,280

48,410

4,625

33,289

355,201




0,097




20,411




2,318

1,202

Среднее

4,754

6,916

0,661

4,756

50,743
























Отсюда получаем, что A = 0,219 и B = 0,064. Тогда линейное уравнение регрессии примет вид:

Y = 0,219 + 0,064x.
Перейдём к исходным переменным х и у, выполнив потенцирование данного уравнения:

Получим уравнение показательной модели регрессии:



Определим тесноту связи с помощью индекса корреляции:

Поскольку линейный коэффициент парной корреляции () положителен и близок к 1, можно сделать вывод о существовании прямой тесной связи между переменными.
Для оценки качества связи найдем коэффициент детерминации:

Следовательно, изменение среднедушевых денежных расходов на 86,1 % объясняется вариацией сальдированного финансового результата и на 13,9% влиянием прочих факторов. Другими словами, точность подбора уравнения регрессии 86,1 % -высокая.
Найдем среднюю ошибку аппроксимации:

Это означает, что в среднем расчётные значения среднедушевых денежных расходов для линейной модели отличаются от фактических значений на 8,086 %.
С помощью F – критерия Фишера дадим оценку значимости уравнения регрессии:


  1. Выдвигаем нулевую гипотезу о статистической незначимости параметров регрессии и показателя корреляции.

  2. Сравниваем фактическое и табличное, значения критерия Fфакт > Fтабл.


Fт = 6,608

- количество факторов, n – число наблюдений.


  1. Fф > Fт, следовательно, нулевую гипотезу отклоняем и делаем вывод о статистической значимости между x и y и надежности полученной модели.


4. Построение гиперболической модели парной регрессии.
Уравнение гиперболической модели имеет вид: .

Произведём линеаризацию модели путём замены . В результате получим линейное уравнение y = a + bX.

Рассчитаем его параметры, используя данные таблицы:

Регион, N

y

x

X

yX















1

5,260

7,850

0,127

0,670

0,016

0,506

0,256

5,638

0,378

0,143

7,187

2

4,910

6,940

0,144

0,707

0,021

0,156

0,024

5,059

0,149

0,022

3,033

3

4,690

6,210

0,161

0,755

0,026

-0,064

0,004

4,472

0,218

0,048

4,656

4

3,720

6,780

0,147

0,549

0,022

-1,034

1,070

4,941

1,221

1,491

32,823

5

7,600

10,400

0,096

0,731

0,009

2,846

8,098

6,721

0,879

0,773

11,566

6

4,090

5,560

0,180

0,736

0,032

-0,664

0,441

3,819

0,271

0,073

6,628

7

3,010

4,670

0,214

0,645

0,046

-1,744

3,043

2,630

0,380

0,144

12,608

Всего

33,280

48,410

1,070

4,792

0,172




12,936

33,280

3,496

2,694

78,501

Среднее

4,754

6,916

0,153

0,685

0,025




















Отсюда получаем, что a = 10,055 и b = -34,672. Тогда линейное уравнение регрессии примет вид:
y = 10,055 – 34,672.
Получим уравнение гиперболической модели регрессии:


Определим тесноту связи с индекса корреляции:

Поскольку линейный коэффициент парной корреляции () положителен и близок к 1, можно сделать вывод о существовании прямой тесной связи между переменными.
Для оценки качества связи найдем коэффициент детерминации:

Следовательно, изменение среднедушевых денежных расходов на 79,2 % объясняется вариацией сальдированного финансового результата и на 20,8% влиянием прочих факторов. Другими словами, точность подбора уравнения регрессии 79,2 % -высокая.
Найдем среднюю ошибку аппроксимации:

Это означает, что в среднем расчётные значения среднедушевых денежных расходов для линейной модели отличаются от фактических значений на 11,214 %.
С помощью F – критерия Фишера дадим оценку значимости уравнения регрессии:


  1. Выдвигаем нулевую гипотезу о статистической незначимости параметров регрессии и показателя корреляции.

  2. Сравниваем фактическое и табличное, значения критерия Fфакт > Fтабл.


Fт = 6,608


- количество факторов, n – число наблюдений.


  1. Fф > Fт, следовательно, нулевую гипотезу отклоняем и делаем вывод о статистической значимости между x и y и надежности полученной модели.



5. Сводная таблица.
Для выбора лучшей модели построим сводную таблицу результатов:

Модель





A

F

Линейная

0,898

0,947

7,845

43,842

Степенная

0,861

0,928

8,086

30,906

Показательная

0,861

0,928

4,298

30,923

Гиперболическая

0,792

-0,890

11,214

19,010


Проанализировав данные сводной таблицы, характеризующие степень взаимосвязи между изучаемыми признаками, выбираем оптимальный вариант модели. В данном случае это линейная модель. Поскольку < 1, прочие же показатели схожи во всех моделях.


Исходные данные
Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации