Курсовая работа - Прогнозирование объема кредита - файл n1.doc

Курсовая работа - Прогнозирование объема кредита
скачать (363.1 kb.)
Доступные файлы (1):
n1.doc4822kb.01.04.2010 01:19скачать

n1.doc

  1   2   3


Реферат

В данной работе проведен обзор методов социально-экономического прогнозирования, наиболее часто применяемых в экономической практике. Выбраны четыре модели для прогнозирования кредитов: Метод наименьших квадратов, модель Хольта, экспоненциальное сглаживание. Данные представлены в виде временного ряда. Выбранные модели дают различный результат прогноза. Лучшие результаты были получены при использовании Метода наименьших квадратов и модели Хольта. Результаты вычислений представлены в таблицах. По каждой модели была проведена оценка качества прогнозирования: рассчитана абсолютная ошибка прогноза, средняя относительная ошибка прогноза, проверена адекватность модели по критерию Дарбина-Уотсона. Именно эти показатели рассматривались в качестве критерия для выбора модели, дающей наилучшее прогнозное значение интересующей нас переменной, т.е. кредитов.

Все расчеты проводились с использованием программ Statistica и Excel, что дало возможность визуально представить результаты работы.
Оглавление
Введение

  1. Описание предметной области и постановка задачи исследования

  2. Описание используемого математического аппарата при проведении расчетов

  3. Описание выбранных программных продуктов

  4. Анализ адекватности выбранной модели

Заключение

Список литературы

Введение



В экономике основой практически любой деятельности является прогноз. Уже на основе прогноза составляется план действий и мероприятий. Таким образом, можно сказать, что прогноз макроэкономических переменных является основополагающей составляющей планов всех субъектов экономической деятельности.

Прогнозирование – это способ научного предвидения, в котором используется как накопленный в прошлом опыт, так и текущие допущения насчет будущего с целью его определения. Основная функция прогноза – обоснование возможного состояния объекта в будущем или определение альтернативных путей.

В настоящее время ни одна сфера жизни общества не может обойтись без прогнозов как средства познания будущего. Особо важное значение имеют прогнозы социально-экономического развития общества, обоснование
основных направлений экономической политики, предвидение последствий
принимаемых решений.

Актуальность данной темы как в условиях развитой рыночной экономики, так и переходной экономики определяется тем, что уровень прогнозирования процессов общественного развития обуславливает эффективность планирования и управления экономикой и другими сферами.

Целью данной курсовой работы является рассмотрение наиболее эффективных методов социально экономических прогнозов и осуществление прогнозирования кредитов в РФ в 2007 году.

Организация финансово-кредитного обслуживания предприятий, организаций и населения, функционирование кредитной системы играют исключительно важную роль в развитии хозяйственных структур. От эффективности и бесперебойности функционирования кредитно-финансового механизма зависят не только своевременное получение средств отдельными хозяйственными единицами, но и темпы экономического развития страны в целом.

Кредитные операции - это отношения между кредитором и заемщиком (дебитором) по представлению первым последнему определенной суммы денежных средств на условиях платности, срочности, возвратности. Банковские кредитные операции подразделяются на две большие группы:


1. Описание предметной области и постановка задачи исследования
Задачей данного исследования является осуществление точечного краткосрочного прогноза по выдачи кредита.

Прогнозирование – разработка прогноза, т.е. специальное научное исследование перспектив (прошлых тенденций) развития каких-либо явлений

(технических, социально-экономических).

При прогнозировании используются три группы методов:

Экстраполяция изучает явление и переносит тенденции этого изученного явления на другую часть этого явления или переносит прошлые тенденции явления на будущие периоды. В научном плане примером экстраполяции является математическая статистика.

Интерполяция имеет сходную с экстраполяцией методологию – ищет промежуточные значения величины (параметра) по некоторым известным её значениям.

В данной работе будут использованы следующие аналитические методы прогнозной экстраполяции: метод наименьших квадратов, адаптивные методы.

Качество прогнозирования, прежде всего, характеризуется ошибкой прогноза, (математическое определение качества прогноза): предполагается, что чем меньше ошибка прогноза, тем выше его качество.

Все существующие методики оценки качества прогнозирования можно условно разделить на три группы показателей:

Абсолютные показатели оценки качества прогноза позволяют количественно определить величину ошибки прогноза в единицах измерения прогнозируемого объекта или в процентах. Это среднеквадратическая ошибка (), абсолютная ошибка (), средняя абсолютная ошибка (), относительная ошибка () и средняя относительная ошибка ().

Абсолютная ошибка прогноза может быть определена как разность между фактическим значением () и прогнозом (), значит,

;
среднее абсолютное значение ошибки

.

Среднее абсолютное значение всегда неотрицательно. Среднеквадратическая ошибка прогноза рассчитывается по формуле:

, где n – период упреждения.

Недостатком рассматриваемых показателей является то, что значение этих характеристик существенно зависит от масштаба измерения уровней исследуемых явлений.

Поэтому абсолютная ошибка прогноза может быть выражена в процентах относительно фактических изменений показателя следующим образом:

,

а средняя относительная ошибка рассчитывается как

.

Данный показатель используется, как правило, при сравнении точности прогнозов разнородных объектов прогнозирования.

Сравнительные показатели оценки качества прогноза основаны на сравнении ошибки рассматриваемого прогноза с эталонными прогнозами определенного вида.

Один из типов таких показателей может быть представлен следующим образом:

,

где - прогнозируемое значение величины эталонного прогноза. В качестве эталонного прогноза может быть выбрана простая экстраполяция, постоянный темп прироста и т.д.

Качественные показатели позволяют повести некоторый анализ видов ошибок прогнозов, разложить их на какие-либо составляющие. Особенно такой анализ важен для циклически меняющихся переменных, когда необходимо прогнозировать не только общее направление развития, но и поворотные точки цикла, в которых меняются коэффициенты адаптации прогнозной модели.

Все рассмотренные выше показатели точности прогноза используются при проверке точности прогноза, полученного в виде точечных оценок.

Выбор показателей точности зависит от задач, которые ставит перед собой исследователь при анализе точности прогноза.

Важным критерием правильности применения прогнозной модели является проверка на адекватность. Адекватными моделями считаются такие, для которых остаточная компонента имеет свойства независимости, случайности и нормальности распределения.

В данной работе использовались абсолютные показатели оценки качества прогноза.


2. Описание используемого математического аппарата при проведении расчетов
Как уже отмечалось выше, в данной курсовой работе использовались аналитические методы прогнозной экстраполяции: метод наименьших квадратов, адаптивные методы. Расчеты проводились на их основе. Остановимся поподробнее на каждом из них.
2.1. Метод наименьших квадратов (МНК)

Метод наименьших квадратов позволяет относительно просто определить аналитическую зависимость одного показателя от другого:

y=?(x).

Имея такую функциональную зависимость, легко определить значение Y при любом значении x, т.е. получить прогнозное значение Y при заданном значении х.

2.1.1. Вывод формул метода наименьших квадратов

Пусть имеем статистические данные о параметре y в зависимости от х. Эти данные представим в виде табл.1.


х

х1

х2

…..

хi

…..

хn

y*

y1*

y2*

......

yi*

…..

yn*


Метод наименьших квадратов позволяет при заданном типе зависимости y=?(x) так выбрать ее числовые параметры, чтобы кривая y=?(x) наилучшим образом отображала экспериментальные данные по заданному критерию. Рассмотрим обоснование с точки зрения теории вероятностей для математического определения параметров, входящих в ?(x).

Предположим, что истинная зависимость y от х в точности выражается формулой y=?(x). Экспериментальные точки, представленные в табл.2, отклоняются от этой зависимости следствие ошибок измерения. Ошибки измерения подчиняются по теореме Ляпунова нормальному закону. Рассмотрим какое-нибудь значение аргумента хi. Результат опыта есть случайная величина yi,распределенная по нормальному закону с математическим ожиданием ?(xi) и со средним квадратическим отклонением ?i, характеризующим ошибку измерения. Пусть точность измерения во всех точках х=(х1, х2, …, хn) одинакова, т.е. ?1=?2=…=?n=?. Тогда нормальный закон распределения Yi имеет вид:

(1)

В результате ряда измерений произошло следующее событие: случайные величины (y1*, y2*, …, yn*). Поставим следующую задачу.

Задача МНК. Подобрать математические ожидания ?(x1), ?(x2), …, ?(xn) так, чтобы вероятность этого события была максимальной. Так как величины Yi непрерывны, то говорят не о вероятностях событий Yi=yi*, а о вероятностях того, что Yi примут значения из интервала (yi*,yi*+dyi*), т.е.



Вероятность P того, что система случайных величин (y1, y2, …, yn) примет совокупность значений, лежащих в пределах (yi*,yi*+dyi*), i=1, 2, …, n, с учетом того, что измерения проводятся независимо друг от друга, равна произведению вероятностей Fi(yi)*dyi* для всех значений i:

(2)
Где k – коэффициент, не зависящий от ?(xi).

Требуется выбрать математические ожидания

?(x1), ?(x2), …, ?(xn) так, чтобы выражение (2) достигало максимума. Это возможно, когда выполнено условие

. (3)

Отсюда получаем требование метода наименьших квадратов: для того чтобы данная совокупность наблюдаемых значений (y1*, y2*, …, yn*) была наивероятнейшей, нужно выбрать функцию ?(x) так, чтобы сумма квадратов отклонений наблюдаемых значений yi* от ?(xi) была наименьшей.

При решении практических задач зависимость y=?(x) задается в виде y=?(x,a1, a2, …, am), где a1, a2, …, am – числовые параметры, которые необходимо определить. Учитывая соотношение (3), получим

(4)

Продифференцируем выражение (4) по a1, a2, …, am и прировняем полученные производные нулю. Получим следующую систему уравнений:

,

,

… … … … … … … … … … ; (5)

,
где - значения частной производной функции ? по аk в точке хi.

Отметим, что в общем случае систему (5) решить нельзя, так как неизвестен вид функции ?(x,a1, a2, …, am). При решении практических задач зависимость y от x ищут в виде линейной комбинации известных функций с коэффициентами a1, a2, …, am, а именно: . Подставив значение ?k(х) в (5), решаем эту систему и находим a1, a2, …, am.

Рассмотрим один из частных случаев МНК: пусть зависимость y от х выражается линейной функцией y=a1+a2x. Тогда значения коэффициентов a1 и a2 находятся по следующим формулам:

; (6)
2.2. Адаптивные методы прогнозирования

Временным рядом называется множество наблюдений, получаемых последовательно во времени.

Прогнозирование с помощью временных рядов относится к классу адаптивных методов прогнозирования, которые имеют следующие особенности:

1) в основе всех адаптивных моделей лежит идея экспоненциального сглаживания;

2) адаптивные модели отражают только текущие свойства исследуемого временного ряда;

3) на каждой итерации адаптивные модели непрерывно учитывают текущие изменения характеристик ряда;

4) некоторые адаптивные модели обладают свойством самонастраивания, т.е. свойством учитывать прошлые изменения характеристик ряда;

5) критерием качества использования адаптивной прогнозной модели, как правило, является средний квадрат ошибки прогнозирования. В редких случаях за качество модели принимается отсутствие автокорреляции между членами временного ряда.

Согласно классическому подходу, в общем случае временной ряд рассматривается как состоящий из четырёх компонент: тренда, сезонных колебаний, нерегулярных колебаний и случайной компоненты.

Для описания временных рядов используется следующая модель:

хt=?t + ?t, (7)

где хt – текущий член временного ряда в момент времени t;

?t – случайная величина, которая генерируется детерминированной функцией или стохастическим процессом;

?t – случайная величина, которая генерируется случайным неавтокоррелированным процессом с математическим ожиданием М=0 и постоянной дисперсией.

Значение прогнозируемого показателя определяется по формуле (7) только случайной величиной ?t, так как в силу концепции модели (7) только через нее может быть реализовано взаимодействие членов ряда. Величина ?t называется уровнем ряда хt и может быть представлена различными законами, т.е. трендами.

Случайная величина ?t влияет на один или несколько соответствующих членов временного ряда, причем долевое влияние ?t на прогноз значительно меньше, чем влияние ?t.

Простейшие адаптивные модели используют идею экспоненциального сглаживания, т.е. вычисление экспоненциальной средней. Рассмотрим экспоненциальное сглаживание.
2.2.1. Экспоненциальное сглаживание

При исследовании временного ряда xt экспоненциальное сглаживание проводится по формуле:

(8)

Где хt – текущий член временного ряда в момент времени t;

St – значение экспоненциальной средней в момент времени t;

? – параметр адаптации (параметр сглаживания),

0< ?<1, ?=1-?.

В качестве начальных условий для применения экспоненциального сглаживания рекомендуется выбирать следующие значения:

среднее арифметическое всех имеющихся значений (или части значений) временного ряда;

среднее геометрическое всех имеющихся значений временного ряда;

значения, выбранные из статистики, полученной при наблюдении за аналогами изучаемого явления.
2.3. Модели линейного роста

Если временной ряд имеет тенденцию линейного роста, то применение экспоненциальной средней ведет к смещенным прогнозам. Поэтому были сконструированы специальные адаптивные модели, учитывающие тенденции роста и опирающиеся на идею экспоненциального сглаживания.

Эти модели позволяют статистически данным, близким к периоду прогнозирования, придать в некотором смысле больший вес, а наблюдениям, относящимся к далекому прошлому, - меньший, тогда как при использовании критерия наименьших квадратов все наблюдения имеют равный вес. При исследовании численности населения была использована двухпараметрич-ая

модель Хольта.

Простейшая модификация двухпараметрической модели Хольта выглядит следующим образом:



где:

- временной ряд;

- прогнозное значение временного ряда в точке t на шагов вперед;

- шаг прогноза;

- коэффициенты;

- параметры адаптации, и ;

- ошибка прогноза.
3. Описание выбранных программных продуктов
Для расчетов будет использоваться СПП STATISTICA и MS Excel.

Программа MS Excel, являясь лидером на рынке программ обработки электронных таблиц, определяет тенденции развития в этой области. Вплоть до версии 4.0 программа Excel представляла собой фактический стандарт с точки зрения функциональных возможностей и удобства работы. Теперь на рынке появилась версия 5.0, которая содержит много улучшений и приятных неожиданностей.

К значительным достижениям в новой версии программы Excel можно отнести появление трехмерных документов (блокнотов). Установление связей между файлами и таблицами значительно упростилось по сравнению с прежними версиями. Контекстные меню значительно расширены, а дополнительные программные инструменты облегчают решение сложных прикладных задач.

Следует также упомянуть о различных помощниках (Ассистентах), которые помогают пользователю задавать функции и выдают рекомендации, если существует более простой метод решения текущей задачи. В программу Excel встроена удобная подсистема помощи, которая в любой момент готова выдать необходимую справку.

Описанные до сих пор новшества касаются в основном комфорта в работе и быстрого освоения программы. Одним из важнейших функциональных расширений программы, предназначенным для профессионалов, является встроенная в Excel Среда программирования Visual Basic (VBA) для решения прикладных задач. Благодаря VBA фирме Microsoft удалось не только расширить возможности языка макрокоманд Excel 4.0, но и ввести новый уровень прикладного программирования, поскольку VBA позволяет создавать полноценные прикладные пакеты, которые по своим функциям выходят далеко за рамки обработки электронных таблиц. Кроме этого, следует назвать следующие важные новшества программы Excel 5.0:

- менеджер файлов, который выдает подробную информацию о всех файлах;

- диалоговые окна-регистры;

- отдельная пиктограмма для форматирования;

- появление механизма Drag & Plot, предназначенного для быстрой активизации диаграмм.

MS Excel - средство для работы с электронными таблицами, намного превышающее по своим возможностям существующие редакторы таблиц. MS Excel - это простое и удобное средство, позволяющее проанализировать данные и, при необходимости, проинформировать о результате заинтересованную аудиторию, используя Internet.
Ключевые преимущества:


Достоинства Microsoft Excel


Пакет STATISTICA был создан в начале 1990-х годов сразу для среды Windows. В пакете нашли отражение многие последние достижения теоретической и прикладной статистики.

У пакета есть специальная версия для обучения основам статистических методов – Studеnt Еditiоn оf STATISTICA. Эта версия позволяет анализировать файлы данных, включающих не более 400 наблюдений, и представляет собой урезанный вариант пакета.

Основная версия пакета может дополнительно комплектоваться специализированными модулями: Роwеr Analysis (планирование статистических исследовании), Nеural Nеtwоrks (нейросетевой анализ) и др.

С помощью реализованных в системе STATISTICA мощных языков программирования, снабженных специальными средствами поддержки, легко создаются законченные пользовательские решения и встраиваются в различные другие приложения или вычислительные среды. Очень трудно представить себе, что кому-то могут понадобиться абсолютно все статистические процедуры и методы визуализации, имеющиеся в системе STATISTICA, однако опыт многих людей, успешно работающих с пакетом, свидетельствует о том, что возможность доступа к новым, нетрадиционным методам анализа данных помогает находить новые способы проверки рабочих гипотез и исследования данных.

STATISTICA является наиболее динамично развивающимся статистическим пакетом и по многочисленным рейтингам является мировым лидером на рынке статистического программного обеспечения. СПП STATISTICA является универсальной системой, предназначенной для статистического анализа и визуализации данных, управления базами данных и разработки пользовательских приложений, содержащей широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе.

Она состоит из следующих основных компонент, объединенных в рамках одной системы:

Статистический анализ данных в системе STATISTICA может быть разбит на следующие основные этапы:

Пакет содержит следующие модули:

Basic Statistic/Tables – Основные статистики и таблицы: позволяет провести предварительную обработку данных, осуществить разведочный анализ, определить зависимости между переменными, разбить их различными способами на группы;

Nonparametrics/Distrib. – Модуль Непараметрическая статистика/Распределеня: дает возможность проверить гипотезы о характере распределения ваших данных;

ANOVA/MANOVA – Модуль дисперсионного анализа: представляет собой набор процедур общего одномерного и многомерного дисперсионного и ковариационного анализа;

Multiple Regression - Модуль Множественная регрессия: помогает построить зависимости между многомерными переменными, подобрать простую линейную модель и оценить ее адекватность;

Nonlinear Estimation – Модуль Нелинейное оценивание: предоставляет возможность определения нелинейной зависимости в данных и подгонки к ним функциональных кривых;

Time Series/Forecasting – Анализ временных рядов и прогнозирование: общее назначение модуля – построить простую модель, описывающую ряд, сгладить его, спрогнозировать будущие значения временного ряда на основе наблюдаемых до данного момента, построить регрессионные зависимости одного ряда от другого, провести спектральный или Фурье – анализ ряда;

Claster Analysis – Модуль Кластерный анализ: позволяет произвести сложную иерархическую классификацию данных или выделить в них кластеры;

Data Management/MFM - Управление данными: специализированный модуль, который содержит большое количество вспомогательных процедур по работе с данными (иерархическая сортировка, проверка, категоризация и ранжирование и др.);

Factor Analysis – Модуль Факторный анализ: дает возможность сжать данные или выделить основные общие факторы, влияющие на наблюдаемые характеристики сложного объекта и объясняющие связи между ними;

Canonical Analysis – Модуль Канонический анализ: включает в себя широкий набор процедур для выполнения канонического корреляционного анализа, исследования связи между двумя множествами переменных;

Multidimensional Scaling – Модуль Многомерное шкалирование: помогает представить данные о близости объектов какой-либо простой пространственной моделью, в которой объекты интерпретируются, например, как города на обычной карте, а различия между ними есть просто расстояния, в частности данные о странах, политических партиях и т.д., и всесторонне диагностировать модель;

SEPATH – Модуль Моделирование структурными уравнениями: позволяет строить и тестировать различные модели, объясняющие структуру связей между наблюдаемыми переменными;

Reliability/Item Analysis – Модуль Анализ надежности: включает широкий набор процедур для разработки и вычислений надежности сложных объектов на основе результатов обследований и диагностики отдельных узлов;

Discriminant Analysis - Модуль Дискриминантный анализ: позволяет построить на основе ряда предположений классификационное правило отнесения объекта к одному из нескольких классов, минимизируя некоторый разумный критерий;

Log-linear Analysis – Модуль Лог-линейный анализ: проводит анализ сложных многоуровневых таблиц;

Survival Analysis – Модуль Анализ длительностей жизни: предлагает обширный набор методов анализа данных из социологии, биологии, медицины, так же, как процедуры, используемые в инженерии и маркетинге;

Commmand Language (SCL) – Командный язык STATISTICA: позволяет автоматизировать рутинные процессы обработки данных в системе;

STATISTICA File Server – позволяет быстро открыть для просмотра/редактирования как графики и таблицы, так и отчеты.

Выбор системы STATISTICA в качестве инструмента для обработки данных может быть обусловлен возможностью проведения наиболее полного анализа, т.к. система содержит все необходимые нам статистические процедуры.

Основные преимущества системы STATISTICA:
  1   2   3


Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации