Факторный анализ - файл n1.doc

приобрести
Факторный анализ
скачать (237 kb.)
Доступные файлы (1):
n1.doc237kb.08.07.2012 16:49скачать

n1.doc



Министерство образования и науки Российской Федерации

__________

Государственное образовательное учреждение

высшего профессионального образования

«Омский государственный технический университет»
А.А. Ананко
ФАКТОРНЫЙ АНАЛИЗ
Методические указания


Омск

Издательство ОмГТУ

2011
Рецензенты:

Л.Н. Ахтулова, канд. техн. наук, доцент каф. управления качеством СибАДИ;

И.А. Исакова, канд. техн. наук, доцент каф. высшей математика СибАДИ.

Составитель: Ананко Алла Александровна

Кафедра «Высшая математика»




ОГЛАВЛЕНИЕ





Факторный анализ……………………………………….

4

1.

История и назначение факторного анализа……………………..

4

2.

Основные задачи факторного анализа…………………………..

4

3.

Факторный анализ и матрица корреляции………………………

5

4.

Основные показатели факторного анализа……………………...

5

5.

Методы факторного анализа……………………………………..

7

6.

Последовательного анализа………………………………………

9

7.

Пример из области психологии………………………………….
БИБЛИГРАФИЧЕСКИЙ СПИСОК……………………………...

13
20



ФАКТОРНЫЙ АНАЛИЗ



1 История и назначение факторного анализа
Факторный анализ в настоящее время широко используется не только в психологии, но и в социологии, экономике, биологии, нейрофизиологии и других науках.

Он впервые возник в психонометрике и долгое время являлся математической моделью психологической теорией интеллекта. Основные идеи факторного анализа были сформулированы английским психологом Ф. Гальтоном в 1901 году. Дальнейшее развитие этот метод получил благодаря работам американского математика Хотеллинга, разработавшего современный вариант метода главных компонент, а так же Спирмена, Терстоуна, Кеттела, Айзена, Пирсона. Сегодня факторный анализ включен во все пакеты прикладных программ по статистике – SPSS, SAS, Statistica и т.п.

Основная идея факторного анализа заключается в следующем: если несколько признаков в нашем многомерном исследовании изменяются согласованно (коррелируют), то возможно выявление одной скрытой причины этой совместной изменчивости, фактора, который мы не можем измерить непосредственно.

Например, анализируя оценки по нескольким шкалам, психолог замечает, что они сходны между собой и имеют большой коэффициент корреляции. Он может предположить, что существует некоторая скрытая (латентная) переменная, с помощью которой можно объяснить наблюдаемое сходство оценок. такую латентную переменную и называют фактором. Такой фактор влияет на множество показателей других переменных, и мы выделаем его как наиболее общий. Таким образом факторный анализ позволяет описать объект всесторонне и в то же время более компактно. Результатом его является переход от множества исходных переменных к существенно меньшему их числу- факторов.

При факторном анализе в один фактор объединяются сильно коррелирующие между собой переменные, в результате происходит перераспределение дисперсии между компонентами и получается максимально простая и наглядная структура факторов. Внутри каждого фактора коррелированность компонент между собой выше, чем их коррелированность с компонентами других факторов. Это позволяет выделить латентные переменные, что бывает важно при анализе социальных представлений, личностных ценностей, интеллектуальных способностей и т.п.
2 Основные задачи факторного анализа


  1. Исследование структуры взаимосвязи переменных. Каждая группа переменных будет объясняться фактором, по которому эти переменные имеют максимальную нагрузку.

  2. Интерпретация факторов как латентных переменных. Каждый фактор идентифицируется по группе своих переменных. Идентификация фактора заключается в присвоении ему такого имени, которое обобщает смысл входящих в его переменных.

  3. Вычисление значений факторов как новых интегральных переменных. При этом количество новых переменных существенно меньше количества исходных переменных.


3 Факторный анализ и матрица корреляций.
Факторный анализ построен на изучении корреляций множества признаков. Фактор является причиной изменчивости нескольких исходных переменных. Поэтому для расчета, так называемой, компонентной матрицы используется исходная матрица корреляций. Далее определяются переменные, корреляция которых имеет максимальную долю дисперсии. Эти переменные определяют первый фактор. Затем они исключаются и выбираются те переменные, которые объясняют остальную дисперсию и т.д. до тех пор, пока не будет объяснена вся дисперсия переменных.
4 Основные показатели факторного анализа
1.Матрица компонент-это одна из основных матриц, получаемых в результате факторного анализа. Каждый элемент этой матрицы–компонентная нагрузка конкретной переменной и соответствующей компоненты, являющейся аналогом коэффициента корреляции. Компонентная матрица строится путем математического решения задачи сокращения количества переменных при условии сохранения их максимальной доли дисперсии, где полная, равная 1 дисперсия каждой переменной раскладывается по компонентам. Максимальное количество выделяемых компонент равно числу переменных, участвующих в факторном анализе, они описывают 100٪ дисперсии.

2.Факторные нагрузки переменных в матрице компонентэто аналоги коэффициентов корреляции, они отражают степень взаимосвязи соответствующих переменных и факторов. Чем больше их значение, тем сильнее связь переменной с фактором, тем больше данная переменная обусловлена действием фактора. Квадрат факторной нагрузки есть часть общей дисперсии, объясняемой конкретной переменной в факторе. Сумма квадратов всех компонентных нагрузок в строке матрицы компонент равна 1, то есть полной дисперсии переменной по всем факторам.

3.Общность понимается как часть дисперсии переменной, объясненная фактором (всеми и несколькими). Общность рассчитывается как сумма квадратов факторных нагрузок. Общность– часть дисперсии переменной, обусловленная действием самих факторов.

4.Характерность понимается как часть необъясненной факторами дисперсии переменной. Характерность рассчитывается как единица минус сумма квадратов факторных нагрузок. Характерность является спецификой данной переменной, либо связана с ошибками измерения. Сумма общности и характерности равна 1, т.е полной дисперсии переменной.

5.Собственное значение фактораэто показатель, пропорциональный общей доли дисперсии относительного общего числа переменных (понимается как мощность фактора). Собственное значение фактора рассчитывается как сумма квадратов всех компонентных нагрузок по столбцу. Собственные значения факторов выделяются в порядке убывания. Сумма всех собственных значений равна количеству переменных.

6. Показатель полноты факторизацииэтот показатель рассчитывается как сумма квадратов всех элементов факторной структуры деленная на число переменных. Нижней границей этого показателя является 0,7. Если значение показателя полноты факторизации меньше 0,7, то рекомендуется увеличить число факторов или уменьшить число переменных.
Рассмотрим, как работает факторный анализ на простом примере.
Пример 1
Выборка из 50 испытуемых была обследована с помощью психологического теста по пяти показателям интеллекта:

  1. устный счет;

  2. продолжение числовых рядов;

  3. осведомленность;

  4. словарный запас;

  5. определения сходства.

Были вычислены коэффициенты корреляции для всех пар показателей. В результате анализа корреляций, все показатели оказались статистически взаимосвязанными на уровне значимости p<0,05, кроме показателя 1 и 4, где к=0,23 (коэффициент корреляции). Близких к 1 коэффициентов корреляции не получилось. По этим результатам была составлена исходная матрица корреляций.

Таблица 1

Матрица корреляций пяти показателей интеллекта.





Показатели

1

2

3

4

5

1

Счет в уме

1,00

0,88

0,33

0,23

0,42

2

Числовые ряды

0,88

1,00

0,32

0,24

0,35

3

Осведомленность

0,33

0,32

1,00

0,58

0,54

4

Словарный запас

0,23

0,24

0,58

1,00

0,54

5

Сходство

0,42

0,35

0,58

0,54

1,00


Таблица 2

Факторные нагрузки после варимакс-вращения


Исходные переменные

Факторные нагрузки

(общность)

Я

Рг

1

0,97

0,20

0,99

2

0,86

0,20

0,78

3

1,18

0,76

0,62

4

1,09

0,74

0,56

5

1,06

0,69

0,55

Собственное значение

1,79

1,70

3,5

Доля дисперсии

0,36

0,34

0,7


В результате применения факторного анализа выделилось два фактора (

и ). По фактору максимальные нагрузки (0,97 и 0,86) имеют 1 и 2 показатели. По фактору максимальные нагрузки имеют показатели 3,4,5.

Перейдем к интерпретации двух полученных факторов. Переменные 1–устный счет и 2–продолжение числовых рядов можно называть словом «математические способности». Фактор идентифицируется как «математические способности».

Переменные 3,4,5(словарный запас, осведомленность, сходство понятий) – определяют словесные понимания испытуемого. Поэтому фактор идентифицируется как «вербальные способности». Таким образом мы сократили число переменных с 5 до 2 и выявили два скрытых за взаимосвязью пяти признаков фактора.
5. Метода факторного анализа

Методы факторного анализа — это различные способы получения фак­торной структуры при заданном числе факторов. Эти способы, как уже гово­рилось, отличаются решением проблемы общностей. Рассмотрим наиболее часто применяемые методы: анализ главных компонент, метод главных фак­торов, факторный анализ образов (общности равны квадрату КМК), метод, не взвешенных наименьших квадратов, обобщенный метод наименьших квад­ратов и метод максимального правдоподобия.

Анализ главных компонент (Principal Components) иногда используется в ка­честве факторного анализа, хотя это и не вполне корректно. При использова­нии этого метода общность каждой переменной получается автоматически, путем суммирования квадратов ее нагрузок по всем главным компонентам. Вопрос о приближении восстановленных коэффициентов корреляции к ис­ходным корреляциям не решается. В результате факторная структура иска­жается в сторону преувеличения абсолютных величин факторных нагрузок.

Факторный анализ образов (общности равны квадрату КМК) (Image Facto­ring) — это метод главных компонент, применяемый к так называемой реду­цированной корреляционной матрице, у которой вместо единиц на главной диагонали располагаются оценки общностей. Общность каждой переменной оценивается предварительно, как квадрат коэффициента множественной корреляции (КМК) этой переменной со всеми остальными. Такая оценка, с точки зрения теоретиков факторного анализа, приводит к более точным ре­зультатам, чем в анализе главных компонент. Но значения общностей недо­оцениваются, что также приводит к искажениям факторной структуры, хотя и меньшим, чем в предыдущем случае.

Метод главных осей (Principal Axis Factoring), позволяет получить более точ­ное решение. На первом шаге общности вычисляются по методу главных ком­понент. На каждом последующем шаге собственные значения и факторные нагрузки вычисляются исходя из предыдущих значений общностей. Оконча­тельное решение получается при выполнении заданного числа итераций или достижении минимальных различий между общностями на данном и преды­дущем шагах.

Метод не взвешенных наименьших квадратов (Inveighed least squares) — минимизирует квадраты остатков (разностей) исходной и воспроизведенной корреляционных матриц (вне главной диагонали). На первом шаге оценива­ются общности через квадрат КМК. Затем вычисляется факторная структура, и восстанавливаются коэффициенты корреляции. Проверяется разность квад­ратов исходных и вычисленных корреляций. За новые значения общностей принимаются вычисленные по полученной факторной структуре. На втором шаге вычисляется новая факторная структура, и снова проверяется соответ­ствие исходных и восстановленных коэффициентов корреляции. Процесс повторяется многократно до тех пор, пока не достигается минимально воз­можная разница между исходными и вычисленными корреляциями при за­данном числе факторов. Метод, по определению, дает минимальные ошибки факторной структуры при фиксированном числе факторов.

Обобщенный метод наименьших квадратов (Generalized least squares) — отли­чается от предыдущего тем, что для каждой переменной вводятся специаль­ные весовые коэффициенты. Чем больше общность переменной, тем в боль­шей степени она влияет на факторную структуру (имеет больший вес). Это соответствует основному принципу статистического оценивания, по которо­му менее точные наблюдения учитываются в меньшей степени. В этом — ос­новное преимущество этого метода перед остальными.

Метод максимального правдоподобия (Maximum likelihood) также направлен на уменьшение разности исходных и вычисленных корреляций между при­знаками. Дополнительно этот метод позволяет получить важный показатель полноты факторизации — статистическую оценку «качества подгонки». Ме­рой качества является оценка различия исходных и вычисленных коэффици­ентов корреляции по х2-критерию, значимость которого определяется в за­висимости от числа факторов и количества переменных.

Вряд ли возможно дать общие рекомендации о преимуществе или недо­статке того или иного метода. Можно лишь отметить, что анализ главных ком­понент дает наиболее грубое решение, а метод максимального правдоподо­бия позволяет статистически оценить минимально возможное число факторов для данного набора переменных. По-видимому, в каждом конкретном случае стоит сравнивать результаты применения разных методов и выбирать тот, ко­торый позволяет получить наиболее простую и доступную интерпретации факторную структуру.

6. Последовательность факторного анализа

Особенность факторного анализа заключается в неопределенности реше­ния его основных проблем, т.к. нет чет­ких критериев качества их решения, есть лишь рекомендации, которыми руководствуется исследователь в своем стремлении содержательно интерпре­тировать получаемые результаты. Поэтому факторный анализ — это пошаго­вая процедура, где на каждом шаге исследователь принимает решение о даль­нейших преобразованиях данных. Главным же ориентиром на этом пути остается возможность получения содержательной интерпретации конечных результатов.
Весь процесс факторного анализа можно представить как выполнение шести этапов:

  1. Выбор исходных данных.

  2. Предварительное решение проблемы числа факторов.

  3. Факторизация матрицы интеркорреляций.

  4. Вращение факторов и их предварительная интерпретация.

  5. Принятие решения о качестве факторной структуры.

  6. Вычисление факторных коэффициентов и оценок.

Исследователь, в зависимости от своих целей, решает, сколько раз повто­рить эту последовательность, какие из этапов будут пропущены. Например, если исследователя ин­тересует только структура взаимосвязей признаков, то достаточно выполнить эту последовательность один раз, без последнего этапа. Именно эта последовательность и выполнена в п. 9.7. в «Примере из области психологии».

Этап 1. Выбор исходных данных

Модель факторного анализа разрабатывалась для метрических данных. Поэтому первое требование к исходным данным — представление всех при­знаков в метрической шкале.

Включение в анализ порядковых или бинарных данных допустимо, но ис­следователь должен отдавать себе отчет, что искажения факторной структуры при этом будут соответствовать искажениям коэффициентов корреляций, и характер этих искажений неизвестен. В общем случае желательно перейти к единой шкале для всех признаков, либо ранговой, либо бинарной, затем вы­числять матрицу интеркорреляций, выбирая соответствующие меры взаимо­связи.

Если цель факторного анализа заключается только в определении струк­туры взаимосвязей переменных, то допустимо применение порядковых дан­ных, но перед проведением факторного анализа необходимо перейти к ран­гам по каждой переменной.

Порядковые данные могут использоваться для вычисления оценок факторов, но при условии действительно простой фак­торной структуры, высоких значениях общностей и факторных нагрузок переменных, определяющих каждый фактор. При этом же­лательно проверять устойчивость факторной структуры на параллельных вы­борках.

Как и в других многомерных методах, недопустимы функциональные за­висимости между переменными и корреляции, близкие к единице.

Количественное соотношение признаков и объектов зависит от целей исследования. Если цель анализа — изучение структуры взаимосвязей при­знаков, уменьшение их исходного количества путем перехода к новым пере менным — факторам, то строгих ограничений нет. Желательно лишь, чтобы количество признаков было не меньше количества объектов. Если исследо­ватель хочет обнаружить и обосновать наличие факторов за взаимосвязями переменных, то желательно иметь в три раза больше объектов, чем призна­ков. Данное соотношение может сложиться и в процессе анализа — при отсе­ивании мало информативных переменных. Если же стоит задача обоснова­ния выявленной факторной структуры для генеральной совокупности, то объектов должно быть еще больше, для проверки устойчивости этой структу­ры на параллельных выборках.
Этап 2. Решение проблемы числа факторов

На этом этапе матрица интеркорреляций исходных признаков обрабаты­вается с использованием анализа главных компонент. Применяется крите­рий отсеивания Р. Кеттелла и критерий Кайзера — величины собственного значения фактора, большего 1, по точечной диаграмме см. рис. 1 п. 9.7.

Этап 3. Факторизация матрицы интеркорреляций

Выбирается метод факторизации, желательно — главных осей, наимень­ших квадратов или максимального правдоподобия. Задается число факторов, в соответствии с проверяемой гипотезой. Результатом данного этапа являет­ся матрица факторных нагрузок (факторная структура) до вращения, которая не подлежит интерпретации.

Полезной информацией на этом этапе могут являться суммарная доля дис­персии (информативность) факторов и значения общностей переменных. Суммарная доля дисперсии — показатель того, насколько полно выделяемые факторы могут представить данный набор признаков, а этот набор — выделя­емые факторы. Общность переменной — показатель ее «участия» в фактор­ном анализе, насколько она влияет на факторную структуру. Переменные с наименьшими общностями — ближайшие кандидаты на исключение из ана­лиза в дальнейшем.

Этап 4. Вращение факторов и их предварительная интерпретация

На этом этапе выбирается один из аналитических методов вращения фак­торов, обычно — варимакс-вращение (Varimax normalized). Существуют и дру­гие методы вращения, в том числе косоугольного, но они выходят за рамки нашего рассмотрения. В результате вращения достигается факторная струк­тура, наиболее доступная для интерпретации при данном соотношении пе­ременных и факторов.

Интерпретация факторов производится по таблице факторных нагрузок после вращения в следующем порядке. По каждой переменной (строке) выде­ляется наибольшая по абсолютной величине нагрузка — как доминирующая. Если вторая по величине нагрузка в строке отличается от уже выделенной менее чем на 0,2, то и она выделяется, но как второстепенная. После про­смотра всех строк — переменных, начинают просмотр столбцов — факторов. По каждому фактору выписывают наименования (обозначения) переменных, имеющих наибольшие нагрузки по этому фактору — выделенных на преды­дущем шаге. При этом обязательно учитывается знак факторной нагрузки переменной. Если знак отрицательный, это отмечается как противополож­ный полюс переменной. После такого просмотра всех факторов каждому из них присваивается наименование, обобщающее по смыслу включенные в него переменные. Если трудно подобрать термин из соответствующей теории, до­пускается наименование фактора по имени переменной, имеющей по срав­нению с другими наибольшую нагрузку по этому фактору.
Этап 5. Принятие решения о качестве факторной структуры

Формальное требование к факторной структуре сформулировал Л. Терстоун еще в 1930-х годах, назвав его принципом простой структуры. Геометрически принцип простой структуры означает, что все переменные располагаются на осях факторов, то есть каждая переменная имеет близкие к нулю нагрузки по всем факторам, кроме одного. На практике достижение такого результата с первого раза маловероятно, но качество факторной структуры определяется степенью приближения к простой структуре.

Следует отметить общий принцип соотношения качества факторной струк­туры и качества исходных данных: чем ниже качество исходных данных в смысле требований, предъявляемых к метрическим переменным, тем выше требования к простоте факторной структуры, величине общностей и фактор­ных нагрузок.

В настоящее время не существует формальных критериев соответствия факторной структуры простой. Поэтому основным критерием остается воз­можность хорошей содержательной интерпретации каждого фактора по двум и более исходным переменным. Если перед исследователем стоит дополни­тельно проблема обоснования устойчивости (воспроизводимости) факторной структуры в генеральной совокупности, то добавляется требование однознач­ного соотнесения каждой переменной с одним из факторов. Это требование означает, что каждая переменная имеет большую по абсолютной величине нагрузку (0,7 и выше) только по одному фактору и малые (0,2 и менее) — по всем остальным.

Можно предложить способы максимального приближения к простой структуре путем пошагового сокращения числа факторов и переменных.

  1. Если по результатам интерпретации выявлен фактор, по которому ни одна из переменных не получила максимальной нагрузки (по строке), то это свидетельствует о необходимости сокращения количества факторов на один и повторения этапов 3 и 4 с новым числом факторов. То же касается фактора, идентифицируемого лишь по одной переменной, когда остальные в него не попадают даже с второстепенными нагрузками.

  2. Определяются неоднозначные переменные. Каждая такая переменная имеет примерно одинаковые по абсолютной величине максимальные нагрузки по двум и более факторам. Если обосновывается устойчивость факторной структуры, то неоднозначной является переменная, у которой между макси­мальной и следующей за ней по величине нагрузкой разность менее 0,5. Нео­днозначные переменные поочередно удаляются из числа исходных перемен­ных, и каждый раз повторяются этапы 3 и 4.

Очевидно, что приближение к простой структуре связано с невосполни­мой потерей исходной эмпирической информации. И каждый раз исследо­ватель должен решать, насколько целесообразна эта потеря. Наиболее жестки требования к простой структуре в случае обоснования устойчивости и воспроизводимости факторов, например, при разработке теста или факторной теоретической модели. Гораздо мягче тре­бования при решении наиболее часто встречающихся задач — при изуче­нии структуры взаимосвязей или при сокращении исходного набора при­знаков для дальнейшего исследования, например, различий между группами объектов.

Этап 6. Вычисление факторных коэффициентов и оценок

Это заключительный, наиболее однозначный и простой этап факторного анализа.

Оценки факторных коэффициентов являются коэффициентами линейного уравнения, связывающего значение фактора и значения исходных перемен­ных. Они показывают, с каким весом входят исходные значения каждой пе­ременной в оценку фактора. Факторные коэффициенты можно использовать для вычисления факторных оценок для новых объектов, не включенных ра­нее в факторный анализ.

Факторные оценки — значения факторов для каждого объекта (испытуе­мого). Их получение чаще всего и является конечным результатом факторно­го анализа. Вычисленные оценки факторов, как новые переменные, являют­ся независимыми, отражающими реальную структуру взаимосвязей исходных признаков и наиболее полно передающими исходную эмпирическую инфор­мацию. В этом факторные оценки выгодно отличаются от других способов интегрирования исходных данных, например от простого суммирования пун­ктов теста или анкеты в шкалы.

7. Пример из области психологии
В анкете изучения вариантов поведения человека, имеющего инвалидность, по пунктам приведены возможные варианты отношения инвалидов к работе.

Исходя из того, насколько сильно описанная в пункте анкеты ситуация подходит испытуемому, он давал ответы на основании пятибалльной шкалы, баллы которой соответствуют выражениям:

1– абсолютно не подходит;

2– незначительно подходит;

3– умеренно подходит;

4– значительно подходит;

5– очень сильно подходит.
Рассмотрим пункты стандартной анкеты.
Анкета


  1. Прежде чем начать работу я узнаю, не вредна ли она для меня

  2. Я работаю так же как и прежде

  3. Мое заболевание не серьезно и никак не может влиять на работу

  4. Я мечтаю о том, чтобы для инвалидов были созданы соответствующие условия труда, при которых работать стало бы возможно

  5. Я сам виноват, что остался без работы

  6. По вине врачей я не способен больше работать

  7. Я осваиваю новую профессию (специализацию) для того чтобы вскоре продолжить свою трудовую деятельность

  8. У меня есть план действий, который позволит мне продолжить работу в дальнейшем

  9. Меня раздражают постоянные напоминания о работе

  10. На работе я часто срываюсь

  11. Я забочусь о том, чтобы на работе никто не знал о моих проблемах и переживаниях

  12. Проблемы с работой привели меня к необходимости употребления алкоголя/ успокаивающих средств

  13. Инвалиду на работе можно больше простить

  14. Моя болезнь заставила меня активнее реализовывать себя на работе

  15. Работа помогает мне бороться с болезнью

  16. Я часто переживаю о случившемся со мной, что отвлекает меня от работы

  17. Я стараюсь бодриться, не впадать в отчаяние хотя бы на работе

  18. Сейчас я еще больше стремлюсь достичь успехов в работе, радуюсь, когда мои старания не остаются не замеченными

  19. Хожу на работу, чтобы отвлечься

  20. Мне трудно работать в коллективе, я ищу уединения

  21. Раз уж такова моя судьба, я решил «плыть по течению» и не предпринимать попыток что-либо менять в работе и в жизни

  22. Я часто размышляю о том, как бы могла сложиться моя карьера

  23. Я считаю, что на все есть воля божья и работа не является исключением

  24. Болезнь помогла мне понять, что я не правильно относился к жизни и работе

  25. Когда на работе бывает тяжело, я думаю о том, что есть много людей, которым еще хуже

  26. Обо всем, что случается со мной на работе я обычно думаю «ну знать судьба такая»

  27. Нам работе я всегда точно следую указаниям врача

  28. Надеюсь, усилия врачей не проходят даром и в дальнейшем я смогу работать

  29. Мне очень трудно работать, поскольку некомпетентность врачей требуют постоянно самому следить за своим состоянием, консультироваться со множеством специалистов

  30. Теперь я работаю для других

  31. На работе я всегда изображаю веселье

  32. Я стал больше ценить помощь своих коллег в работе

  33. Приятно, когда коллеги и близкие заботятся обо мне, интересуются, помогают в работе

  34. Я чувствую, что начинаю отдаляться от коллег

  35. Я стараюсь привлечь весь свой опыт, чтобы справляться с возникшими трудностями, как в жизни, так и в работе.

Результаты анкетирования помещены в файл, содержащий 35 переменных. Перед применением факторного анализа были заданы следующие параметры:

    1. Количество факторов –5 оценка Namber of factor.

    2. Не выводить неповернутые значения факторов.

    3. Точечная диаграмма, опция Scree plot.

В этом примере мы сознательно ограничили число факторов пятью. Если бы мы не сделали такого ограничения, то было бы создано11 факторов в соответствии с начальными установками. Это количество трудно поддается обзору и интерпретации.

Далее мы запретили вывод малых факторных нагрузок, установив численную границу равной 0,4.

Рассмотрим результаты расчета. Сначала выводится матрица первичных статистик:

Таблица 3

Объясненная совокупная дисперсия

Component

(компонент)

Initialeigenlalues

(первичные собственные значения)

Rotation Sums…

(Повернутые суммы квадратов нагрузок)




Total

٪ of Variance

(٪ дисперсии)

Cumulative ٪(совокупный комплект)

Total(сумма)

٪ of Variance

(٪ дисперсии)

1

5,0226

14,359

14,359

4,388

12,538

2

3,937

11,250

25,609

3,972

11,349

3

2,356

6,731

32,340

2,396

6,845

4

2,073

5,924

38,264

2,257

6,447

5

1,703

4,873

43,138

2,085

5,958

6

1,478

4,222

47,359







7

1,319

3,768

51,127







8

1,258

3,595

54,722







9

1,228

3,508

58,230







10

1,082

3,092

61,322







11

1,029

2,941

64,263







12

0,942

2,692

66,955







13

0,890

2,542

69,497







14

0,878

2,508

72,005







15

0,823

2,353

74,358







16

0,737

2,104

76,462







17

0,704

2,011

78,473







18

0,664

1,898

80,371







19

0,652

1,862

82,232







20

0,618

1,766

83,998







21

0,572

1,634

85,632







22

0,516

1,474

87,106







23

0,473

1,352

88,458







24

0,466

1,331

89,788







25

0,459

1,310

91,099







26

0,432

1,234

92,332







27

0,417

1,192

93,524







28

0,388

1,108

94,632







29

0,345

0,985

95,617







30

0,324

0,927

96,544







31

0,287

0,821

97,365







32

0,259

0,740

98,105







33

0,240

0,684

98,789







34

0,223

0,638

99,427







35

0,201

0,573

100,00








Насчитывается одиннадцать собственных значений, превосходящих единицу, что означало бы отбор одиннадцати факторов, если бы Вы не изменили установку по умолчанию Eigenvalues over: 1 (Собственные значения, превосходящие единицу) и не ограничили бы количество рассматриваемых факторов пятью. После точечной диаграммы, которую мы объясним позже, следует вывод повёрнутой факторной матрицы:

Таблица 4

Rotated Component Matrix a 

(Повернутая матрица компонентов)




Компоненты

1

2

3

4

5

F5

0.683













F16

0.683













F22

0.620













F9

0.581













F26

0.580













F6

0.544













F35

0.515













F33

0.491













F12

0.488













F34

0.458













F4

0.447













F7




0.710










F8




0.690










F17




0.654










F14




0.621










F15




0.597










F18




0.589










F19




0.572










F1




0.563










F13




0.510










F20
















F28







0.816







F27







0.765







F31







-0.493







F29
















F21










0.683




F25










0.592




F30










0.522




F23










0.469




F24










0.401




F3













0.677

F2













0.567

F10













-0.564

F11













0.403

F32
















Extraction Method: Principal Component Analysis (Метод отбора: Анализ главных компонентов).

Rotation Method: Varimax with Kaiser Normalization (Метод вращения: варимакс с нормализацией Кайзера). Вращение получено за 6 итераций.

Далее следует самая интересная и трудная часть факторного анализа–интерпретация и идентификация факторов. Факторные нагрузки пяти факторов расположены по диагонали матрицы. Переменные, находящиеся внутри одного блока, отсортированы в порядке убывания факторных нагрузок, причём был запрещен вывод факторных нагрузок, меньших 0,4.

Пункты анкеты 5,16,22,9,26,6,35,33,12,34,4 принадлежат первому фактору. Пункты 7,8,17,14,15,18,19,1,13 второму и т.д.

Вывод отсортированных значений в матрице очень удобен –сопоставление переменных и факторов произведено автоматически. Однако, не все пункты имеют однозначную принадлежность к фактору. Рассмотрим, например, пункт 23. Пункт 23 нагружает фактор 1 значением 0,426, а фактор 4 значением 0,469. по смысловому значению вернее отнести пункт 23 к фактору 4, а с точки зрения корректности следует иметь дело с обоими факторами. Такие пункты, как 23 являются серьезным недостатком, особенно если таких пунктов много. Если нельзя чётко объяснить принадлежность многих пунктов одному–единственному фактору, то факторный анализ нужно считать неудавшимся. Кроме того, факторный анализ считается неудавшимся и тогда, когда нельзя однозначно интерпретировать факторы. Поэтому далее мы попытаемся интерпретировать факторы из рассматриваемого примера и дать им соответствующие названия (идентифицировать).

Фактор 1:
Винить самого себя.

Жалеть себя .

Впасть в бесконечные размышления.

Раздражённо на всё реагировать.

Жаловаться на судьбу.

Считать виноватыми врачей.

Искать улучшение настроения в употреблении алкоголя или успокаивающих средств.

Мечтать о невозможном.

Чувствовать изоляцию от других.
Фактор 2:
Предпринимать активные действия для решения проблемы.

Составить план действий.

Подбадривать себя.

Пытаться интенсивней жить.

Пытаться отвлечься в работе.

Стараться достичь успеха и самоутвердиться.

Освоить новую профессию или получить новые навыки для продолжения трудовой деятельности.
Фактор 3:

Надеяться на врачей.

Точно следовать указаниям врача.

Изображать наигранное веселье.

Фактор 4:

Принимать болезнь как судьбу.

Плыть по течению, ничего не меняя.

Утешать себя тем, что другим ещё хуже.

Желать делать добро с другим.

Искать утешения в религии.
Фактор 5:
Занижать значение своего заболевания.

Не желать признать случившееся.

Скрывать свои проблемы.

Не контролировать свои эмоции на работе.
Теперь попытаемся интерпретировать содержание 5 факторов и дать каждому из них обобщающее название.
Фактор 1 Депрессивный подход

Все его пункты описывают состояние подавленности, удручённости, сомнений, попытке спрятаться за алкоголем и психотропными средствами.

Фактор 2 Активная борьба, направленная на решение проблемы

Этот фактор собрал все пункты, содержащие рациональный подход к борьбе с болезнью.

Фактор 3 Надежда на врачей

Все пункты этого фактора основываются на отношении между врачом и пациентом. Пункт 31 отрицательно нагружает этот фактор, то есть о наигранном веселье скорее всего говорить нельзя.

Фактор 4 Фактическая позиция. Поиск смысла в религиозности

Фактор 4 собрал все пункты, говорящие о фаталистическом или религиозно-направленном поиск смысла происходящего.

Фактор 5 Эмоциональное отвержение

В факторе 5 собрались все пункты, в которых испытуемый не хочет признавать свою инвалидность, не желает осознавать реальность, пытается скрыть свои проблемы.

Точечная диаграмма

Эта диаграмма поможет нам определить количество учитываемых факторов. По умолчанию, SPSS учитывает в результирующей модели все те факторы, собственное значение которых превосходит единицу. В нашем примере таких факторов было 11.

Слово Scree plot состоит из двух английских слов: scree– щебень и plot– график. Эта диаграмма позволяет отделить значимые факторы модели от маловажных— щебень. Значимые факторы образовывают в своего рода склон, то есть крутой подъём. На нашей диаграмме такой склон наблюдается

в области первых пяти факторов, а ниже пятого фактора (шестой, седьмой, восьмой ...) расположился щебень, область незначимых факторов.

Пять факторов мы и положены в основу модели в самом начале факторного анализа.



Рис.1.

Библиографический список


1. Кендалл М., Стюарт А. Многомерный статистический анализ и временные ряды. М.: Наука, 1976.

2. Замков О. О., Толстопятенко А. В., Черемных Ю. Н. Математические методы в экономике. М.: Изд-во МГУ им. Ломоносова, ДИС, 1998.

3. Наследов А.Д. Математические методы психологического исследования. ПСБ. 2007.




Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации