Панина Н.В. Технология социологического исследования - файл n1.doc

приобрести
Панина Н.В. Технология социологического исследования
скачать (1369.5 kb.)
Доступные файлы (1):
n1.doc1370kb.26.08.2012 15:04скачать

n1.doc

1   2   3   4   5   6   7   8   9   10   11
основная задача — профессионально про­вести опрос и компетентно проанализировать собранный материал. В таком случае, если он начинает «объяснять» по­лученные факты без осуществления соответствующего ста­тистического анализа, то его объяснения, в лучшем случае, основываются на общей осведомленности, логике и здравом смысле; но, обычно, наряду с этим, основой объяснения полученных фактов становятся также житейские предрас­судки и стереотипы, а иной раз и просто вольная фантазия. Такой «анализ» представляет собой личную точку зрения исследователя как человека и гражданина, с привлечением некоторых данных, полученных в результате опроса. При этом потребитель информации вводится в заблуждение, по­скольку считает, что все приводимые объяснения действи­тельно вытекают из результатов исследования.

Первым условием корректности анализа результатов массового опроса является даже не столько квалификация исследователя, сколько адекватное его представление об уровне своей квалификации и применении методов анали­за и интерпретации, адекватных уровню своей подготов­ленности. Если социолог освоит все необходимые правила описания и представления полученных фактов, то грамот­но оформленный материал практически всегда несет ин­формацию, находящую своего заинтересованного потреби­теля. Сказанное вовсе не означает, что автор не может да­вать объяснение описанным фактам. Но он должен прежде всего осознавать сам и обязательно довести до сведения читателя, что это объяснение проистекает не из по­лученного материала, а из обшей позиции автора.

В социологии следует различать первичный и вто­ричный анализ результатов массовых опросов. Первичный анализ предполагает статистическую обработку данных оп­роса и требует определенной подготовленности в области математической статистики. Под вторичным анализом под­разумевается общий логический анализ проблемы; и в дан­ном случае результаты опросов привлекаются лишь как ус­тановленные факты для иллюстрации (подтверждения или опровержения) определенных высказываний автора вто-

ричного анализа. При этом практически не имеет значения, привлекает ли автор данные собственного исследования или данные других источников (публикаций, документов и т.п.), поскольку свои выводы он обосновывает логически.

Чем должен определяться выбор уровня анализа? Во-первых, как отмечалось выше, квалификацией исполните­ля, и прежде всего его подготовленностью в области мате­матической статистики. Во-вторых, задачами исследова­ния; так, например, для опросов общественного мнения в подавляющем большинстве случаев вполне достаточно описательного уровня.

Если выбор уровня анализа определяется квалификацией исполнителя и задачами исследования, то выбор конкретных процедур и статистических методов зависит от типа шкал.

Какие статистические процедуры могут быть исполь­зованы при анализе характера ответов на данный вопрос анкеты, а какие нет, в первую очередь определяется видом и типом построенной шкалы.

Все шкалы в практике социологического анализа можно свести к трем основным видам: номинальная, по­рядковая и метрическая.

Тип шкалы определяется особенностями такой ее ха­рактеристики, как «дискретность-непрерывность».

Шкала характеризуется как «дискретная» в том случае, когда варианты ответов в общем веере не связаны друг с другом (между двумя «соседними» вариантами не предполага­ется возможность промежуточно-переходного варианта). На­пример, ответы на вопрос о национальности (1 — украинец, 2 — русский, 3 -другая национальность) представляют собой типичный образец дискретной шкалы. Даже если респондент имеет родителей разной национальности (например, мать — украинка, отец — русский), все равно данная шкала не по­зволяет этого установить (при необходимости измерений этих различий следует применять другой инструментарий). Сама шкала не предполагает «промежуточных» ответов.

Непрерывные шкалы предполагают, что между двумя «соседними» ответами могут быть расположены промежу­точные ответы. Например, ответы на вопросы о возрасте предполагают, что между возрастом 20 лет и возрастом 21 год могут быть люди с возрастом 20,1 года, 20,2 года и т.д.

Даже если шкала не предусматривает такие градации, по­тенциально она их включает.

Именно степень «непрерывности» шкалы определяет возможности применения различных статистических процедур.

Именно под этим утлом зрения шкалы разделяют на номинальные, порядковые и метрические. Все номиналь­ные шкалы являются по своему типу дискретными; все мет­рические — непрерывными; порядковые же шкалы зани­мают промежуточное положение. Одной из аналитических задач исследователя является определение степени дискрет­ности-непрерывности порядковой шкалы. Ниже мы уточ­ним особенности этой процедуры.

Напомним, что обозначение шкал проводится до нача­ла обработки данных, и результаты заносятся в «ключевую» анкету (напротив каждого пункта-вопроса анкеты отмечен вид шкалы: номинальная, порядковая, метрическая).

Таким образом, прежде, чем приступать к стати­стическому анализу, необходимо научиться достаточно свободно определять вид и тип шкалы.

2. Обозначение шкал

Номинальная шкала

Номинальными называются шкалы, в которых код ответа является не более чем наименованием категории. Что это означает? Большинство компьютерных программ по обработке данных оперируют не словами и буквами, а цифрами, поэтому информация для обработки вводится в большинстве случаев не словами, а числами (соответст­вующим кодом). Например, вопрос анкеты «Ваш пол?» сопровождается двумя вариантами ответов:

  1. — мужчины;

  2. — женщины.

Респондент, ориентируясь на содержание слов («мужчины», «женщины»), обводит соответствующий код («1» или «2»). Во всех дальнейших операциях в файле дан­ных под кодом «1» подразумеваются мужчины, под кодом «2» — женщины. В тех случаях, когда шкала номинальная,

при всех проводимых операциях эти цифры будут означать лишь наименование соответствующей категории и не будут означать число, которым обозначен код: введенная цифра не имеет своего числового значения. Мы вполне могли бы использовать любые другие цифры или даже числа (нап­ример, «7» и «2» или «10» и «20»). Это не имеет никакого значения для дальнейших операций, если шкала обозначена номинальной. Но для удобства обработки используют обычный порядок чисел. При этом не предполагается, что мужчины в каком-то отношении первичны, а женщины вторичны. Автор без всякого ущерба для анализа мог бы поменять их местами.

Почему это важно понимать в процессе анализа дан­ных? Обозначая эту шкалу как «номинальную», автор от­казывается от числовых манипуляций с ней. Обычно при числовых манипуляциях, когда цифры обозначают числа, подразумевается, что «1» меньше «2» в два раза; или, если от «2» отнять «1», то получится «1»; если к «1» прибавить «2», то получится «3» и т.п., В случае же обозначения шка­лы как номинальной, цифры «1» и «2» обозначают только наименование соответствующих категорий.

При работе с номинальными шкалами следует учиты­вать два правила. Во-первых, надо точно знать, какая кате­гория каким числовым кодом обозначена. Во-вторых, при анализе данных с числовыми знаками кодов нельзя осуще­ствлять никаких арифметических действий — сложения, вычитания, умножения, деления; в частности, нельзя под­считывать среднее арифметическое. Это вполне понятно исследователю, когда он анализирует демографические дан­ные; но достаточно часто допускаются ошибки, когда дан­ные касаются отношений. Примером такой ошибки часто является анализ ответов на вопрос: «В какой степени Вы доверяете N?». Допустим, что веер ответов сформирован следующим образом:

  1. — совершенно не доверяю;

  2. — в определенной степени доверяю;

  3. — полностью доверяю;

  4. — трудно сказать, доверяю или нет;

  5. — я его не знаю.

Эта шкала может быть обозначена только как номи­нальная, так как код «4» по своему значению не соответствует 4 баллам доверия, а код «5» не означает высшего балла дове­рия. Неопытные авторы, анализируя данные, заказывают подсчет индекса (рейтинга доверия), и тогда соответствующая кодовая позиция в последующих математических процедурах используется как число с соответствующим значением. В этом случае наибольшие баллы получают те лица, которых респон­денты не знают, и те, к которым у них не сформировалось определенное отношение. Чтобы избежать подобных казусов, исследователь должен хорошо разобраться в характере шкал и точно их определить до начала анализа. Лучше, конечно, ко­гда это делается при подготовке анкеты. Но если на этом эта­пе исследователь упустил возможность сознательно сформи­ровать шкалы, или после начала анализа ему захотелось при­менить не предусмотренные исследовательской программой статистические приемы анализа, он должен определить тип шкалы и, при необходимости, перекодировать информацию.

Примерами номинальных шкал в анкетах являются ответы на вопрос о национальности, профессии, отрасли, в которой работает респондент, населенном пункте или ре­гионе, в котором он проживает, мотивах того или иного поступка и т.д.

Номинальная шкала может быть подготовлена исследо­вателем как при составлении анкеты, так и в процессе ручной обработки анкет (до ввода информации в компью­тер). Например, на вопрос «Ваша национальность?» автор закладывает веер ответов: 1 — украинец, 2 — русский, 3 — еврей, 4 — белорус, 5 — поляк, 6 — другая; или 1 — украи­нец, 2 — русский, 3 — другая (конкретное содержание веера ответов определяется задачами исследователя, особенностями выборки или представлением автора инструментария о том, какие национальности могут попасть в выборку). В ситуации, когда исследователь точно не знает, представители каких на­циональностей могут попасть в число респондентов, и не хочет терять эту информацию, он может поставить вопрос о национальности в открытой форме. Так часто поступают при определении профессии респондентов, мотивов поведения и т.п. информации, когда исследователь не уверен, что он осве­домлен о всех возможных вариантах ответа.

Но в любом случае, закрытый «веер» ответов необхо­димо подготовить, по крайней мере, в виде кодировочного листа до перекодировки и редактирования массива анкет. Если исследователь не был уверен в полноте своей осве­домленности в период конструирования анкеты и данный вопрос поставил в открытой форме, он может после по­лучения заполненных анкет поручить одному из помощ­ников выписать ответы на этот вопрос (это может быть список по всем анкетам или по части анкет) и на основа­нии выписанных данных подготовить кодировочный лист — список национальностей, в котором напротив каж­дой национальности будет указан ее кодировочный номер. Как видим, для ввода в компьютер в любом случае каждый вариант ответа должен иметь соответствующий числовой код, который, напомним, в случае номинальной шкалы является лишь аналогом соответствующего наименования.

Номинальные шкалы бывают альтернативные и ва­риантные (многовариантные). Альтернативные шкалы до­пускают возможность лишь одного ответа на поставлен­ный вопрос (пол, национальность и т.п.). Вариантные шкалы допускают возможность нескольких ответов на по­ставленный вопрос. Например, в вопросе о причинах, по которым респондент хочет поменять место работы или ме­сто жительства, могут допускаться несколько вариантов ответов на поставленный вопрос.

Определение разновидности номинальной шкалы имеет принципиальное значение для дальнейшей обработ­ки и анализа данных. Поэтому до начала обработки иссле­дователь должен определить не только вид, но и разновид­ность шкалы.

Обычно со шкалами, касающимися демографических характеристик, исследователь не испытывает затруднений — казалось бы, в этом случае все шкалы должны быть альтер­нативными. Но и здесь есть определенные «подводные кам­ни». Например, формулируя ответы на вопрос о том, какое учебное заведение окончил респондент, исследователь под­разумевает альтернативную шкалу. Но он часто не учитывает, что респондент мог окончить не одно учебное заведение. Или, например, вопрос о том, какая профессия у респондента, также может упускать из вида, что респондент

не знает, идет ли речь о профессии по базовому образова­нию, или о той, по которой он проработал большую часть жизни, или о той, по которой он работает в настоящее вре­мя. Поэтому в формулировку вопроса автор анкеты должен либо внести соответствующие (уточняющие) характеристи­ки (если он хочет добиться альтернативной номинальной шкапы), либо обозначить шкалу как вариантную.

Несколько сложнее обстоят дела с вопросами, касаю­щимися мнений и, особенно, отношений людей к различным социальным процессам и явлениям. Чаше Есего определение разновидности номинальной шкалы осуществляется исследо­вателем волюнтарно (в форме дополнительной инструкции к вопросу). Например, к вопросу (с соответствующим перечнем ответов) «Что, по Вашему мнению, препятствует эффектив­ному проведению экономических реформ?» можно дать раз­ные инструкции: I) «Отметьте только один самый важный вариант ответа»; 2) «Отметьте не больше 2-х (3-х, 5-ти и т.д.) вариантов ответа»; 3) «Отметьте все, подходящие, с Вашей точки зрения, варианты ответа».

Конкретный вариант инструкции определяет исследо­ватель, в зависимости от той информации, которую он на­мерен получить, интерпретируя результаты. Важно только помнить, чтобы такая инструкция обязательно присутство­вала в формулировке вопроса, если сама постановка вопро­са подразумевает возможность многовариантного ответа.

При определении вида шкачы необходимо учитывать, что если такой вариант ответа, как «затрудняюсь ответить», стоит в конце перечня вариантов ответов (и соответственно имеет самый большой по числовому значению код), то такую шкалу всегда следует принимать за номинальную.

Порядковая шкала

Порядковой шкалой является такая последователь­ность ответов на вопрос, при которой каждый очередной вариант ответа характеризует последующее ранговое место в континууме значений. При использовании порядковой шкалы всегда можно сказать, что каждый последующий вариант ответа наделяется значением «выше» или «ниже»,

«больше» или «меньше» и т.п. Примером порядковой шка­лы могут быть ответы на вопрос об уровне образования:

  1. — начальное;

  2. — среднее;

  3. — высшее,

Другим примером порядковой шкалы является опре­деленный веер ответов на вопрос: «В какой степени Вы удовлетворены ...?»:

  1. — совершенно не удовлетворен;

  2. — скорее не удовлетворен;

  3. — трудно сказать, удовлетворен или нет;

  4. — скорее удовлетворен;

  5. — полностью удовлетворен.

В этих случаях кодовый номер варианта ответа ука­зывает на его место в определенно заданном порядке. В таких случаях обязательно есть критерий континуума (своеобразная линейка), вдоль которой расположены вари­анты ответов: в первом примере — это уровень образова­ния; во втором — степень удовлетворенности. Мы всегда можем сказать, что высшее образование по своему уровню выше среднего, а среднее выше начального.

Когда используются порядковые шкалы, кодовое зна­чение варианта ответа может более продуктивно (по срав­нению с номинальными) использоваться при статистичес­ком анализе данных, так как в этом случае цифровое зна­чение кода наполняется определенным числовым смыслом.

В зависимости от степени непрерывности одни поряд­ковые шкалы могут рассматриваться как ранговые, другие — как интервальные. Такое разделение осуществляется на ос­нове определения «дистанции» между вариантами ответов.

Если исследователь считает, что «дистанцию» между ва­риантами ответов определить невозможно, или — между раз­ными вариантами она различна, то порядковую шкалу следует оценивать как ранговую. Например, в приведенном выше из­мерении уровня образования нельзя сказать, что среднее обра­зование настолько же «больше» начального, насколько высшее — «больше» среднего. В качестве другого примера мо­жет быть приведена шкала ответов на вопрос о том, каким по счету в семье ребенком является респондент: два человека мо-

гут указать вторую позицию, но при этом у одного респондента между ним и первым ребенком в семье может быть разница в один год, а у другого — 10 лет. Можно видеть, что при исполь­зовании ранговой шкалы теряется информация о ко­личественных различиях в рамках отдельных градаций.

При использовании такого типа шкал кодовое значение ответа принимается за определенный балл, характеризующий порядковый ранг исследуемого качества. В силу того, что ранговые шкалы, определяя порядок (последовательность) ответов, не учитывают дистанцию (интервал) между обоз­наченными категориями, они имеют существенную огра­ниченность, с точки зрения применения к ним различных математических процедур. В частности, по отношению к ранговым шкалам неприменим расчет среднего ариф­метического, а также все коэффициенты, включающие в свои расчетные формулы значение среднего арифметического.

Если исследователь предполагает и обосновывает, что интервал между вариантами ответов приближается к равному значению, он принимает порядковую шкалу за условно интервальную*.

Истинно интервальную шкалу исследователь может получить в результате кропотливой предварительной работы (так строятся шкалы Терстоуна, многие тестовые процедуры и т.д.). При подготовке оперативного эмпирического иссле­дования отработка интервальности не всегда целесообразна, так как это достаточно долговременная процедура (обычно этот процесс длится 1-2 года). Но, работая над формулиров­ками вариантов ответов, даже в оперативном исследовании автор старается так сформулировать ответы, чтобы «дистан­ции» между вариантами воспринимались респондентом как равные интервалы. К такому типу шкал обычно относятся варианты ответов на вопросы, касающиеся удовлетворенно­сти, уровня доверия и т.п. При изучении подобных призна­ков исследователь нередко прибегает к тому, чтобы уйти от вербальных формулировок, и сразу предлагает респонденту оценить свое отношение в баллах. Например, после вопроса

* В социологии и психологии существуют методы взвешивания, по­зволяющие не условно, а достаточно корректно преобразовывать порядковые шкалы в интервальные. С методами корректного преобразования порядко­вых шкал в интервальные можно ознакомиться в специальной литературе.

«В какой степени вы доверяете ...?» предлагается инструк­ция: «Отметьте свой вариант ответа на шкале, где 1 балл означает полное недоверие, а 5 баллов — полное доверие». Такая форма предъявления веера ответов подразумевает ус­ловное обозначение интервальности — расстояния между интервалами ответов определяются в один балл.

Конечно, следует отдавать отчетность в условности та­ких «интервалов», их значительной субъективности. Но в той мере, в какой такое шкалирование имплицитно обосновано, шкала может быть обозначена как интервальная. Это позво­ляет расширить арсенал статистических методов анализа дан­ного признака («уровня доверия», «степени удовлетвореннос­ти» и т.п.). Это относится, в первую очередь, к тем случаям, когда исследователь планирует при анализе использовать ин­дексы (рейтинги доверия, индексы удовлетворенности и т.п.).

Таким образом, определив первоначально шкалу как порядковую, исследователь, пользуясь критерием «дискрет­ности-непрерывности», устанавливает, будет он ее интер­претировать как ранговую, или как интервальную с той или иной мерой обоснованности. В зависимости от этого реше­ния строится план анализа — применение тех или иных статистических процедур. Правомерность их применения полностью обусловлена степенью обоснованности опреде­ления типа шкалы.

Метрическая (интервальная) гикала

Шкала с безусловно равными значениями интервалов между позициями ответов называется интервальной, или метрической. Метрическая шкала всегда имеет единицу из­мерения, которой меряется расстояние между позициями. Примерами метрической шкалы являются данные по воз­расту (единица измерения — год); по доходу (единица из­мерения — денежная единица) и т.д. Метрическая шкала практически не имеет ограничений в применении стати­стических процедур; в этом 'отношении метрические шкалы являются наиболее эффективными для аналитика. Стрем­ление добиваться интервальности порядковых шкал опреде­ляется потребностью исследователя приблизить порядковую шкалу к аналитическим возможностям метрической.

Но и метрические шкалы, с точки зрения определен­ных потребностей анализа и, особенно, представления дан­ных, имеют свои недостатки. Например, при описании и представлении результатов, данные, полученные с помощью метрической шкалы, выглядят довольно громоздко: напри­мер, шкала возраста обычно варьирует от 18 до 75 лет; еще большую протяженность имеет шкала дохода. Если автор хочет представить данные, касающиеся того, как люди раз­ного возраста относятся, например, к экономическим ре­формам, то таблица, в которой первую группу составят лица 18 лет, вторую — 19, третью — 20 и т.д., будет иметь очень много строк, и пользователю трудно будет проследить тен­денцию, фиксируемую в различиях ответов лиц разных воз­растных категорий. Поэтому в процессе анализа, переходя от одних статистических процедур к другим, исследователь может преобразовывать тип шкалы; так, например, группи­руя данные по возрасту, социолог фактически преобразовы­вает метрическую шкалу в порядковую. В ряде случаев это не только возможно, но и необходимо.

Но прежде чем перейти к проблеме преобразования шкал, следует лишний раз. напомнить, что самая главная проблема, о которой не должен забывать социолог — это своевременное и правильное определение типа шкалы. И прежде чем применять ту или иную статистическую про­цедуру анализа данных, полученных по конкретному вопросу анкеты, исследователь должен точно определить тип шкалы, которую образует совокупность ответов на данный вопрос. При определении типа шкалы, неопытного исследователя иногда может ввести в заблуждение форма ответов, особенно, если ответы представлены в цифровом оформлении.

Например, на одном из методических семинаров мы просили студентов-социологов определить тип шкалы, по­лученной из ответов на вопрос: «Отметьте, пожалуйста, время, в которое Вы обычно смотрите телепередачи». Веер ответов был представлен линейкой, размеченной на часы, составляющие в совокупности определенное время суток:

6 7 8__9 10 11_12_13_14._15._16_ 17 18 19__20_21_22_23_24

УТРО | . ДЕНЬ | ВЕЧЕР

Только одна студентка в группе смогла правильно оп­ределить тип данной шкалы — номинальная. Подавляющее большинство определили ее как метрическую. Это про­изошло потому, что варианты ответов были представлены, во-первых, числами, а во-вторых, имели равный интервал. В данном случае студенты {потенциальные исследователи) ориентировались на форму, а не на содержание шкалы. Метрические шкалы используются тогда, когда в центр ана­лиза ставятся средние значения анализируемых величин (средний возраст, средний душевой доход и т.п.), и эти средние величины несут определенную содержательную и смысловую нагрузку. К примеру, если бы вопрос стоял о том, сколько часов в день обычно респондент смотрит теле­визор, то из полученных данных о том, что половина рес­пондентов указала 2 часа, -а другая половина — 6 часов, можно было бы сделать вывод: в среднем, один человек смотрит телевизор 4 часа (разумеется, данные взяты услов­но). Но если шкала используется в таком вопросе, который был приведен выше, то при вычислении среднего арифме­тического можно получить даже не искаженную, а абсурд­ную информацию: например, если половина респондентов смотрит телевизор в час дня, а другая половина в шесть часов вечера, вовсе не следует, что в среднем они смотрят телевизор в четыре часа дня..

Оценивая тип шкалы, исследователь должен обра­щать внимание, не столько на форму, сколько на содержа­ние ответов.

Преобразование гиках

Поскольку каждая из шкал имеет свои преимущества и свои недостатки для использования различных процедур статистического анализа данных, то исследователь при подготовке программы обычно старается сконструировать тот тип шкалы, который в наибольшей степени соот­ветствует целям анализа. Но возможны ситуации, когда автор хочет применить методы статистического анализа, не соответствующие данной шкале, Такая ситуация может возникнуть вследствие разных причин, первое место среди которых обычно занимает отсутствие исследовательской

программы и плана анализа. Другой причиной необходи­мости преобразования шкалы является новая гипотеза, для проверки которой необходимы статистические процедуры, не предусмотренные первоначальным планом. В третьих, нередко исследователь попадает в ситуацию, когда ему приходится приступать к анализу данных, собранных по инструментарию, который разрабатывали другие авторы. В подобных случаях исследователь оказывается как бы в вы­нужденной ситуации необходимости преобразования шкал.

Есть и объективные причины, по которым социолог уже на этапе планирования анализа осознает, что в процес­се работы он должен будет преобразовывать определенные шкалы. Планирование преобразования шкал необходимо в ряде случаев.

Один из таких случаев — это рассогласование между возможностями сбора информации и потребностями анализа. Исследователь, составляя анкету, отдает себе отчет в том, что тип шкалы не соответствует потребностям анализа, но скон­струировать шкалу по-другому принципиально невозможно, так как он понимает, что есть значительное число респон­дентов, которые не смогут найти «свой» ответ на шкале, не­обходимой для анализа. Поэтому на этапе сбора данных будет утрачена принципиальная информация. Например, при из­мерении степени доверия к различным политическим фигу­рам оптимальной является интервальная шкала (допустим, респондента просят оценить степень своего доверия по пя­тибалльной шкале, где 1 балл означает крайнюю степень не­доверия, а 5 баллов — высшую степень доверия). Такая шка­ла позволяет подсчитывать количественный индекс доверия и сравнивать рейтинги доверия по отношению к различным политическим деятелям. Но исследователь понимает, что часть респондентов может просто не знать того или иного политического деятеля. Если такой вариант исключить из веера ответов на вопрос, касающийся доверия, то полученная информация будет искажена. Включая же этот вариант отве­та, исследователь получает номинальную шкалу. При этом он может заранее планировать ее преобразование в процессе анализа для получения расширенных возможностей приме­нения статистического аппарата.

Возможна и другая ситуация, порождающая необхо­димость планирования преобразования шкал. Исследователь на этапе планирования анализа предполагает использовать различные статистические процедуры, одни из которых аде­кватны номинальным шкалам, другие порядковым или мет­рическим. Например, задавая вопрос об отношении населе­ния к частной собственности на землю, социолог в одних случаях хочет оперировать индексом отношения к привати­зации земли (допустим, сравнивания между собой отноше­ние к приватизации различных социальных групп); а в других случаях анализа он хочет сформировать две основ­ные группы населения, различающиеся между собой по данному показателю («за приватизацию земли» и «против приватизации земли») и анализировать различие между этими двумя категориями по их ценностным ориентациям, социальному статусу, психологическому состоянию и т.д. В первом типе анализа исследователю необходимо пользо­ваться статистическими процедурами, применимыми к ин­тервальным шкалам, а во втором — к номинальным.

Во многих случаях существует принципиальная воз­можность преобразования шкал.

Любая метрическая шкала может быть преобразована как в номинальную, так и в порядковую. Простейший способ пре­образования метрической шкалы в номинальную — дихотомия (группировка на две группы по определенному критерию). На­пример, по возрастной характеристике всех респондентов можно разделить на две группы: до 30 лет («молодежь») и старше 30 лет. Здесь возможна группировка с любой степенью дробности. Какая группировка является оптимальной?

Во-первых, это зависит от гипотез. Если автор имеет достаточно обоснованную гипотезу о границах «социального возраста» (например, возраст окончания вуза или возрастной критерий выхода на пенсию и т.п.), которые могут влиять на изучаемые им установки, он формирует группы с опре­деленными «социально-возрастными» границами. Если нет достаточно обоснованных «возрастных» гипотез, можно ис­пользовать возрастную стратификацию, принятую в государ­ственной статистике. Но здесь неопытного социолога под­стерегают определенные «подводные камни»: чем более дроб­ная группировка, тем меньшей численности будут полу-

ченные им группы; а чем меньше численность анализируе­мых групп, тем труднее установить, являются ли значимыми зафиксированные при анализе данных различия в отношении этих групп к тем или иным социальным явлениям. Исследо­ватель не должен забывать, что если в анализируемой группе меньше 100 человек, то когда он говорит, сколько процентов из них относятся к чему-либо положительно или отрицатель­но, существует определенного рода натяжка".

В тех случаях, когда исследователь не имеет собст­венной гипотезы в отношении влияния возраста на тот или иной изучаемый показатель, а хочет лишь сориенти­роваться сам, влияет ли возрастной фактор на изучаемые явления, ему можно порекомендовать условную трехуров­невую возрастную стратификацию типичной региональной репрезентативной выборки взрослого населения (18-29, 30-55, 56-75 лет). Такой подход при рабочем анализе позволит в первом приближении увидеть тенденции влияния воз­растного фактора на изучаемые процессы и явления.

Что касается номинальных и порядковых шкал, то до­вольно часто их преобразование связано с потребностью определить место такого варианта ответа, как «трудно ска­зать» («затрудняюсь ответить» и т.п.). Как уже отмечалось, если этот вариант ответа стоит в конце общего веера отве­тов, то такая шкала всегда должна рассматриваться как но­минальная (сужающая возможности анализа: исследователь не должен считать индексы и ряд коэффициентов корреля­ций с другими переменными). В каких случаях она может быть преобразована в порядковую? В тех случаях, когда из­меряется эмоциональное отношение людей, вариант ответа «трудно сказать» может рассматриваться как «нулевая точка между положительной и отрицательной осями шкалы; по­этому при преобразовании шкалы его можно ставить посе­редине симметричной шкалы и присваивать среднее (медианное) значение. Варианты ответов типа «Не знаю» в этом случае интерпретируются как «неответ»; и анкеты с

* Подробнее этот момент будет рассмотрен при изложении анализа методом группировки. Здесь же хотелось бы лишний раз привлечь внима­ние исследователей и пользователей социологической ин. формации к осознанию условности различий в процентах, когда численность анализи­руемой группы меньше 100 человек.

этим вариантом исключаются из анализа по данному при­знаку. Примерами шкал, измеряющих эмоциональное от­ношение, могут служить как прямые ответы на вопрос: «Как Вы относитесь (положительно или отрицательно) к ...?», так и вопросы, касающиеся удовлетворенности, доверия и т.п.

Как преобразовать номинальную шкалу, допустим, удовлетворенности, в порядковую? Например, в анкете был поставлен вопрос с предложенным веером ответов: «В какой степени Вы удовлетворены...?»

  1. — полностью удовлетворен;

  2. — в определенной степени удовлетворен;

  3. — в определенной степени не удовлетворен;

  4. — совершенно не удовлетворен;

  5. — трудно сказать.

В таком виде веер ответов представляет собой номи­нальную шкалу, позволяющую строить распределение по от­дельным градациям процентов (или частот) респондентов, которые выражают ту или иную степень удовлетворенности или неудовлетворенности. Сравнительный анапиз таких дан­ных проводить достаточно неудобно (например, при еже­месячном мониторинге, если происходит изменение в по­казателе процентов каждой из пяти групп, трудно сказать, на­сколько же изменился индекс удовлетворенности в целом).

Но в данном случае вариант ответа «трудно сказать» можно рассматривать как нейтральную позицию на шкале удовлетворенности, так как не имеет значения, по каким именно причинам респондент затрудняется ответить; важно что он не высказывает ни удовлетворенности, ни неудовле­творенности (по этому критерию он занимает промежу­точную позицию). Поэтому при преобразовании шкалы он может быть переставлен в данном случае на третье место с присвоением соответствующего рангового значения. Преоб­разованная шкала выглядит следующим образом:

  1. — полностью удовлетворен;

  2. — в определенной степени удовлетворен;

  1. — трудно сказать (трудно сказать, удовлетворен или нет);

  1. — в определенной степени не удовлетворен;

  2. — совершенно не удовлетворен.

В таком виде шкалу можно считать порядковой, в которой кодовый номер отражает, по крайней мере, ран­говое место в континууме степени удовлетворенности. Ус­ловно считая интервалы равными (а эту условность социологи допускают настолько часто, что, по негласному конвенциальному согласию, в настоящее время ее можно признать легитимной), можно, определив шкалу интер­вальной, считать средний индекс*.

В данном случае самое высокое ранговое место — у ответа «совершенно не удовлетворен». Следовательно, по­лученный в баллах индекс должен быть назван «индексом неудовлетворенности». Если же исследователь хочет по­лученный количественный индикатор назвать «индексом удовлетворенности», он должен поменять порядок следо­вания вариантов ответов с соответствующими кодами:

  1. — совершенно не удовлетворен;

  2. — в определенной степени не удовлетворен;

  3. — трудно сказать, удовлетворен или нет;

  4. — в определенной степени удовлетворен;

  5. — полностью удовлетворен.

Если при планировании анализа исследователь пред­полагал использовать такую переменную, как удовлетво­ренность (например, удовлетворенность жизнью, работой и т.п.), в качестве критерия группировки населения на тех, кто удовлетворен, и на тех, кто не удовлетворен, он может преобразовать имеющуюся в анкете номинальную шкалу в номинальную же, но с меньшим перечнем ответов, укруп­няя группы:

  1. — удовлетворены;

  2. — не удовлетворены;

  3. — затрудняются определить свое отношение.

Данные, представленные в таком виде, более удобны для сравнительного анализа. И если автор не планирует расчет индексов и коэффициентов корреляций, то именно в таком виде (с укрупненной группировкой) лучше конструи­ровать вопрос в анкете. В таком случае и респондентам лег-

* При таком преобразовании социолог — должен обратить особое внимание на согласованность названия индекса и порядка следования вариантов ответов с соответствующим ранговым кодом.

че отвечать, и при обработке не надо будет проводить до­полнительного преобразования. Но если исследователь пла­нирует применять различные виды анализа, требующие преобразования шкал, то в анкете в таком случае лучше предусмотреть более дробную оценку измерения респонден­тов. Степень дробности измерения называется точностью шкалы. Чем выше точность шкалы, тем тоньше она реагиру­ет на изменение в динамике отношения и на различия в отношении к разным объектам. Следовательно, чем более ясное представление на этапе планирования у исследовате­ля — каким именно образом он будет анализировать мате­риал, тем более адекватный инструментарий он подготовит. Другими словами, если исследователь не планирует слож­ный анализ, нет смысла повышать точность шкал, перегру­жая анкету лишними вариантами ответов на предлагаемые вопросы. При желании сохранить возможность углубленно­го анализа, он должен очень внимательно отнестись к про­цедуре преобразования шкалы, прежде чем использовать разнообразный арсенал статистических методов анализа.

3. Статистический анализ

Выбор методов статистического анализа

Эмпирическая социология располагает достаточно широким набором статистических процедур, позволяющих сырые данные, содержащиеся в отдельных анкетах, преоб­разовать таким образом, чтобы можно было установить определенные факты массового сознания и проанализиро­вать связи между установленными фактами.

Выбор конкретных методов статистического анализа обычно определяется двумя основными предпосылками: 1) характером данных (форма материала, обусловленная сфор­мированными при подготовке анкеты шкалами); 2) предпо­лагаемой формой конечного «продукта» работы (отчета, научной статьи, публикациии в средствах массовой инфор­мации и т.д.). Другими словами, выбирая конкретный спо­соб статистического анализа, исследователь должен быть уверен, что данный его вид является наиболее подходящим

не только для этого типа данных, но и для конечного про­дукта исследования. Иногда исследователь использует не­адекватные средства анализа не столько потому, что он недостаточно хорошо знаком с тонкостями статистических процедур, а потому, что не учитывает конечный вид оформ­ления полученной информации — продукта исследования. В таких случаях, применяя достаточно сложные и трудоем­кие способы исчисления, автор получает довольно частные результаты, хотя и корректные с математической точки зре­ния (может быть, даже «красивые», с точки зрения специа­листа в области математической статистики), но малоинте­ресные для конкретного потребителя (заказчика) соци­альной информации, испытывающего потребность в прак­тическом использовании полученных результатов.

Как отмечалось выше, существуют два основных ти­па методов статистического' анализа, предназначенных для решения двух основных типов задач: 1) представление (описание) данных; 2) измерение связей и зависимостей между данными, полученными в результате ответов на раз­личные пункты (вопросы) анкеты.

Приступая к выбору статистических методов, социо­лог должен:

  1. определить уровень проводимого анализа (опи­сательный, объяснительный), руководствуясь формой ко­нечного продукта (итогового документа по результатам исследования);

  2. выбрать конкретные статистические процедуры по отношению к каждому из пунктов анкеты, руководствуясь типом шкалы, которую представляет структура веера отве­тов на поставленный в анкете вопрос.

Обычно не используют одни и те же статистические средства по отношению ко всем вопросам анкеты, по­скольку чаще всего различные вопросы описываются раз­личными шкалами.

В данном учебном пособии не будет приводиться под­робное описание математических основ статистических про­цедур, а также математических выкладок получения основ­ных формул расчетов соответствующих коэффициентов. За­дача нашего учебника ограничивается введением читателя в круг основных понятий и категорий, без знания которых

манипуляции с результатами социологических опросов зна­чительно чаще приводят к ошибкам и искажению инфор­мации, нежели к описанию, анализу и интерпретации по­лученных данных. .

Ряд распределения

Практически любой вид анализа (независимо от типа шкалы) начинается с формирования ряда распределения, что является первым шагом в обобщении данных по­лученных от каждого конкретного респондента. Ряд рас­пределения — это оформленная соответствующим образом запись результатов подсчета количества респондентов, от­метивших каждый из вариантов ответов на поставленный в анкете вопрос.

Обобщенные данные по каждому пункту анкеты на­зываются переменными (поскольку ответы одних респон­дентов могут отличаться от ответов других) в контексте статистического анализа и признаками в контексте социо­логического анализа.

Исследователь может проводить анализ по каждой от­дельно взятой переменной; может проводить анализ по двум переменным и показывать связь между ними; может прово­дить анализ по нескольким переменным и показывать раз­личные типы связей между ними. Когда исследователь анализирует результаты ответов на один, отдельно взятый вопрос анкеты, такой вид анализа называется одномерным, когда исследователь включает в анализ две переменные и устанавливает характер связи между ними, такой вид анали­за называется двумерным, когда исследователь устанавливает характер связей между несколькими переменными, такой вид анализа называется многомерным. Одномерный анализ используется практически в каждом исследовании; боль­шинство исследователей проводит также и двумерный ана­лиз. Многомерный анализ (факторный, кластерный и др.) требует достаточно высокого уровня подготовки з области математической статистики, необходимой, если не для того, чтобы уметь «вручную» выполнять те процедуры, которые в настоящее время «помогает» выполнить компьютер, то, по крайней мере, для того, чтобы подобрать адекватный метод,

«чувствовать» смысл и содержание значений получаемых числовых результатов. Поэтому тем исследователям, ко­торые хотят овладеть процедурами многомерного анализа, можно посоветовать обратиться к специальной литературе. В данном пособии мы подробнее остановимся на процеду­рах, проводящихся в рамках одномерного и двумерного ви­дов анализа, которые чаще всего используются в технологии стандартного анализа результатов массовых опросов. Мы приведем основные правила описания, представления и ин­терпретации полученных результатов и остановимся на наи­более распространенных ошибках, допускаемых исследова­телями на этом этапе работы.

Лекция 8

Анализ одномерных распределений

1. Дискретные шкалы: номинальная, порядковая (ранговая)

Частотные и процентные распределения

Приступая к обобщению полученного материала, ис­следователь, как правило, прежде всего формирует одно­мерные распределения по каждому пункту анкеты, т.е. подсчитывает, сколько респондентов отметили тот или иной вариант ответа на каждый из поставленных в анкете вопросов. Этот простейший вид распределения называется частотным. Частотным называется такое распределение, в котором напротив каждого варианта ответа указывается число респондентов в его абсолютном значении. Ниже приведен пример частотных распределений.

Вопрос:
1   2   3   4   5   6   7   8   9   10   11


Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации