Панина Н.В. Технология социологического исследования - файл n1.doc

приобрести
Панина Н.В. Технология социологического исследования
скачать (1369.5 kb.)
Доступные файлы (1):
n1.doc1370kb.26.08.2012 15:04скачать

n1.doc

1   2   3   4   5   6   7   8   9   10   11
«Укажите Ваш пол»

Частота
(N)
Мужской 797

Женский 1010

Всего 1807 человек

Вторым шагом одномерного анализа является подсчет процентов, так как полученные распределения чаще пред­ставляют в процентах.

Вопрос: «Укажите Ваш пол»

(N = 1 807)

Мужской 44,1

Женский 55,9

Всего 100,0%

Такое представление данных называется процентным распределением.

Таблицы одномерных распределений по всем пунктам анкеты обеспечивают достаточно полную картину описания полученных данных в тех случаях, когда основная цель ис­следования — определение общественного мнения по тем или иным социальным проблемам.

Подготовка одномерных распределений («одномерок») — достаточно простая процедура. Но в практике социологическо­го анализа исследователь может столкнуться с рядом вопросов, над которыми он не задумывался до начала анализа данных.

  1. Как лучше представлять данные — в частотах или процентах?

  2. По отношению к какому числу следует рассчиты­вать процент?

  3. С какой степенью точности необходимо указывать данные?

Частоты или проценты?

Данные, как правило, представляют в процентах. Пре­жде всего потому, что в таком виде полученный результат можно сравнивать с аналогичными данными других опросов, или же сравнивать распределение мнений у различных групп населения и т.п. Часто полученный результат сам по себе еще ни о чем не говорит; лишь сравнение одних данных с други­ми позволяет получить определенную информацию. Напри­мер, если получены данные о том, что «угрозу возникновения межнациональных конфликтов» считают реальной 25% насе­ления Украины, то эти результаты, хотя и представляют со­бой определенную информацию, но не позволяют сделать окончательный вывод о ситуации в области межнациональ­ных отношений. Для соответствующего вывода необходимо

сравнение этих данных с другими; если, допустим, в преды­дущем году подобный ответ дали всего 8%, то можно фикси­ровать весьма неблагоприятную тенденцию; а если в предыдущем году так считало 40% населения, то можно сде­лать вывод о существенных положительных сдвигах в данной области. Можно также сравнивать долю населения, выра­жающую такие опасения в разных регионах и т.д. Проценты в большинстве случаев позволяют определить различия в пропорциях и проводить сравнительный анализ на основе количественных величин. Кроме тою, данные, выраженные з процентах, значительно упрощают восприятие, что позволяет читателю без дополнительных вычислений «увидеть» по­лученную картину. Таким образом, возможность сравнения и простота восприятия обусловливают предпочтение процент­ных распределений. .

Но в некоторых случаях, когда данные приводятся только в процентах, могут быть сделаны неверные выводы. Один из таких примеров приводится в книге Э.Ноэль «Массовые опросы»: «В одной из газет была помещена замет­ка о соотношении мужчин и женщин среди слушателей гес­сенской и баварской радиопередач, делающих объявления о найме на работу: «При сравнении с результатами по сфере действия гессенской радиопередачи можно утверждать, что доля женщин среди «слушателей за день» в Баварии значительно меньше, чем в Гессене — 6!% против 68% в Гес-сене». После этого сообщения Баварская радиостанция по­требовала исправлений или пояснений в абсолютных числах. На основании этой заметки можно было сделать вывод, что гессенскую радиопередачу слушает больше женщин. Таблица, дополненная абсолютными числами прояснила картину:

Слушали рекламу о найме рабочей силы

в Баварии в Гессене

Женщины 61% = 1 430 000 68% = 735 000

Мужчины 39% = 920 000 32% = 345 000

100% = 2 350 000 100% =-- 1 080 000

В тех случаях, когда информация касается изучения по­требительского спроса, то потенциального рекламодателя в

первую очередь интересует распределение потенциальных потребителей в абсолютном, а не в относительном значе­нии. Поэтому в определенных случаях необходимо приво­дить не столько полученные проценты, сколько абсолютные значения, а также их экстраполяцию на население в целом того региона, по отношению к которому была составлена выборочная совокупность. Это положение относится в ос­новном к маркетинговым исследованиям, анализу сбыта и потребления, изучению рекламы, а также изучению некото­рых политических вопросов (например, электората и элек­торальных прогнозов).

В любом случае, когда исследователь приводит резуль­таты опроса в процентном распределении, он в каждой таб­лице должен привести данные, касающиеся общего числа людей, по отношению к которым приводимые проценты рассчитывались. Обычно абсолютные значения (общее число опрошенных, по отношению к которым считался процент) в таблицах обозначаются литерой «N». Можно также давать полный текст, характеризующий эту цифру.

Чтобы избежать искажения или возможностей не­правильной интерпретации информации, полученной в результате опроса общественного мнения, следует руково­дствоваться следующим правилом: в каждой таблице про­центных распределений необходимо указывать абсолютное число людей, по отношению к которым вычислялся процент.

По отношению к какому числу следует вычислять процент в одномерных распределениях?

Казалось бы, этот вопрос не должен вызывать сомне­ний; само собой разумеется, что по отношению к числу оп­рошенных. Но этот вопрос и не возникает, если на поставленный в анкете вопрос ответили все респонденты. Но довольно часто обшее число опрошенных и число лю­дей, давших содержательный ответ на поставленный вопрос, не совпадают. К этому приводят разные причины.

Во-первых, интервьюеры, несмотря на достаточно же­сткие инструкции и контроль, все же могут пропускать коди­ровку некоторых ответов (не говоря уже об анкетах, полученных методом самозаполнения). Не следует забывать.

что интервьюеры — живые люди, а процесс интервью — достаточно сложная эмоциональная ситуация (респонденты в процессе интервью нередко отвлекаются, дают слишком про­странные ответы; интервьюер ищет пути возвращения к теме интервью, и в какие-то моменты, даже получив ответ на по­ставленный вопрос, может не отметить его в бланке анкеты. Иногда, проверяя заполненный бланк, он может вспомнить, как именно ответил респондент. Но если он точно не помнит или пропустил сам вопрос в процессе интервью, то лучше в анкете оставить пропуск, чем вынуждать интервьюера отме­тить ответ, который не был получен от респондента.

Во-вторых, существуют и объективные причины, по которым на поставленный в анкете вопрос отвечают дале­ко не все респонденты. Среди них две являются самыми распространенными.

1. Бывают такие вопросы, которые не имеют отноше­ние к данному респонденту. Например, вопрос, который приводился выше: «Удовлетворены ли вы своей работой?» не имеет отношение к тем, кто в настоящее время не рабо­тает. В данном случае можно отсеять неработающих, но в таблице следует указать абсолютное значение числа рабо­тающих. Может быть и более неопределенная ситуация. Например, вопрос касается оценки работы детских учрежде­ний (детских садов, школ и т.п.): «Улучшились или ухудши­лись условия пребывания детей в детских садах?» Кто дол­жен давать ответ на этот вопрос? На первый взгляд, вроде бы понятно — родители, имеющие детей соответствующего возраста. Однако респондента может волновать этот во­прос, даже если у него самого нет таких детей (респонденты могут иметь внуков, братьев, сестер, племянников, детей знакомых, могут иметь профессиональное отношение к дет­ским учреждениям; в связи с этим их очень беспокоит этот вопрос, и они имеют выраженное отношение к нему). Более того, родители, имеющие детей, могут не интересоваться и не иметь собственного мнения в отношении работы детских учреждений. В этих случаях исследователь получает несоот­ветствие между общим числом респондентов и числом лиц, давших ответ на вопрос анкеты, а значит, не может доста­точно точно определить контингент ответивших.

2. В другом случае некоторая часть респондентов (иногда достаточно большая), не хочет давать ответ на предложенный вопрос в силу тех или иных моральных со­ображений или не понимает формулировку вопроса, состав­ленного автором анкеты. Довольно часто значительная часть респондентов не отвечает на вопросы интимного характера или на конкретные вопросы, касающиеся материального положения (охотно давая общую оценку своего материаль­ного положения, многие люди не хотят отвечать на вопро­сы, конкретизирующие условия их жизни). Например, на вопрос о том, что респонденты приобрели за последний год, ответ дали только чуть больше трети опрошенных, осталь­ные респонденты отказались отвечать на этот вопрос. В ре­зультате, процентное распределение к числу ответивших существенно отличается от процентного распределения к числу опрошенных.

В подобной ситуации нередко оказывается исследователь не только при изучении проблем личного характера, когда не все люди хотят давать откровенные ответы на предлагаемые вопросы, но и при изучении политических пристрастий и ори­ентации (поддержка населением различных политических пар­тий или лидеров, электоральные ориентации и т.п.). На вопросы, касающиеся политических предпочтений, многие респонденты часто не отвечают не потому, что не хотят выска­зать свое мнение, а потому, что оно у них еще не сформирова­лось. Если на поставленный в анкете вопрос, в силу тех или иных причин, не ответила значительная часть респондентов, то исследователь испытывает большое затруднение — какому из процентных распределений следует отдать предпочтение при анализе и интерпретации результатов опроса.

Например, на вопрос; «Доверяете ли Вы N?» были получены следующие процентные распределения.





% ко всем



N=1807

ответившим




N=683

0.9

2.3

4.0

10.7

1.6

4.2

3.6

9.5

3.1

8.2

15.9

42.2

1.5

4.1

4.7

124

1.8

4.8

2.7

7.0

2.5

6.6

0.7

1.8

16.2

42.8

62.2





% ко всем



N=1807

ответившим




N=1091

20.8

34.6

16.0

26.6

23.5

38.8

39.7




100.0

100.0
Приобрели за последний год

дача

садовый участок

легковая машина

цветной телевизор

новая мебель

библиотека

стерео- или видеоаппаратура

магнитофон, радиоприемник

спортивное, туристское снаряжение

холодильник

стиральная машина

швейная машина

модная одежда

нет ответа

Оказавшись в такой ситуации (если она не была пре­дусмотрена программой исследования), автор анализа не­редко испытывает затруднение — результаты какого из распределений следует привести в аналитической таблице.

скорее доверяю

трудно сказать, доверяю или нет

скорее не доверяю

нет ответа

Всего

В данном случае около сорока процентов населения по тем или иным причинам фактически отказались от­вечать на предложенный вопрос. Какой вывод может сде­лать исследователь? Должен ли он ориентироваться только на ту часть населения, которая отвечала на данный во­прос, и делать вывод о том, что данному политику дове­ряют около 35% населения, или же можно говорить лишь о том, что данному политику доверяет 21%?

Нами приведены лишь некоторые примеры мно­гочисленных проблемных ситуаций, возникающих перед исследователем уже на первом этапе анализа на самом простом уровне — описание одномерных распределений.

В каждом конкретном случае автору анализа необхо­димо находить свое обоснованное решение. Если же автор

не может принять обоснованное решение, ему можно ре­комендовать воспользоваться общими принципами пред­ставления данных одномерных распределений.

  1. В таблице следует приводить полную формулировку вопроса (в том виде, в котором он был представлен в анкете).

  2. Если доля неответов на данный вопрос менее 5%, то з большинстве случаев можно приводить процентное распределение к общему числу опрошенных (респондентов).

  3. Если доля неответов превышает 5%, то лучше при­водить оба процентных распределения (ко всем опрошен­ным и к числу ответивших).

  4. В каждой таблице необходимо указывать абсолют­ное число людей, по отношению к которому вычислялся приводимый процент. В том. случае, когда приводятся два процентных распределения, в таблице следует указывать как абсолютное число лиц, принимавших участие в опросе, так и абсолютное число людей, давших ответ на данный вопрос.

  5. В тех случаях, когда шкала номинальная, в табли­це не приводятся кодовые значения вариантов ответов; в тех случаях, когда шкала порядковая, в таблице следует приводить кодовые значения вариантов ответа.

С какой степенью точности следует приводить данные в процентах?

При оформлении результатов анализа данные про­центных распределений приводят, как правило, с точностью максимум до одной десятой. При этом следует учитывать, что даже один десятичный знак затрудняет восприятие дан­ных, так как потребитель информации, сравнивая цифры, мысленно производит округление. Поэтому в тех случаях, когда можно отказаться даже от десятых, лучше произво­дить округление до целых чисел. Следовательно, решая проблему округления, автор фактически должен выбрать один из двух вариантов: приводить данные в целых числах или указывать десятичные значения. Чем должен руково­дствоваться исследователь, решая эту проблему?

Общий принцип сводится к тому, что чем больше выборка, тем более вероятно, что десятые доли процента могут представлять значимое информационное значение.

При этом не следует забывать, что при представлении данных в таблице при небольших выборках (в несколько сотен единиц наблюдения) десятичные знаки не только за­трудняют восприятие таблицы, но и могут вводить читателя в заблуждение. Например, если автор анализа, приводя сравнительные данные о доверии населения различным по­литическим деятелям, указывает, что одному доверяют 11.5%, другому 11.9%, а третьему — 12.4% (при том, что вы­борку составляют 400 человек), то может сложиться впечатление, что существует определенное различие в уров­не доверия этим политическим фигурам, тогда как при та­кой выборке эти различия статистически не значимы. Совсем другой вывод можно было бы сделать, если бы при этих же данных было опрошено 10 000 человек.

В каждом конкретном случае можно подсчитать — какая степень точности статистически обоснована, а какая — нет. Но если решать вопрос о точности округления в целом, то можно руководствоваться следующими общими правилами.

  1. Совершенно недопустимо, чтобы в одной таблице одни данные были представлены в целых числах, а дру­гие — с точностью до десятых. Правило, которому необхо­димо следовать в любом случае, — все данные должны приводиться с одинаковой степенью точности.

  2. Никогда не следует забывать, что если процент берется от числа, значение которого меньше ста, то исследователь опе­рирует с условными процентами. Когда мы говорим «двадцать процентов населения поддерживают...», то подразумевается, что «поддерживают...» двадцать человек из каждых ста с опре­деленной вероятностью. (Степень этой вероятности определя­ется численностью опрошенных и ее репрезентативностью по отношению к генеральной совокупности). Переходя к анализу различий в полученных данных, выраженных в процентах, и отвлекаясь от абсолютной численности анализируемой группы, автор анализа нередко забывает, что говорить о «двадцати про­центах» от 10-20 человек просто смешно, потому что речь идет о мнении 2-4 человек, и любое случайное изменение (в опрос попал другой респондент данной группы; человек ответил, не подумав; в конце концов, оператор ошибся при вводе инфор­мации и т.п.) в итоге обусловит совершенно иную картину в процентном распределении.

3. При объеме выборочной совокупности от 100 до
1000 человек данные процентных распределений обычно
лучше приводить в целых числах. В этом случае различия
в данных , приводимых в целых числах, или с указанием
соответствующих десятых, не принципиальны, но восп­
ринимать данные значительно удобнее в целых числах.

Исключение составляет освещение результатов мо­ниторинговых исследований. Например, в тех случаях, когда проводится ежемесячный (ежегодный) опрос по од­ним и тем же переменным, различия в результатах опроса от месяца к месяцу могут носить не значимый характер; однако фиксируемая устойчивая тенденция сама по себе представляет определенную информацию.

4. При объеме выборочной совокупности более 1000 че­
ловек, данные в большинстве случаев лучше приводить с деся­
тыми, так как в тех случаях, когда выборка составляет несколь­
ко тысяч человек, различие в десятых долях процента может
быть не. только показательным, но и статистически значимым.

Эти правила носят достаточно общий характер и пред­назначены в качестве рекомендации исследователю, испыты­вающему затруднения, связанные с представлением результа­тов опроса. В каждом конкретном случае автор анализа мо­жет самостоятельно решать -- с какой степенью точности ему следует представлять материал. Главное, чтобы это решение было достаточно осознанным и обоснованным.



2. Непрерывные шкалы: интервальная, метрическая

Меры центральной тенденции

Если для шкал дискретного типа в качестве описа­тельных статистик используются в основном частотные и процентные распределения, то для шкал непрерывного ти­па — статистики, позволяющие охарактеризовать среднее значение полученных данных. Напомним, что к непрерыв­ным относятся метрические и порядковые шкалы (в тех случаях, когда у автора есть основания рассматривать по­рядковую шкалу как интерзальную).

Основными обобщающими характеристиками дан­ных, полученных по непрерывным шкапам, являются сред­ние величины или меры центральной тенденции: среднее арифметическое, мода и медиана. Меры центральной тен­денции позволяют определить и описать наиболее ти­пичную величину полученных данных.

Среднее арифметическое — величина, которую наибо­лее часто используют при характеристике изучаемого кон­тингента людей по различным метрическим шкалам. Например, если в анкете задавался вопрос о заработной плате, то, характеризуя полученные данные, указывают среднюю заработную плату и т.п.

Для подсчета среднего арифметического значения выписываются ВСЕ значения полученной переменной (обычно в порядке возрастания) и напротив каждого значения указывается количество лиц, отметивших данный ответ в анкете. Приведем пример вычисления среднего арифметического значения возраста опрошенных старше­классников (для удобства восприятия и расчетов ниже приводятся упрощенные вымышленные примеры). Ре­зультаты опроса выписываются следующим образом:

Возраст N

  1. 40

  2. 60

16 200

  1. 72

  2. 28

Всего 400 (человек)

Затем значение каждого признака умножается на ко­личество лиц, обладающих данным признаком, и по­лученные произведения складываются:

= 560 = 900 = 3200 = 1224 = 504 6388

  1. х 40

  2. х 60

  3. х 200

  4. х 72

  5. х 28 Всего 400

Среднее арифметическое вычисляется путем деления суммы произведений каждого значения признака на число лиц, обладающих данным признаком, на общее количест­во опрошенных:

6388 : 400 = 15.97

В данном случае средний возраст опрошенных стар­шеклассников составляет 15.97 лет. Существуют и другие средние показатели: мода и медиана.

Под модой подразумевается наиболее часто встречаю­щееся в ряду распределения значение признака. В приведен­ном примере модой является значение 16 лет, так как такой возраст характерен для 200 человек (самое высокое значение).

Под медианой подразумевается значение признака, которое находится в середине ранжированного ряда. В данном случае это значение тоже равно 16 годам.

Среднее арифметическое, мода и медиана — основные характеристики, позволяющие описать основное (типичное) свойство данных, полученных по массиву респондентов. В процессе описания данных перед исследователем стоит за­дача — какой из этих показателей выбрать. Это зависит от типа шкалы изучаемого признака.

Чем выше измерительный уровень шкалы, тем боль­ше характеристик можно использовать для ее описания. Если для дискретных шкал можно пользоваться только такими характеристиками, как мода и медиана, то для не­прерывных шкал можно считать среднее арифметическое.

Среднее арифметическое — величина, позволяющая получить определенную характеристику изучаемого объекта (например, по ней можно количественно сравнивать сотруд­ников разных предприятий по среднему возрасту, средней зарплате и т.п.). Однако этот показатель сам по себе доста­точно односторонний, что иногда возмущает людей, не толь­ко не имеющих специальных знаний в области математичес­кой статистики, но и даже с низким уровнем образования: «Как можно говорить о средней заработной плате у нас на предприятии (в стране), если я получаю так мало, а «на­чальство» имеет такую высокую зарплату!». Чувство «социаль­ной справедливости» даже на житейском уровне подсказы­вает, что нельзя говорить о том, что «в среднем» у населения высокий жизненный уровень, когда определенная часть полу-

чает «очень много», достаточно большая часть — «очень ма­ло», и неизвестно сколько получает ту самую «среднюю ве­личину». Здесь на интуитивном уровне определяется, что од­ного только среднего значения недостаточно, чтобы охаракте­ризовать картину по определенному показателю. Но интуи­тивный житейский скептицизм срабатывает, к сожалению, тогда, когда речь идет о вещах, затрагивающих непосредст­венные интересы людей. При анализе достаточно «абстракт­ных» показателей начинающие социологи нередко не учиты­вают «достижения» статистики, в частности, необходимости дополнять данные по средним значениям полученных пока­зателей такими характеристиками, как рассеяние (измен­чивость, колеблемость) признака и форма распределения.

Используя вышеприведенный пример, проиллюстри­руем значение показателей изменчивости признака. Мы рассчитывали данные по среднему возрасту обследованных старшеклассников. Среднее арифметическое значение ука­зывает, что их средний возраст около 16 лет. Если читателю представить весь ряд распределения, то можно увидеть, что самый младший из опрошенных был 14 лет, а самый стар­ший — 18, т.е. возраст изучаемого контингента отклонялся от средней величины максимум на два года. Но по метри­ческим шкалам, включающим значительное число значений признака, общее распределение, как правило, не приводит­ся, а одно лишь значение среднего арифметического может ввести в заблуждение, так как если бы мы в той же школе опросили 350 детей 9-10 лет и 50 учителей в возрасте 50-60 лет, то среднее арифметическое всех опрошенных тоже рав­нялось бы примерно 16 годам. В данном случае совершенно разные контингенты опрошенных имели бы одинаковое значение этого параметра, так как во втором случае опра­шивался неоднородный контингент, в частности, по такому показателю, как возраст.

Таким образом, для того, чтобы получить адекватное представление об изучаемом признаке, одного среднего значения явно недостаточно.

В общем виде для отбора статистических процедур, используемых для описания одномерных распределений, в зависимости от типа шкалы можно руководствоваться сле­дующей схемой.

Тип шкалы

Средние величины

(меры централь­ной тенденции)

Разброс

(меры изменчивости)

Дискретный







номинальные

мода




порядковые/ранго­вые

медиана, мода

ранг, минимум, максимум

Непрерывный







метрические, порядковые/интер­вальные



среднее арифме­тическое, медиа­на, мода

г

стандартное отклонение, коэффициент вариации,

ранг, минимум, максимум
1   2   3   4   5   6   7   8   9   10   11


«Укажите Ваш пол»
Учебный материал
© nashaucheba.ru
При копировании укажите ссылку.
обратиться к администрации