Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Ошибка выборки




Б73

Врезка

G71

G70

Б68

Врезка

Исследование читательской аудитории «Правды» *

Проведенное в середине 1960-х гг., это иссле­дование (рук. В.Э. Шляпентох) было по-свое­му уникальным. Здесь впервые в отечествен­ной практике разработана общенациональная территориальная вероятностная выборка. Она основывалась на данных Всесоюзной перепи­си 1970 г. и планировалась как шестиступенча-тая. На первой ступени единицами отбора слу­жили области, края и республики. Это был вы­нужденный выбор, ибо единицы имели разный размер по территории и по числу жителей, что само по себе нарушало принцип равных шан-

Подробнее см.: Мансуров В., Петренко Е. Изу­чение общественного мнения традиции // Со­циология в России / Под ред. В.А. Ядова. 2-е изд., перераб. и дополн. М.: Издательство Ин­ститута социологии РАН, 1998. С. 577.

сов попадания в выборку жителей разномасш­табных областей. Однако в те годы в распоря­жении социологов не было статистической ин­формации о более мелких административных единицах.

Территория некоторых областей была недо­ступна для проведения опроса. Сюда были от­несены труднодоступные и малонаселенные сибирские и дальневосточные районы (здесь проживало около 10% населения СССР) и ре­жимные зоны (8,5% населения). В выборку они не попали. Две специальные «саморепрезенти­рующие» страты были выделены для населения Москвы (303 интервью) и Ленинграда (179). Остальные области сгруппированы по уровню социально-экономического развития и в зави­симости от их географического положения в 47 страт, которые включали от 1 до 12 областей. Страты были неравными по численности насе­ления. Самая малая содержала 1%, а самая крупная — 21% населения страны. Из их числа были отобраны 20 страт с помощью специаль-

Ьатыгин Г.С. Лекции по методологии социологических исследований. 1995. С. 147-148.

G65

Концептуальный объект — идеальный конструкт, обозначающий рамки темы исследования. Проектируемый объект — совокупность доступных ис­следователю единиц.

Итак, взвесив свои возможности и поняв, что всех, кто идеально подхо­дит для нашей генеральной совокупности, мы опросить по разным обстоя­тельствам не сможем, мы получаем в итоге новую генеральную совокупность, из которой и должны исходить, проектируя свою выборку. Они могут раз­личаться совсем незначительно (если труднодоступных единиц наблюдения мало) или очень значительно (если таковых много).

Поскольку два объекта расходятся, то следует заново переопределить гене­ральную совокупность. Старое определение: генеральная совокупность — это та совокупность, из которой предполагается производить выборку единиц. Новое определение: генеральная совокупность — это та совокупность, из которой про­изводится выборка единиц. Чем они различаются? Старое определение не учи­тывает труднодоступность и возможные на практике ограничения, но указыва­ет на теоретически возможный объем понятия, скажем «россияне». В теорети­чески сконструированной генеральной совокупности, согласно официальной статистике, например, 49% мужчин и 51% женщин. Но когда социолог отбро­сил все труднодоступные единицы наблюдения и дал новое определение, при­ближенное к реальности обследования, у него получилось, к примеру, 43 % муж­чин и 57% женщин (уменьшение количества мужчин могло произойти за счет того, что, скажем, опросить военных и заключенных накануне президентских выборов практически невозможно или нереально).

Из какой генеральной совокупности — теоретически мыслимой или реаль­но существующей — должен исходить социолог? Видимо, из второй. А с какой генеральной совокупностью он должен сравнивать выборочную после полево-

ггмлгс ттрттгжяниа w х/гтяыяппипяти \лрг\\! гтгппыриыа т р пттпрттрпат^прттги^рытя-

Выборка домохозяйств.

ной процедуры контролируемого отбора с ве­роятностью, пропорциональной размеру стра­ты. В свою очередь, внутри каждой случайным отбором выделялось по одной области, кото­рые получали количество интервью, пропорци­ональное объему страты. На второй ступени отбирались районы областных центров, города областного подчинения и адми­нистративные районы областей, вошедшие в вы­борку путем систематического отбора. На третьей ступени — городские и сельские населенные пун­кты внутри них. На четвертой — в городских на­селенных пунктах отбирались территории, обслу­живаемые ЖЭКами. На пятой ступени, по доку­ментации этих контор, выбирались семьи квартиросъемщиков. На шестой, завершающей, в отобранных семьях по процедуре «household-sampling»" Киша определялись респонденты для проведения интервью.

В этом исследовании тщательно регистрирова­лись все действия интервьюера по отбору рес-

пондентов на последней ступени*". С первого посещения удалось войти в контакт только с 77% респондентов. Больше всего интервью с первого посещения проводилось по субботам — 83%. Для повторных интервью самым удачным оказывался вторник (59%). По времени суток наибольшее число удачных интервью пришлось на вечернее время — от 20 до 22 часов.

*" Петренко Е.С., ЯрошенкоТ.М. Социально-де­мографические показатели в социологических исследованиях. М.: Статистика, 1979.

тивность? Обязательно со второй. Но часто об этом забывают и сравнение про­исходит с первой совокупностью, хотя выборка производилась из второй.

Однако трудности встречаются, как мы уже выяснили, не только на пути конструирования генеральной совокупности. Не меньше, если не больше, их и на пути конструирования, а затем и обследования выборочной совокупно­сти. Выше они были сгруппированы в два типа ошибок выборки — случай­ные и систематические. Для неопытного полевого социолога они могут стать мощнейшим фактором возмущения и причиной серьезных погрешностей.

В результате наложения двух типов ошибок происходит не меньшее, если не большее, чем в случае с генеральной совокупностью, отклонение идеаль­но запроектированной выборки от реально получившейся. Отклонение ре­альной выборки от проектируемой можно наглядно изобразить на схеме.

На рис. 13 сплошной линией обозначена связь двух реальных выборок: А'=>В; она символизирует то, что получилось в эмпирическом исследовании в действительности. Хотя, конечно же, социологу мечталось о другом. В иде­але он желал бы получить связь А=>В', т.е. чтобы из идеально сконструиро­ванной и максимально широкой генеральной совокупности у него получилась максимально полная и репрезентативная выборка. Но позже, когда он осоз­нал невозможность получения идеальной генсовокупности, он устремился ко второму варианту — получить связь А'=>В', т.е. из ограниченной генсовокуп­ности получить максимально полную выборку. На самом же деле, преодолев многочисленные трудности и наделав множество ошибок (случайных и сис­тематических), социолог получил самый худший вариант, а именно А'=>В.

Рис. 13. Расхождение между идеальной и реальной моделями в двух совокупностях -

генеральной и выборочной

Для сокращения разрыва между идеальной (проектируемой) и реальной (по­лучившейся) выборками, приведения в соответствие замысла и действительно­сти социологи разработали множество довольно эффективных приемов: конт­роль выборки (увеличение удельного веса недостающих групп и уменьшение из-

быточных), ремонт выборки (замена труднодоступных респондентов аналогич­ными по задаваемым признакам индивидами), контроль заполнения вопросни­ков и др. С их помощью реальный массив подгоняется под проектируемый.

РАСЧЕТ ОБЪЕМА ВЫБОРКИ24

Из всех вопросов, которые задают сотрудникам знаменитого Института опросов общественного мнения Гэллапа, самым популярным является такой: как вы можете, проинтервьюировав 1000 человек, судить о том, что думают 250 млн американцев?

Для ответа на этот вопрос нужно упомянуть не только высокую квалифи­кацию и огромный практический опыт сотрудников, но и использование ими статистики и математики. Если методы опроса не основаны на науке, резуль­таты могут ввести вас в заблуждение.

В статистике приняты следующие разграничения объемов выборки. Объем выборки, достаточный для взаимопогашения случайностей и получения стати­стических характеристик закономерного характера, равен 30. Выборка такого объема называется малой. Характер распределения значений признака в малых

выборках приближается к нормальному с ростом числа испытаний. Минимальный объем выборки, позволяющий получить средние значения признака с указанием доверительных вероятностей, равен 5. Выборки такого объема называются сверхмалыми. Распределение значений при­знака в таких выборках характеризуется распределением Стьюдента. Но чаще всего в социологии имеют дело с гораздо большим объемом выборки.

При планировании выборочного обследования наступает момент, когда нужно решить, сколько человек опрашивать, т.е. каким должен быть объем выборки. Это решение чрезвычайно важно, поскольку слишком большая выборка потребует излишних затрат, а слишком маленькая понизит качество результатов.

Поскольку выборочная совокупность — это часть генеральной совокупно­сти, отобранная с помощью специальных методов, — важно, чтобы эта часть не искажала представления о целом, т.е. репрезентировала его. Социологов, часто проводящих эмпирические исследования, постоянно волнует вопрос о том, как много надо опрашивать человек, чтобы получить достоверную инфор­мацию? Институт Гэллапа в США проводит регулярные опросы по националь­ной выборке объемом в 1,5 тыс. человек и достигает поразительной точности (ошибка выборки составляет от 1 до 1,5%). Центр «Социо-Экспресс» Инсти­тута социологии РАН проводит исследования на выборке объемом в 2 тыс. че­ловек, при этом ошибка выборки не превышает 3%25.

Специалисты считают, что наилучшая выборка — не обязательно большая. Конечно, чем больше объем выборки, тем выше точность ее результатов. Однако даже огромная выборка не гарантирует успеха, если генеральная

24 Материал излагается по источнику: Методическое пособие социолога-практика (Словарь-справоч­ник) / Под ред. Д.А. Шевченко, А.И. Кравченко. М., 1990.

25 Gallup G. The Gallup poll: Public opinion 1978. Wilmington, Delaware: Scholarly Resources, 1979. PXLIV; Зеркало мнений: Результаты социологического опроса населения России. М., 1993. С. 3—4.

совокупность «плохо перемешана», т.е. является неоднородной. Однородно1 считается такая совокупность, в которой контролируемый признак распре делен равномерно, не образует пустот или сгущений. В этом случае, опро сив нескольких человек, можно получить точную информацию о распреде лении этого признака в генеральной совокупности.

Таким образом, на репрезентативность данных влияют не количествен­ные характеристики выборочной совокупности (ее объем), а качественные характеристики генеральной совокупности — степень ее однородности.

В социологии еще не придумано единой и четкой формулы, использу$ которую можно рассчитать оптимальный объем выборочной совокупности, -такой формулы просто не существует в природе. И объясняется это весьм; просто. Дело в том, что определение объема выборочной совокупности -проблема не столько статистическая, сколько содержательная. Иными сло­вами, объем выборочной совокупности зависит от множества факторов, в ton числе от целей и задач, теоретической модели, гипотез и методов исследо­вания, степени однородности генеральной совокупности, наконец, требую­щейся точности получаемой информации.

Практика показывает, что для многих социологов обоснование объема выборкг является камнем преткновения, несмотря на значительное количество литерату­ры, посвященной выборочным методам и, в частности, расчету объема выборки Причин несколько: 1) дефицит специальной литературы на периферии; 2) нехват ка времени для самообразования; 3) неумение пользоваться математическим ап­паратом. В связи с этим возникает необходимость без сложных математически) формул изложить стратегию и тактику обоснования объема выборки.

Процедура расчета объема выборки — цепь бесконечных компромисса между стремлением к точности и ограниченностью ресурсов, дефицитен времени и неполнотой сведений об изучаемом явлении. Вместе с тем эте наука и искусство, познание которых доступно каждому человеку. Однакс для этого нужно знать стратегии расчета объема выборки (предварительно­го расчета, последовательной и комбинированной стратегии), а также фак­торы, влияющие на объем выборки (объем генеральной совокупности, варь­ирование ответов респондентов, точность оценивания, характер предпола­гаемого распределения ответов, метод исследования, процедура обработки)

Стратегия предварительного расчета состоит в том, что объем выборк* определяется до проведения основного исследования. Для расчета объем; случайной выборки надо знать желаемую точность оценивания, величию риска получаемого ответа и степень изменчивости ответа. Традиционно точ­ность оценивания принимают за 5%, а величину риска — за 0,95. Иными сло­вами, если по данным выборочного исследования 60% опрошенных удовлет ворены работой, то можно утверждать, что в генеральной совокупности дол5 удовлетворенных составит от 55 до 65% в 95% случаев, а в 5% случаев така5 доля может выйти за этот интервал. Если исходить из 5%-ной точности и ве­личины риска в 0,95, объем выборки будет следующим (табл. 3).

Таблица; Зависимость объема выборки от объема генеральной совокупности

Результаты, приведенные в табл. 3, свидетельствуют против распростра­ненного заблуждения, будто бы объем выборки — жестко фиксированный процент от генеральной совокупности, равный 10. На самом же деле эта ве­личина — не постоянная, а переменная, изменяющаяся в конкретных усло­виях. Объем выборки зависит также от того, какие вопросы используются в анкете. Цифры в табл. 3 действительны только для одного случая — когда речь идет о дихотомическом вопросе, у которого максимальный разброс ответов — 50 на 50%. Не имея предварительной информации о разбросе оценок, соци­олог как бы заранее страхуется и считает, что этот разброс составит 50 на 50%. Если же такая информация имеется, то объем выборки будет следующим.

Таблица 4 Зависимость объема выборки от распределения дихотомического ответа

 

 

Распределение ответов, %          
         
Объем выборки          

В табл. 4 показано распределение ответов на качественные вопросы. Рас­чет объема выборки для количественных вопросов, включающих вопросы типа «возраст» и «заработная плата», строится исходя из коэффициента ва­риации (табл. 5), который показывает, какой процент составляет среднее квадратическое отклонение от средней арифметической, и позволяет срав­нивать между собой (по степени варьирования) любые признаки.

Таблица 5 Зависимость объема выборки от коэффициента вариации

 

Коэффициентвариации,%                        
Объем выборки                        

Если изучаются условия труда, взаимоотношения в коллективе, заработ­ная плата и т.д. с помощью пятичленной шкалы, то коэффициент вариации изменяется здесь от 27 до 62%, а при использовании семичленной — от 78 до 113%. Стало быть, чем длиннее шкала, тем выше коэффициент вариации и больше должен быть объем выборки. Если социолог хочет обойтись неболь­шой выборкой, то и вопросы должен формулировать проще. Иногда дума­ют, что чем длиннее шкала, тем точнее измерение. Но преимущества семи­балльных шкал над пятибалльными не доказаны.

Среди социологов распространено мнение, согласно которому чем боль­ше объем выборки, тем точнее результат, и это заставляет их непомерно уве­личивать количество опрошенных. В реальности дело обстоит иначе: табл. 6, составленная по данным Института Гэллапа, показывает зависимость меж­ду объемом выборки и точностью оценивания в процентах. Из нее следует, что с увеличением объема выборки точность возрастает, но до определенно­го порога. Уже при 600 опрошенных достигается желанный для всех 5%-ный уровень точности. Стало быть, 600 человек — приемлемый объем выборки.

При расчете объема выборки социологи часто совершают такую ошибку: рассчитав по существующим формулам необходимый объем выборки в це­лом для совокупности, в дальнейшем пропорционально размещают его по

отдельным подразделениям выборки, например по цехам, предприятиям, районам, городам, типам семей. После чего на этапе обработки данных — ана­лизируют уже сами различия между подразделениями. Однако правильнее вычислить объем выборки отдельно для каждого подразделения, а затем сум­мировать отдельные объемы. Допустим, расчеты объема выборки по трем цехам (с учетом размерности шкалы, численности работающих, характера предполагаемого распределения оценок) позволили установить, что в пер­вом цехе необходимо спросить 384 человека, во втором — 222, а в третьем -600. Тогда общий объем выборки составит 384+222+600=1206 человек.

Таблица t Зависимость между объемом выборки и точностью оценивания

 

Количество интервью Точность оценивания, %
— юо ±11
" 200 +8
  ±6
  ±5
  ±4
  ±4
  +3
  ±2

При расчете квотной выборки социологи часто произвольно определяют ее объем в 1000 человек, исходя из удобства вычисления квот. Но с таким же успе­хом можно взять любое другое круглое число. Более обоснованным являете; подход, при котором объем квотной выборки рассчитывается как для случай­ной. Другим вариантом расчета объема квотной выборки является использова­ние теории малых выборок. Ее суть: если не ставится цель дать дифференциро­ванный анализ по группам работников, то умножают количество градаций воп­росов, подлежащих изучению, на 25 (минимальный статистический значимые размер группы). Например, изучают три переменные: пол —две категории, воз раст — две категории (до 30 лет и свыше 30 лет), удовлетворенность трудом -измеряется пятибалльной шкалой. Тогда необходимый объем выборки для дан­ного примера составит 2x2x5x25=500 человек. Объем выборки увеличивается i 2,5 раза. Ясно, что с расширением числа переменных и числа градаций объе\ выборки может стать катастрофически большим. Выход только один: детальна) проработка исходной проблемы, которая позволит отбраковать лишние вопро сы в анкете, оставив самые важные. Если в исследовании проверяется несколь ко гипотез, то объем выборки для проверки каждой гипотезы вычисляется от дельно. Таким образом, при использовании выборки количество вопросов i анкете и гипотез должно быть минимальным.

Итак, мы рассчитали требуемый объем выборки. Теперь, и только тепер] необходимо проверить, совместима ли полученная величина с выделенном! ресурсами. Типичная ошибка многих социологов-прикладников состоит в том что при расчете объема выборки во главу угла ставятся наличные ресурсы W™ хуже того, социолог пассивно принимает все условия, диктуемые заказчиком Это в корне неверно по нескольким причинам. Во-первых, расчет объема вы борки позволяет глубже проникнуть в суть изучаемого предмета и специфик методов исследования, а значит, аргументированно требовать получения боль

ших ресурсов или принять правильное решение о снижении объема выборки. Если администрация отказала в дополнительных ресурсах, а цели исследования не позволяют сократить объем выборки (т.е. социолог не может принять реше­ние администрации), то надо переходить кдругой схеме исследования. Во-вто­рых, обоснованный расчет объема выборки показывает профессионализм соци­олога и заставляет заказчика относится к нему более уважительно.

Стратегия последовательного расчета объема выборки. При расчете объема выборки желательно знать разброс оценок и некоторые другие параметры. Однако они-то, как правило, неизвестны. Для того чтобы не допустить ошиб­ки, лучше предположить, что они максимальны. Плата за наше незнание — раз­бухание объема выборки сверх необходимого и дополнительные финансовые и временные затраты (приходится опрашивать большее число людей). Для со­хранения затрат применяется последовательная стратегия — объем выборки не рассчитывается заранее, а ставится в зависимость от конечных результатов исследования. Например, опрашивают 100 человек, затем устанавливают ве­личину разброса оценок и уже в зависимости от этого рассчитывают необхо­димый объем выборки. Если оказывается, что 100 человек достаточно, то ис­следование заканчивается. В противном случае добирается необходимое ко­личество респондентов, но не до бесконечности. Известен пример из практики Дж. Гэллапа, который в начале своей карьеры активно экспериментировал с объемами выборки. В 1936 г. американцам был задан вопрос: «Хотели бы вы возобновления закона о восстановлении национальной промышленности?» Выяснился странный парадокс: Дж. Гэллап вначале опросил 500 человек и за­мерил ошибку выборки, а затем последовательно наращивал число респонден­тов до 30 тыс. К своему сожалению, он обнаружил, что прибавление 29,5 тыс. опрошенных увеличило точность информации менее чем на 1 %. Следователь­но, опрос можно было прекращать уже при 500 опрошенных. Этот пример по­казывает, что, применяя последовательную стратегию, можно добиваться зна­чительного снижения необходимого числа наблюдений по сравнению с пред­варительным расчетом объема выборки.

Однако стратегия последовательного расчета объема выборки приносит желаемый результат лишь в том случае, если социолог может производить необходимые расчеты в ходе самого опроса, например телефонного, с при­менением компьютерных систем. Социолог вводит ответы респондента в свой персональный компьютер, с него результаты сразу поступают на ком­пьютер руководителя исследования, обрабатываются, и на экране дисплея выдается информация не только об одномерных частотах, распределенных по тому или иному вопросу, но и о требуемом объеме выборки.

Если существует опасность, что объем выборки может оказаться катаст­рофически большим, надо совместить оба вида стратегии — предваритель­ную и последовательную, т.е. применить комбинированную стратегию. Рассчи­тывая выборку по предварительной стратегии, получаем верхние допусти­мые значения для последовательной стратегии или, иначе говоря, ту величину объема выборки, при достижении которой прекращается опрос по последовательной стратегии.

Наиболее обоснованный и корректный подход к определению объема выбор­ки основан на расчете доверительных интервалов, в основе которого лежит ряд базовых понятий математической статистики (вариация, среднее квадратиче-ское отклонение, доверительный интервал, средняя квадратическая ошибка).

Для расчета необходимого размера выборки в количественном исследо­вании чаще всего используют два статистических понятия — доверительный интервал и доверительную вероятность. Доверительный интервал представ­ляет собой заранее задаваемую вами погрешность выборки. Например, если вы задаете доверительный интервал в 3% и конкретный ответ на конкретный вопрос исследования составит 48%, это значит, что даже при проведении опроса всей генеральной совокупности реальное значение попадет в интер­вал между 45 (48-3) и 51% (48+3). Доверительная вероятность показывает, насколько вы можете быть уверены в полученных результатах, в том, что ха­рактеристики выборки соответствуют характеристикам всей генеральной совокупности — иными словами, с какой вероятностью случайный ответ по­падет в доверительный интервал. Обычно используют доверительную веро­ятность 95 и 99%. Чаще всего используется 95% — этого вполне достаточно в подавляющем большинстве исследований. Если объединить доверительную вероятность и доверительный интервал, то можно сказать, что ответы на вопрос с 95%-ной вероятностью попадут в интервал между 45 и 51%.

Повышенная надежность допускает ошибку выборки до 3%, обыкновен­ная — от 3 до 10% (доверительный интервал распределений на уровне 0,03— 0,1), приближенная — от 10 до 20%, ориентировочная — от 20 до 40%, а при-кидочная — более 40%26.

На основе этих понятий с учетом ряда предположений выводятся формулы расчета объема выборки, которые предполагают, что репрезентативность гарантируется путем использования корректных вероятностных процедур формирования выборки.

Чтобы разобраться с выборками, надо прежде всего понять, что представляет собой изуча­емое целое, или генеральная совокупность. А она меняется в зависимости от предмета изу­чения. Например, если вас интересует электо­ральное поведение, вы вряд ли станете интер­вьюировать детей в возрасте от двух до две­надцати. С другой стороны, если вы хотите понять восприятие субботних комиксов для детей, то взрослые старше восемнадцати лет вряд ли будут нужной группой. Поэтому первый шаг при проведении выборки — знать, пробой чего она является. В любом проекте, связанном с выборкой, ключевое решение — это ответ на вопрос: что является популяцией, или гене-

III. Гауайзер, Э. Уитт Выборкаявление и процесс

С выборками знакомы все, мы используем их каждый день. Это не что иное, как часть чего-то большего, взятая для получения представления об этом большем. За шведским столом мы про­буем многие блюда, чтобы решить, какие из них взять целиком. Наш врач берет пробу крови, чтобы узнать о нашем состоянии. Электронная компания испытывает образцы своей продук­ции, чтобы гарантировать их качество. В каждом из этих случаев выбирается фрагмент какой-то большой группы. Все это выборки, и все они по­лезны.

Многим людям, правда, кажется, что выборка — это не совсем правильно и что гораздо лучше взять всю совокупность в целом. Конечно, бы­вают случаи, когда такой процесс под названи­ем референдум или плебисцит, т.е. всеобщий опрос общественного мнения, является пред­почтительным. Но ведь при визите к врачу вы не захотите, чтобы он взял для проверки всю вашу кровь, даже если это и заметно улучшит точность анализа.

Ядов В.А. Социологическое исследование: Методология. Программа. Методы. [Доп. и испр. изд.] Самара: Изд-во «Самарский ун-т», 1995. С. 70.

В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение оп­ределенных обследований, которые нельзя превышать, и очевидно, что цен­ность получаемой информации не принимается при этом в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.

Исследовательская практика подсказывает следующее правило: объем выбор­ки должен обеспечивать не менее 100 наблюдений для каждой первостепенной и не менее 20—50 наблюдений для каждой второстепенной классификационной составляющей. Первостепенные классификационные составляющие соответ­ствуют наиболее критичным, а второстепенные — наименее критичным ячей­кам перекрестной классификации, принятой в данном исследовании27.Теоре-тические расчеты и практика доказывают, что для получения достоверных дан­ных о мнении и предпочтениях населения такого крупного города, как Санкт-Петербург, достаточно опросить 700—800 человек. Однако большинство опросов населения здесь проходят на выборках объемом до 1,5 тыс. человек.

Как мы уже знаем, репрезентативность — свойство выборочной совокупно­сти представлять характеристику генеральной. Если совпадения нет, говорят об ошибке репрезентативности — мере отклонения статистической структу­ры выборки от структуры соответствующей генеральной совокупности. Пред-

ральной совокупностью? Результаты выборки можно проецировать только на ту совокуп­ность, частью которой она является. Если вы включили в свою совокупность лишь людей, подписывающихся на какой-то определенный журнал, вы не сможете сделать обобщение о населении в целом.

Выбор генеральной совокупности критически важен в любом проекте, связанном с выборкой. Причем определение искомой совокупности должно проистекать из плана исследования, а не делаться постфактум, исходя из той выбор­ки, которую вам удалось получить. Так, очень ин­тересные результаты опроса студентов-полито­логов младших курсов местного университета не слишком важны для анализа политики в вашем городе.

Важно проанализировать популяцию, дабы убе­диться, что ваше исследование осуществимо. Например, если вам приходится проводить его по телефону, ваша выборка будет состоять толь­ко из владельцев телефонов. Во многих странах это далеко не лучшая выборка для анализа все­го населения. В США — может быть, но это за­висит от характера исследования. Если вы пы­таетесь изучать бездомных или очень бедных,

совокупность домов с телефонами вряд ли по­может.

Следующий вопрос после правильного опреде­ления совокупности — какого типа и объема тре­буется выборка.

Существует много разных типов выборок. Ключ к определению типа выборки — обеспечение всем элементам генеральной совокупности рав­ной вероятности попадания в выборку. Чтобы достичь этого, специалист по статистике должен подкорректировать выборку (способом, который обычно называется взвешиванием) для устране­ния дисбалансов, связанных с конкретной мето­дологией выборки. Имеется в виду не чаще все­го обсуждаемая ошибка репрезентативности, а ошибка, возникающая оттого, что не все члены популяции имели равные шансы попасть в вы­борку. При правильной организации опроса кор­ректировка устранит эту ошибку. В нашем случае мы будем вести речь только о «случайных» выборках, хотя этот тип выборки редко, если вообще когда-либо, используется в опросах. Он предусматривает равную вероят­ность быть представленным в выборке для всех членов популяции. Большинство опросов после соответствующей корректировки выборки рас-

7 Особенности проведения интервью, анкетирований // http://www.gortis.info/article/static/46/

положим, что средний ежемесячный семейный доход пенсионеров в генераль­ной совокупности составляет 2 тыс. рублей, а в выборочной — 6 тыс. рублей. Это означает, что социолог опрашивал только зажиточную часть пенсионеров, а в его исследование вкралась ошибка репрезентативности. Иными словами, ошибкой репрезентативности называется расхождение между двумя совокуп­ностями — генеральной, на которую направлен теоретический интерес соци­олога и представление о свойствах которой он хочет получить в конечном итоге, и выборочной, на которую направлен практический интерес социолога, ко­торая выступает одновременно как объект обследования и средство получения информации о генеральной совокупности.

Наряду с термином «ошибка репрезентативности» в отечественной лите­ратуре можно встретить другой — «ошибка выборки». Иногда они употреб­ляются как синонимы, а иногда «ошибка выборки» используется вместо «ошибки репрезентативности» как количественно более точное понятие.

Ошибка выборки отклонение средних характеристик выборочной сово­купности от средних характеристик генеральной совокупности.

На практике ошибка выборки определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними. В со­циологии при обследованиях взрослого населения чаще всего используют данные переписей населения, текущего статистического учета, результаты предшествующих опросов. В качестве контрольных параметров обычно при­меняются социально-демографические признаки. Сравнение средних гене­ральной и выборочной совокупностей, на основе этого определение ошиб­ки выборки и ее уменьшение называется контролированием репрезентатив-

сматриваются, как если бы они основывались на случайной выборке.

В идеальном мире вы бы обладали важной ин­формацией об исследуемой популяции еще до разработки выборки. Было бы полезно, напри­мер, знать, как интересующие вас характерис­тики распределяются в общей совокупности. Скажем, вы хотите измерить рост людей в воз­расте от 21 года до 50 лет, проживающих на острове Умлаудвиль. Если бы вы знали, как ва­рьируется рост между людьми, вы бы смогли подсчитать, сколько людей вам потребуется обследовать, чтобы получить результаты при 95%-ной доверительной вероятности с точнос­тью до двух дюймов. Лучший пример такой си­туации — когда рост вообще не варьируется. Если все жители острова имеют рост 5 футов и десять дюймов, то сколько людей нужно вклю­чить в выборку для определения среднего рос­та населения? Правильно — одного. То же самое было бы, если бы все принадлежали к одной политической партии, имели бы одинаковое мнение о текущем состоянии экономики и т.д. Проблемы с объемом выборки начинаются толь­ко тогда, когда начинаются различия. В реальном мире мы делаем выборку потому, что не знаем, как выглядит вся популяция. Един­ственный имеющийся у нас ключ к этому зна-

нию — это результаты, полученные на выборке. Специалист по статистике скажет, что мы оце­ниваем вариации в совокупности по вариациям в выборке. Но если мы не знаем, каковы пара­метры этих вариаций в совокупности, пока мы не сделаем выборки, то как нам определить объем самой выборки?

К счастью, есть методы, которые помогут нам выбрать объем выборок для конкретной попу­ляции.

В статистике разработаны таблицы объемов выборки, требуемые при конкретной численно­сти популяции при том или ином уровне дове­рительной вероятности. Эти таблицы также учи­тывают степень равномерности в распределе­нии измеряемой характеристики. Например, если вы подсчитываете, какой про­цент населения имеет голубые глаза, ваши ре­зультаты в процентах будут точнее, если они будут редкими, скажем — менее чем у 5% все­го населения. Это будет означать, что у вас малая вероятность получить в выборке избыток голубоглазых или, наоборот, получить занижен­ную более чем на 5% выборку, поскольку про­цент голубоглазых в выборке не может быть меньше нуля. Однако для большинства опросов исходят из наихудшего варианта распределе­ния, примерно равного 50%.

G75

ности. Поскольку сравнение своих и чужих данных можно сделать по завер­шении исследования, такой способ контроля называется апостериорным, т.е. осуществляемым после опыта.

В опросах Института Дж. Гэллапа репрезентативность контролируется по имеющимся в национальных переписях данным о распределении населения по полу, возрасту, образованию, доходу, профессии, расовой принадлежности, месту проживания, величине населенного пункта. Всероссийский центр изуче­ния общественного мнения (ВЦИОМ) использует для подобных целей такие показатели, как пол, возраст, образование, тип поселения, семейное положение, сфера занятости, должностной статус респондента, которые заимствуются в Государственном комитете по статистике РФ. В том и другом случае генераль­ная совокупность известна. Ошибку выборки невозможно установить, если неизвестны значения переменной в выборочной и генеральной совокупностях.

Специалисты ВЦИОМа обеспечивают при анализе данных тщательный ремонт выборки, чтобы минимизировать отклонения, возникшие на этапе полевых работ. Особенно сильные смещения наблюдаются по параметрам пола и возраста. Объясняется это тем, что женщины и люди с высшим обра­зованием больше времени проводят дома и легче идут на контакт с интер­вьюером, т.е. являются легко достижимой группой по сравнению с мужчи­нами и людьми «необразованными»28.

Ошибка выборки обусловливается двумя факторами: методом формиро­вания выборки и размером выборки.

Ошибки выборки подразделяются надватипа — случайные и систематиче­ские. Случайная ошибка — это вероятность того, что выборочная средняя вый-

В таком случае для того, чтобы при популяции в 100 000 получить 95%-ную доверительную вероятность того, что действительное распре­деление будет находиться в пределах 5% раз­личия от результатов выборки, нам потребу­ется выборка в 384 человека. Для 98%-ной до-

верительной вероятности объем требуемой выборки возрастет уже до 2345 человек. Если взять популяции большего размера — свы­ше 500 000, то требуемый размер выборки при 95%-ной доверительной вероятности и ошибки

репрезентативности плюс-минус 3% составит 1065 человек: выборка примерно такого объе­ма и используется в большинстве национальных опросов.

Заметьте, что для повышения точности выбор­ки требуется заметное увеличение ее объема. Например, в случае большой популяции для перехода от доверительного интервала плюс-минус 4% к плюс-минус 2% при 95%-ной дове­рительной вероятности потребуется увеличить объем выборки с 600 до 2390, то есть почти вчетверо.

Ясно, что точность стоит дорого, поскольку за­траты на проведение опроса больше всего свя­заны с объемом выборки. Итак, мы усвоили следующее:

1) для получения выборки необходимо опреде­лить генеральную совокупность;

2) нам надо избрать нужную степень точности;

3) на основе этих двух характеристик мы можем определить необходимый объем выборки. Сокращено по источнику: Гоуайзер Ш., Уитт Э. Путеводитель журналиста по опросам обще­ственного мнения. М.: Вагриус, 1997. С. 195-199.

Экономические и социальные перемены: Мониторинг общественного мнения: Информационный бюллетень / Междисциплинарный академический центр социальных наук; Всероссийский центр изучения общественного мнения. М.: АО «Аспект-Пресс», 1993. С. 10.

Б7Б

дет (или не выйдет) за пределы заданного интервала. К случайным ошибкам относят статистические погрешности, присущие самому выборочному методу. Они уменьшаются при возрастании объема выборочной совокупности (табл. 7).

Таблица 7 Зависимость объема выборки от ее ошибки29

(размер генеральной совокупности составляет 20 тыс. единиц)

 

рошйбка выборки, %                          
"Объем выборки, ед.                          

Второй тип ошибок выборки — систематические ошибки. Если социолог решил узнать мнение всех жителей города о проводимой местными органа­ми власти социальной политике, а опросил только тех, у кого есть телефон,

то возникает предумышленное смеще­ние выборки в пользу зажиточных сло­ев, т.е. систематическая ошибка.

Таким образом, систематические ошибки — результат деятельности само­го исследователя. Они наиболее опасны, поскольку приводят к довольно значительным смещениям результатов ис­следования30. Систематические ошибки считаются страшнее случайных еще и потому, что они не поддаются контролю и измерению.

Они возникают, когда, например: 1) выборка не соответствует задачам ис­следования (социолог решил изучить только работающих пенсионеров, а опро­сил всех подряд); 2) налицо незнание характера генеральной совокупности (со­циолог думал, что 70% всех пенсионеров не работает, а оказалось, что не рабо­тает только 10%); 3) отбираются только «выигрышные» элементы генеральной совокупности (например, только обеспеченные пенсионеры).

Обобщив все случаи, когда происходят систематические ошибки, методисты составили их реестр. Они полагают, что источником неконтролируемых переко­сов в распределении выборочных наблюдений могут быть следующие факторы:

♦ нарушены методические и методологические правила проведения со­циологического исследования;

♦ выбраны неадекватные способы формирования выборочной совокуп­ности, методы сбора и расчета данных;

♦ произошла замена требуемых единиц наблюдения другими, более до­ступными;

♦ отмечен неполный охват выборочной совокупности (недополучение ан­кет, неполное их заполнение, труднодоступность единиц наблюдения).

Намеренные ошибки социолог допускает редко. Чаще ошибки возника­ют из-за того, что социологу плохо известна структура генеральной совокуп­ности: распределение людей по возрасту, профессии, доходам и т.д.

Систематические ошибки легче предупредить (по сравнению со случайными), но их очень трудно устранить. Предупреждать систематические ошибки, точнс предвидя их источники, лучше всего заранее — в самом начале исследования.

29 Источник: http://www.anriintern.com/marketing/choice.html

30 Эдельгауз Г.Е. Точность, надежность и устойчивость экономических показателей. Л.: Изд-во ЛГУ1971. С. 10.

Б77

Вот некоторые способы избежать ошибок:

♦ каждая единица генеральной совокупности должна иметь равную ве­роятность попасть в выборку;

♦ отбор желательно производить из однородных совокупностей;

♦ надо знать характеристики генеральной совокупности;

♦ при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.

Если выборочная совокупность (или просто выборка) составлена правиль­но, то социолог получает надежные результаты, характеризующие всю гене­ральную совокупность. Если она составлена неправильно, то ошибка, возник­шая на этапе составления выборки, на каждом следующем этапе проведения социологического исследования приумножается и достигает в конечном сче­те такой величины, которая перевешивает ценность проведенного исследова­ния. Говорят, что от такого исследования больше вреда, нежели пользы.

Самый простой способ избежать или уменьшить вероятность ошибки — увеличить размеры выборки (в идеале до объема генеральной: когда обе со­вокупности совпадут, ошибка выборки вообще исчезнет). Экономически такой метод невозможен. Остается другой путь — совершенствовать матема­тические методы составления выборки. Можно воспользоваться расчетами Института Гэллапа для оценки соотношения размеров выборки и ошибки выборки (табл. 6).




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 3128; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.1 сек.