Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Определение объема выборки




Допустим, мы определились с составом выборки исследуемых объектов. Теперь нужно определить ее величину, или объем. Этот объем выборки зависит от следующих факторов.

Первый – степень однородности генеральной совокупности. Речь идет о том, насколько члены генеральной совокупности совпадают между собой по изучаемым свойствам. Например, если все члены генеральной совокупности одной национальности, одного возраста, образования, семейного положения, все как один собиратели этикеток со спичечных коробков с одинаковыми марками автомобилей и уровнем достатка и т. д., то в идеале репрезентативная выборка может состоять из одного человека. Но если, наоборот, каждый индивидуум не похож на другого по всем интересующим нас параметрам, то репрезентативная выборка совпадет с генеральной совокупностью. В первом случае генеральная совокупность будет полностью гомогенной, во втором – полностью гетерогенной. Обычно реальные генеральные совокупности располагаются между этими двумя крайними позициями. Но ясно, что действует правило: чем более гомогенной является генеральная совокупность, тем меньшей по объему может быть репрезентативная выборка; и чем более гетерогенной является генеральная совокупность, тем больше по объему должна быть репрезентативная выборка.

Но можно сформулировать степень гетерогенности выборки иначе: чем больше вопросов в анкете и чем более разнообразные варианты ответов, тем больше по объему должна быть репрезентативная выборка.

Допустим, в нашей анкете 20 вопросов, каждому вопросу соответствует в среднем 5 вариантов ответа: «Да», «Скорее да, чем нет», «Скорее нет, чем да», «Нет», «Затрудняюсь ответить».

Всего получается 100 вариантов ответов (5 х 20). Каждый вариант ответа, чтобы он был значимым для установления связей, должны указать (в идеале) как минимум 25 респондентов. Таким образом, получается, что общее число заполненных анкет должно быть 2 500 штук.

Но представим, что в анкете всего 10 вопросов. Тогда уменьшается требуемое число заполненных анкет, теперь их должно быть 1250 (5 х 10 х 25).

Второе. Свойства любой выборки, даже близкой по размерам с генеральной совокупности, не будут совершенно теми же, что и свойства самой генеральной совокупности. Это несоответствие между свойствами выборки и свойствами генеральной совокупности называется ошибкой выборки. Какой должна быть допустимая ошибка, чтобы выборка все же считалась репрезентабельной?

Это зависит от характера исследования. Допустим, мы проводим опрос избирателей, чтобы уточнить шансы на победу двух кандидатов на выборах мэра города. Из результатов ранее проведенных опросов известно, что распределение предпочтений избирателей находится в пропорции примерно 49 и 51%. Это значит, что мы в своем исследовании точно не должны допустить, чтобы ошибка выборки была больше 1%. Действительно, при такой ошибке может получиться ситуация 50 на 50 (49% + 1% и 51% – 1%) или ситуация 48 на 52% (49% – 1 % и 51% + 1%), и это усложнит получение каких-либо определенных выводов. А если ошибка выборки будет еще больше, то мы точно не сможем сказать что-либо определенное по поводу шансов кандидатов на победу.

Но пусть предварительные прикидки говорят, что у кандидатов разрыв в шансах 20 и 80%. Тогда мы можем разрешить себе ошибку выборки даже в 10%. Действительно, в крайнем случае мы получим в результате исследования соотношение 30 и 70% (20% + 10% и 80% – 10%). То есть даже с такой ошибкой выборки мы вполне сможем уловить масштаб различия между кандидатами.

Но, разумеется, в любом случае, будь это ошибка в ±10% или ±1%, соответствующая этой ошибке часть выборки должна быть достаточно ощутимой по величине. Допустим, что наша выборка состоит из 1000 объектов. Тогда ошибке выборки в 1% будет соответствовать всего 10 объектов, которые могут оказаться в пределах случайной погрешности измерения. Если же объем выборки будет равен 5000 объектов, то даже 1% будет соответствовать 50 объектам, которые уже с меньшей вероятностью могут оказаться результатом погрешности измерения.

Вывод: чем меньшую ошибку выборки мы можем себе позволить, тем больше по объему должна быть выборка.

Третье. Каждая выборка дает информацию о свойствах генеральной совокупности с той или иной ошибкой выборки. Однако очевидно, чем больше по объему будет выборка, тем с большей вероятностью мы обеспечим желаемую ошибку выборки. Вероятность, с которой мы можем получить заданную ошибку выборки, называют доверительной вероятностью.

Итак, объем выборки в конечном счете зависит от величины ошибки, которую мы можем себе позволить, и от выбранной доверительной вероятности, с которой свойства нашей выборки должны совпадать со свойствами генеральной совокупности в пределах заданной величины ошибки.

Объединяя второе и третье требования, можно сказать так: чем меньше должна быть ошибка выборки и больше доверительная вероятность, тем больше должна быть по объему выборка.

Чаще всего принимают доверительную вероятность равной 0,95 или 0,997.[13] Число 0,95 означает, что только в 5 случаях из 100 ошибка выборки может выйти за желаемый размер. Число 0,997 означает, что только в 3 случаях из 1000 ошибка выборки может выйти за желаемый размер.

Объединим оба фактора в таблицах 7.3, 7.4 и 7.5.[14] В них указаны минимальные объемы простых случайных выборок с разными уровнями ошибки выборки и доверительными вероятностями при генеральных совокупностях в 5000 объектов, 10 000 объектов и больше 100 000 объектов.

 

Таблица 7.3

 

Объемы выборок при генеральной совокупности 5 000 объектов

 

Ошибка выборки Доверительная вероятность
0,95 0,997
±1% + +
±2% 1 667 +
±3%    
±4%    
±5%    
±10%  

 

Знак + в третьем столбце означает, что выборка должна быть по объему по крайней мере больше, чем 50% генеральной совокупности. Например, при ошибке выборки ± 1% и при доверительной вероятности 0,95 выборка должна быть больше 2500 объектов.

 

Таблица 7.4

 

Объемы выборок при генеральной совокупности 10 000 объектов

 

Ошибка выборки Доверительная вероятность
0,95 0,997
±1% 5 000 +
±2% 2 000  
±3% 1 000  
±4%    
±5%    
±10%  

 

Таблица 7.5

 

Объемы выборок при генеральной совокупности 100 000 объектов и больше

 

Ошибка выборки Доверительная вероятность
0,95 0,997
±1% 10 000 22 500
±2% 2 500 5 625
±3% 1 111 2 500
±4%   1 406
±5%    
±10%  

 

Таблицы показывают, что объемы минимальной репрезентативной выборки растут не прямо пропорционально размерам генеральной совокупности. Например, при величине генеральной совокупности 5000, 10 000 и 100 000 и больше при одной и той же ошибке выборки 3% и доверительной вероятности 0,95 мы обнаруживаем лишь незначительное увеличение объема выборок: соответственно 909, 1000 и 1111 объектов.

Покажем, как пользоваться таблицами. Допустим, что нас устраивает ошибка выборки в ±4% при доверительной вероятности 0,997. Мы видим, что данным параметрам соответствует при генеральных совокупностях 5 000, 10 000 и больше 100 000 объектов минимальные выборки объемом соответственно 1098, 1233 и 1406 объектов.

При той же допустимой ошибке, но доверительной вероятности 0,95 минимальные выборки равны 556, 588 и 625 объектам.

Таблицу можно использовать иначе. Например, мы решили исследовать выборку, состоящую из 2 000 объектов при генеральной совокупности в 10 000 объектов. Тогда мы обнаруживаем, что эта выборка дает ошибку ±2% с доверительной вероятностью 0,95 или ошибку выборки ±3% с доверительной вероятностью 0,997. Каждый из этих вариантов одинаково приемлем[15].

Очень часто в реальных исследованиях довольствуются доверительной вероятностью 0,95 и ошибкой в 2%. Это означает, что наиболее используемой является выборка объемом 2 500 объектов при генеральной совокупности объемом 100 000 и больше объектов.

 




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 902; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.