Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Вопрос№12




Теоретические основы выборочного наблюдения

Теория выборочного наблюдения базируется на статистических закономерностях, которые формируются и обнаруживаются в массовых явлениях и процессах. Это свойство закономерностей получило название закона больших чисел. Математической основой закона больших чисел, да и статистической науки в целом, служит теория вероятностей. Последняя представляет собой раздел математики, в котором изучаются случайные явления (события), имеющие устойчивую частость, а следовательно, и вероятность, что помогает выявлять закономерности при массовом повторении явлений.

Поскольку за внешними случайными явлениями стоят скрытые законы, то данные, характеризующие эти явления, должны распределяться определенным образом. Исходя из закона больших чисел, чем больше изученная совокупность случайных явлений, тем должно быть более упорядоченным распределение полученных данных.

Гистограмма, или полигон распределения, представляет собой ломаную кривую, характеризующую фактическое распределение полученных данных. Она позволяет выявить лишь приближенную картину распределения всей (генеральной) совокупности. Чем больше выборочное изучение, тем в большей мере будут сглаживаться влияние случайных причин и явственнее будет проступать действительная закономерность распределения. В этом случае кривая распределения фактических данных будет приближаться к теоретической кривой распределения.

В математической статистике теоретическую кривую распределения обычно называют кривой Лапласа-Гаусса, или нормальным распределением.

Нормальное распределение в чистом виде при выборочных исследованиях в социальных науках встречается нечасто. Тем не менее большинство распределений близки к нормальному. Фактическое распределение выборочных показателей отличается от теоретического, главным образом, нарушением симметрии, т. е. если в нормальном распределении частоты анализируемого признака убывают по обе стороны от вершины кривой равномерно, то в фактическом распределении вершина кривой может быть смещена влево или вправо от теоретической средней, быть крутой с одной стороны и пологой -- с другой. Причина таких смещений -- ошибки наблюдения и сбора данных Герчук Я.П. Графики в математико-статистическом анали-зе. - М.: Статистика, 1992. - С.115.

Распределение показателей характеризуется размахом вариации и отклонением от средней.

Размах вариации (колебаний) -- наиболее простой параметр измерения разброса значений варьирующего признака. Он исчисляется по формуле R = Хтт -- Хт.п.

Но при одном и том же размахе вариации совокупности могут существенно различаться по структуре, т. е. быть более или менее однородными.

Наиболее полная характеристика распределения раскрывается через значение отклонения всех вариант от средней или значение отклонения эмпирических вариант от теоретических. Причем важно не столько отклонение каждой варианты от средней, сколько среднее отклонение всех вариант от средней, или дисперсия (колеблемость, пестрота) изучаемого признака.

Средние величины -- наиболее распространенные показатели в статистике. Это объясняется тем, что только с помощью средней можно охарактеризовать совокупность по количественно варьирующему признаку. Приведем пример, характерный для студенческой аудитории. Строгое сравнение по баллам успеваемости студентов двух или более учебных групп нельзя произвести по оценкам одного или нескольких студентов из каждой группы. Но, рассчитав средний балл по группам, можно точно сопоставить их по успеваемости.

Средняя величина может раскрыть лишь общую тенденцию изучаемого явления и только тогда, когда она выведена из большого числа фактов и при изучении однородной совокупности. При несоблюдении этих условий средние показатели лишь введут в заблуждение. Примером такого несоответствия может служить средняя заработная штата в нашей стране, когда в одну совокупность зачисляют и богатых, и бедных, разрыв в уровне обеспечения которых в 1997 г. составил соответственно 24:1.

В статистике разработано множество средних величин: степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая и др.), мода и медиана. Каждая из средних выполняет свои аналитические функции. Для расчета дисперсии и других показателей выборочного наблюдения нам необходима лишь средняя арифметическая.

Средний арифметический показатель -- наиболее распространенный вид средних. Он используется в качестве центрального значения в рядах распределения и выполняет функцию теоретической вероятности. Все другие варианты расцениваются как случайные отклонения от него. Чем больше отклоняется какое-либо значение признака от среднего арифметического, тем более случайным оно является.

Средняя арифметическая лежит в основе расчета дисперсии (колеблемости), которая представляет собой не что иное, как значение отклонения всех вариант от средней. Значение дисперсии и предопределяет объем выборочной совокупности. Чем больше дисперсия, тем больше разброс показателей от средней, а следовательно, нужен больший объем выборки, чтобы она была достаточно репрезентативной. Репрезентативность (представительность) объема выборки практически не зависит от объема генеральной совокупности. Последняя может быть даже не известна исследователю. Предположим, что мы изучаем пьянство (как фактор преступности) в нашей стране. При выборочном изучении пьяниц мы не можем располагать их более или менее точным количеством в стране, республике и даже городе. Но это не будет служить большой помехой для расчета ошибки выборки или объема выборочной совокупности. При расчете этих показателей определяющей является значение дисперсии изучаемого признака, и ее надо уметь рассчитывать. Расчет дисперсии качественных и количественных признаков неодинаков. Определение объема и представительности выборочной совокупности, а следовательно, и дисперсии производится не к самим явлениям, а лишь к их конкретным показателям. Последние могут быть качественными, или атрибутивными и количественными. Каждый признак имеет свою дисперсию, а следовательно, и необходимый объем выборки для надежного изучения. Это значит, что при выборочном изучении многих признаков, чтобы выявить совокупные отклонения, дисперсию надо рассчитывать по каждому из них. Иногда эти признаки исчисляются десятками и даже сотнями. Чтобы избежать множества расчетов, можно ограничить их только в отношении тех признаков, на базе которых делаются основные выводы. Общая численность выборки или ее общая репрезентативность определяются по совокупной представительности всех параметров.

Дисперсия -- это средний квадрат отклонения изучаемого признака от теоретического (среднего) показателя. Она характеризует уровень однородности исследуемой совокупности и обозначается символом «02» (сигма малая в квадрате). Расчет ее применительно к качественным признакам производится по одной формуле, а применительно к количественным -- по другой. Рябушкин Т.В., Ефимова М.Р., Ипатова И.М., Яковлева Н.И. Общая теория статистики. - М.: Финансы и статистика, 2001. - С.123

Второй общепринятой мерой вариации признака является среднее квадратическое отклонение. Оно обозначается символом «0» (сигма малая без квадрата) и выводится как самостоятельно, так и на основе среднего квадрата отклонений, т. е. дисперсии, которая обозначается «02» (сигма малая в квадрате). Среднее квадратическое отклонение всегда выражается в тех именованных числах, в которых выражены варианта и средняя.

Теоретические основы выборочного наблюдения

Понятие выборочного наблюдения и его задачи

Тема «выборочное наблюдение» является одной из центральных в курсе теории статистики. Это обусловлено, прежде всего, взаимосвязью данной темы с другими темами, в особенности, со статистическим наблюдением, статистическими показателями, таблицами, графиками и др. Основываясь на фундаментальных теоретических положениях, в частности, предельных теоремах закона больших чисел (Чебышева – Ляпунова, Бернулли и др.), выборочное наблюдение тесно связано с курсами математической статистики и теории вероятностей.

Целью выборочного наблюдения является определение характеристик генеральной совокупности – генеральной средней (x¯) и генеральной доли (p). Характеристики выборочной совокупности – выборочная средняя (x*) и выборочная доля (ω) отличаются от генеральных характеристик на величину ошибки выборки (Δ). Поэтому для определения характеристик генеральной совокупности необходимо вычислять ошибку репрезентативности, которая определяется по формулам, разработанным в теории вероятностей для каждого вида выборки и способа отбора.

Статистическое наблюдение можно организовать сплошное и несплошное.

Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности и связано большими трудовыми и материальными затратами. Изучение не всех единиц совокупности, а лишь некоторой части, по которой следует судить о свойствах всей совокупности в целом, можно осуществить несплошным наблюдением. В статистике результаты сплошного наблюдения иногда оцениваются как выборочные характеристики. Такая трактовка полученных данных имеет место в тех случаях, когда число обследованных единиц невелико и нет твердой уверенности в том, что изучаемые характеристики не могут принимать иных значений, кроме выявленных в результате наблюдения. При проведении экспериментов число значений может быть бесконечно большим, поэтому, формулируя выводы на основе ограниченного их числа, необходимо рассматривать полученные данные как выборочные характеристики.

В статистической практике самым распространенным является выборочное наблюдение.

Выборочное наблюдение – это такое несплошное наблюдение, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, отобранная часть изучается, а результаты распространяются на всю исходную совокупность. Наблюдение организуется таким образом, что эта часть отобранных единиц в уменьшенном масштабе репрезентирует (представляет) всю совокупность.

Совокупность, из которой производится отбор, называется генеральной, и все ее обобщающие показатели - генеральными.

Совокупность отобранных единиц именуют выборочной совокупностью, и все ее обобщающие показатели – выборочными.

Имеется ряд причин, в силу которых, во многих случаях выборочному наблюдению отдается предпочтение перед сплошным. Наиболее существенны из них следующие:

- экономия времени и средств в результате сокращения объема работы;

- сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность);

- необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей);

- достижение большой точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации.

Преимущество выборочного наблюдения по сравнению со сплошным можно реализовать, если оно организованно и проведено в строгом соответствии с научными принципами теории выборочного метода. Такими принципами являются: обеспечение случайности (равной возможности попадания в выборку) отбора единиц и достаточного их числа. Соблюдение этих принципов позволяет получить объективную гарантию репрезентативности полученной выборочной совокупности. Понятие репрезентативности отобранной совокупности не следует понимать как ее представительство по всем признакам изучаемой совокупности, а только в отношении тех признаков, которые изучаются или оказывают существенное влияние на формирование сводных обобщающих характеристик.

При случайности отбора каждая единица совокупности должна иметь равную вероятность попасть в выборку. На практике не всегда удается обеспечить соблюдение данного принципа. Для этого необходимо учесть все элементы генеральной совокупности. Например, невозможно пронумеровать все домашние хозяйства или все население страны, так как это очень большая совокупность и состав ее постоянно меняется. В таких случаях прибегают к методике неслучайного отбора, стараясь, чтобы элементы случайности присутствовали. Примером такого отбора служит механическая выборка, при которой вся исследуемая совокупность предварительно упорядочивается и правило выбора из нее отдельных единиц устанавливает исследователь.

Выборочный метод наблюдения широко используется на практике как в области естественных наук для оценки результатов экспериментов, так и в экономике. Госкомстат России проводит выборочные обследования бюджетов домашних хозяйств, потребительских ожиданий населения, обследования населения по проблемам занятости и др. На выборочной основе организовано статистическое наблюдение за деятельностью малых предприятий, за их деловой активностью, наличием и движением основных фондов. Выборочный метод используется также при изучении объема и состава затрат организаций на рабочую силу. Сфера применения этого метода постоянно расширяется, что связано с рядом его преимуществ.

Во-первых, выборочный метод обеспечивает значительную экономию материальных и финансовых ресурсов при проведении статистического наблюдения, что позволяет расширить программу обследования и повысить его оперативность. Второе преимущество – высокая достоверность получаемых данных, так как при относительно небольшом объеме выборки можно организовать эффективный контроль за качеством собираемой информации. Таким образом, при использовании выборочного метода снижается вероятность появления ошибок регистрации и необнаружения их на стадии проверки первичной информации. И, наконец, в ряде случаев, когда сплошное наблюдение связано с уничтожением или порчей обследуемых единиц (например, при проверке качества поступающих в продажу продуктов питания), возможно только выборочное обследование.

Точность оценок, полученных на основе выборочного метода, зависит не от доли обследованных единиц, а от их числа. Если объем генеральной совокупности достаточно велик, то доля отобранных для наблюдения единиц может быть очень небольшой, а точность оценок – высокой. Например, выборочное обследование по проблемам занятости в России охватывает около 0,2% населения в возрасте от 15 до 72 лет, но обеспечивает высокую точность оценок параметров генеральной совокупности. Если же объем такой совокупности невелик, то эффект от применения выборочного наблюдения может выражаться не столько в экономии материальных ресурсов, сколько в повышении качества собираемой исходной информации. Для получения несмещенной оценки в этом случае процент отбора должен быть значительно больше. Под несмещенной оценкой подразумевается такая характеристика выборочной совокупности, математическое ожидание которой совпадает с ее значением в генеральной совокупности.

Основная задача выборочного наблюдения в экономике состоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При этом следует иметь в виду, что при любых статистических исследованиях (сплошных и выборочных) возникают ошибки двух видов: регистрации и репрезентативности.

Ошибки регистрации могут иметь случайный (непреднамеренный) и систематический (тенденциозный) характер. Случайные ошибки обычно уравновешивают друг друга, поскольку не имеют преимущественного направления в сторону преувеличения или преуменьшения значения изучаемого показателя. Систематические ошибки направлены в одну сторону вследствие преднамеренного нарушения правил отбора (предвзятые цели). Их можно избежать при правильной организации и проведении наблюдения.

Ошибки репрезентативности присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Они представляют собой расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при проведенном с одинаковой степенью точности сплошном наблюдении, т.е. между величинами выборных и соответствующих генеральных показателей.

Для каждого конкретного выборочного наблюдения значение ошибки репрезентативности может быть определено по соответствующим формулам, которые зависят от вида, метода и способа формирования выборочной совокупности.

По виду различают индивидуальный, групповой и комбинированный отбор. При индивидуальном отборе в выборочную совокупность отбираются отдельные единицы генеральной совокупности; при групповом отборе – качественно однородные группы или серии изучаемых единиц; комбинированный отбор предполагает сочетание первого и второго видов.

По методу отбора различают повторную и бесповторную выборки.

При повторной выборке общая численность единиц генеральной совокупности в процессе выборки остается неизменной. Ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе единиц вновь попасть в выборку («отбор по схеме возвращенного шара»). Повторная выборка в социально-экономической жизни встречается редко. Обычно выборку организуют по схеме бесповторной выборки.

При бесповторной выборке единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует; т.е. последующую выборку делают из генеральной совокупности уже без отобранных ранее единиц («отбор по схеме невозвращенного шара»). Таким образом, при бесповторной выборке численность единиц генеральной совокупности сокращается в процессе исследования.

Способом отбора определяется конкретный механизм или процедура выборки единиц из генеральной совокупности.

По степени охвата единиц совокупности различают большие и малые (n<30) выборки.

Основные характеристики параметров генеральной и выборочной совокупностей обозначаются символами:

N – объем генеральной совокупности (число входящих в нее единиц);

n – объем выборки (число обследованных единиц);

x – генеральная средняя (среднее значение признака в генеральной совокупности);

x* - выборочная средняя;

p – генеральная доля (доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности);

w – выборочная доля;

s²- генеральная дисперсия (дисперсия признака в генеральной совокупности);

σ² - выборочная дисперсия того же признака;

σ – среднее квадратическое отклонение в выборке;

s – среднее квадратическое отклонение в генеральной совокупности.

Виды выборочного исследования

В практике выборочных исследований наибольшее распространение получили следующие виды выборки: собственно-случайная, механическая, типическая, серийная, комбинированная.

При выборочном наблюдении должна быть обеспечена случайность отбора единиц. Каждая единица должна иметь равную с другими возможность быть отобранной. Именно на этом основывается собственно – случайная выборка.

К собственно – случайной выборке относится отбор единиц из всей генеральной совокупности (без предварительного расчленения ее на какие – либо группы) посредством жеребьевки (преимущественно) или какого – либо иного подобного способа, например, с помощью таблицы случайных чисел. Случайный отбор – это отбор не беспорядочный. Принцип случайности предполагает, что на включение или исключение объекта из выборки не может повлиять какой – либо фактор, кроме случая. Примером собственно – случайного отбора могут служить тиражи выигрышей: из общего количества выпущенных билетов наугад отбирается определенная часть номеров, на которые приходятся выигрыши. Причем всем номерам обеспечивается равная возможность попадания в выборку. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.

Доля выборки есть отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:

Кв. = n / N.

Собственно – случайный отбор «в чистом виде» применяется в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.

Рассмотрим некоторые вопросы теории выборочного метода, и формулы ошибок для простой случайной выборки.

Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину количественного признака и относительную величину альтернативного признака (долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака).

Выборочная доля w, или частость, определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности n: w = m / n.

Например, если из 100 деталей выборки (n = 100), 95 деталей оказались стандартными (m = 95), то выборочная доля w = 95 / 100 = 0.95. Даже в том случае, если отбор единиц проведен правильно, выборочные показатели не всегда совпадают с искомыми параметрами генеральной совокупности. Разница между показателями генеральной и выборочной совокупности называется ошибкой выборки. Общая величина возможной ошибки выборочной характеристики слагается из ошибок двух видов: ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации присущи любому статистическому наблюдению, и появление их может быть вызвано несовершенством измерительных приборов, недостаточной квалификацией наблюдателя, неточностью подсчетов.

Ошибки репрезентативности характерны только для несплошного наблюдения. Они могут быть систематическими и случайными. Систематические ошибки могут появляться в связи с особенностями применяемых способов отбора и обработки данных или в связи с нарушением установленных правил отбора. Случайные ошибки репрезентативности возникают в связи с недостаточно равномерным представлением в выборочной совокупности различий единиц генеральной совокупности.

Особенность выборочного наблюдения состоит в том, что величину этих ошибок можно рассчитать и решить вопрос о целесообразности выборки.

Ошибка выборки зависит от численности выборки и от вариации признака в генеральной совокупности. Чем больше численность выборки, тем меньше ошибка, чем больше вариация признака, тем больше ошибка.

При расчете средней ошибки случайной бесповторной выборки необходимо учитывать поправку на бесповторность отбора.

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки ε или, иначе говоря, ошибка репрезентативности представляет собой разность соответствующих выборочных и генеральных характеристик:

для средней количественного признака

ε = | x* - x |;

для доли (альтернативного признака)

ε = | w – p |;

Ошибка выборки свойственна только выборочным наблюдениям. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих генеральных показателей.

Выборочная средняя и выборочная доля по всей сути являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок – среднюю ошибку выборки μ.

Средняя ошибка выборки – это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т. е. от своего математического ожидания.

От чего зависит средняя ошибка выборки?

При собственно случайном повторном отборе средняя ошибка выборки зависит от:

• вариации изучаемого признака в генеральной совокупности;

• объема выборки;

Чем больше вариация признака, тем больше ошибка выборки. Для ее уменьшения необходимо увеличить объем выборочной совокупности.

Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки ∆. Она определяется в долях средней ошибки с заданной вероятностью, т. е. ∆ = tμ

где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.

При вероятности: Таблица 1.

Р(t) = 0,683 t =1

Р(t) = 0,866 t =1,5

Р(t) = 0,954 t =2

Р(t) = 0,988 t =2,5

Р(t) = 0,997 t = 3

Р(t) = 0,999 t = 3,5

При собственно случайном бесповторном отборе средняя ошибка выборки зависит от:

• вариации изучаемого признака;

• объема выборки;

• доли обследованных единиц.

Чем больше объем выборки и доля обследованных единиц, тем меньше ошибка выборки; вариация признака связана с ней прямо пропорционально.

Если доля обследованных единиц невелика, то дополнительный множитель под знаком радикала практически не влияет на ошибку выборки. В этом случае ошибку выборки при бесповторном отборе можно найти по формулам, которые применяются при повторном отборе.

Наряду с абсолютной величиной средней и предельной ошибок выборки в статистической практике используется относительная их величина, рассчитываемая как отношение ошибки к исследуемому параметру: ∆отн = ∆ ⁄ x или ∆отн = ∆ ⁄ p. Теоретически в знаменателе должно быть значение исследуемого параметра генеральной совокупности. Однако оно неизвестно, поэтому относительная ошибка рассчитывается через соответствующий параметр выборки: ∆отн = ∆ ⁄ x* или ∆отн = ∆ ⁄ w. Относительная ошибка выражается в процентах. Выборка считается репрезентативной, если ∆отн <=5%.

При соблюдении принципа случайного отбора средняя ошибка выборки определяется, прежде всего, объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, все более точно характеризуем всю генеральную совокупность.

Средняя ошибка также зависит от степени варьирования изучаемого признака. Степень варьирования, как известно, характеризуется дисперсией σ² или w (1−w) – для альтернативного признака. Чем меньше вариация признака, а, следовательно, и дисперсия, тем меньше средняя ошибка выборки, и наоборот. При нулевой дисперсии (признак не варьирует) средняя ошибка выборки равна нулю, т.е. любая единица генеральной совокупности будет совершенно точно характеризовать всю совокупность по этому признаку.

Зависимость средней ошибки выборки от ее объема и степени варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики (x, р) неизвестны, и, следовательно, не представляется возможным нахождение реальной ошибки выборки непосредственно по формулам.

Поскольку практически дисперсия признака в генеральной совокупности σ² точно неизвестна, на практике пользуются значением дисперсии S², рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.

Таким образом, расчетные формулы средней ошибки выборки при случайном повторном отборе будут следующие:

Для средней количественного признака

μ = √S² / n;

Для доли (альтернативного признака)

μ = √w(1- w)/n

Однако дисперсия выборочной совокупности не равна дисперсии генеральной совокупности, и, следовательно, средние ошибки выборки, рассчитанные по формулам (2.3) и (2.4), будут приближенными. Но в теории вероятностей доказано, что генеральная дисперсия выражается через выборную следующим соотношением: σ² = S² n / n – 1

Так как n/(n-1) при достаточно больших n – величина, близкая к единице, то можно принять, что σ² приблизительно равен S², а, следовательно, в практических расчетах средних ошибок выборки можно использовать формулы (см выше). И только в случаях малой выборки (когда объем выборки не превышает 30) необходимо учитывать коэффициент

n/(n-1) и исчислять среднюю ошибку малой выборки по формуле:

μ= √S²/n-1

При случайном бесповторном отборе в приведенные выше формулы расчеты средних ошибок выборки необходимо подкоренное выражение умножить на 1-(n / N), поскольку в процессе бесповторной выборки сокращается численность единиц генеральной совокупности. Следовательно, для бесповторной выборки расчетные формулы средней ошибки выборки примут такой вид:

Для средней количественного признака

μx̃ = √S² / n (1-(n / N));

Для доли (альтернативного признака)

μw = √w(1-w)/n (1-(n/ N))

Так как n всегда меньше N, то дополнительный множитель 1-(n / N) всегда будет меньше единицы. Отсюда следует, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к единице (например, при 5 %-ной выборке он равен 0.95; при 2%-ной – 0.98 и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности N, и по существу, введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.

Суть случайной выборки состоит в том, что из генеральной совокупности отбирают нужное количество единиц наудачу, соблюдая принцип случайности. Случайная выборка позволяет дать объективную оценку генеральной совокупности.

Механическая выборка состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по нейтральному признаку на равные интервалы (группы), производится таким образом, что из каждой такой группы в выборку отбирается лишь одна единица. Чтобы избежать систематической ошибки, отбираться должна единица, которая находится в середине каждой группы.

При организации механического отбора единицы совокупности предварительно располагают (обычно в списке) в определенном порядке (например, по алфавиту, местоположению, в порядке возрастания или убывания значений какого – либо показателя, не связанного с изучаемым свойством, и т.д.), после чего отбирают заданное число единиц механически, через определенный интервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки. Так, при 2 %-ной выборке отбирается и проверяется каждая 50-я единица (1: 0.02), при 5%-ной выборке – каждая 20-я единица (1: 0.05), например, сходящая со станка деталь.

При достаточно большой совокупности механический отбор по точности результатов близок к собственно – случайному. Поэтому для определения средней ошибки механической выборки используют формулы собственно – случайной бесповторной выборки.

Механический отбор – это отбор по заранее установленному принципу через определенный интервал. При механическом отборе всю генеральную совокупность делят на равные по числу группы и из каждой группы берут единицу обязательно под одним и тем же номером.

Для отбора единиц из неоднородной совокупности применяется так называемая типическая выборка.

Типическая выборка используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, от которых зависят изучаемые показатели.

При обследовании предприятий такими группами могут быть, например, отрасль и подотрасль, формы собственности. Затем из каждой типической группы собственно – случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Например, при выборочном обследовании семейных бюджетов рабочих и служащих в отдельных отраслях экономики, производительности труда рабочих предприятия, представленных отдельными группами по квалификации.

Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. Поэтому при определении средней ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.

Среднюю ошибку выборки находят по формулам:

Для средней количественного признака

μx̃ = √ S²i / n (повторный отбор);

μx̃ = √(S²i /n)(1-(n /N)) (бесповторный отбор);

для доли (альтернативного признака)

μw = √wi (1- wi) / n (повторный отбор);

μw = √(wi (1-wi) / n) (1-(n / N)) (бесповторный отбор);

где S²i – средняя из внутригрупповых дисперсий по выборочной совокупности;

________

wi(1-wi) – средняя из внутригрупповых дисперсий доли (альтернативного признака) по выборочной совокупности.

Типический отбор заключается в том, что сначала генеральная совокупность делится на типические группы по какому – либо существенному признаку, а затем внутри каждой группы проводится случайная выборка. Ошибка типической выборки меньше ошибки случайной выборки, а типическая выборка точнее случайной.

Серийная выборка предполагает случайный отбор из генеральной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с тем, чтобы в таких группах подвергать наблюдению все без исключения единицы.

Применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения и продажи упаковываются в пачки, ящики и т.п. Поэтому при контроле качества упакованного товара рациональнее проверить несколько упаковок (серий), чем из всех упаковок отбирать необходимое количество товара.

Поскольку внутри групп (серии) обследуются все без исключения единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.

Среднюю ошибку выборки для средней количественного признака при серийном отборе находят по формулам:

μx̃ = √ δ²x / r (повторный отбор);

μx̃ = √ δ²x / r (1-(r / R)) (бесповторный отбор);

где r – число отобранных серий; R – общее число серий.

Межгрупповую дисперсию серийной выборки вычисляют следующим образом:

δ²x = Σ (x̃i-x̃)² / r,

где x̃i – средняя i-й серии; x̃ – общая средняя по всей выборочной совокупности.

Средняя ошибка выборки для доли (альтернативного признака) при серийном отборе:

μw = √δ²w / r (повторный отбор);

μw = √ δ²w / r(1-(r / R)) (бесповторный отбор);

Межгрупповую (межсерийную) дисперсию доли серийной выборки определяют по формуле:

δ²w = Σ(wi-w¯)² / r;

где wi- доля признака в i-й серии; w¯ - общая доля признака во всей выборочной совокупности.

Серийный отбор состоит в том, что отбирают не единицы явления, а серии единиц, и изучают все единицы выбранных серий. Этот отбор применяют тогда, когда серии наиболее однородны.

В практике статистических обследований помимо рассмотренных ранее способов отбора применяется их комбинация (комбинированный отбор). Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов.

Выборочные средние и относительные величины распространяют на генеральную совокупность с учетом предела их возможной ошибки.

В каждой конкретной выборке расхождение между выборочной средней и генеральной, т.е. |x̃-x¯| может быть меньше средней ошибки выборки μ, равно ей или больше ее.

Причем каждое из этих расхождений имеет различную вероятность (объективную возможность появления события). Поэтому фактические расхождения между выборочной средней и генеральной |x̃-x¯| можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с определенной вероятностью P.

Предельную ошибку выборки для средней (Δx̃) при повторном отборе можно рассчитать по формуле: Δx̃= t*μ x̃ = t √ S² / n,

где t – нормированное отклонение – «коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки; μx̃ - средняя ошибка выборки.

Теоретические основы выборочного наблюдения. Выборочное наблюдение относится к несплошному виду наблюдения. Его суть закл.в отборе отдельных ед.обследуемой совокупности по специальным правилам, гарантирующие реализацию принципа случайного отбора с целью получения обобщающих характеристик изучаемого признака. Преимущества выборочного наблюдения: экономия средств, оперативность получения результатов, возможность расширения программы наблюдения, возможность проверки качества продукции, которая при этом уничтожается, высокая достоверность результатов. Статистическая совокупность из которой делают отбор, наз. генеральной статистической совокупностью. Совокупность, которая получилась в результате отбора единиц для наблюдения наз. выборочной статистической совокупностью. Различают следующие виды выборки: По способам организации выборки бывают: простая случайная, механическая, типическая, серийная и др. По степени охвата ед.совокупности различают: большие выборки, малые выборки.




Поделиться с друзьями:


Дата добавления: 2015-04-24; Просмотров: 1019; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.108 сек.