Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Объединение однородных выборок




ОБЪЕДИНЕНИЕ ВЫБОРОК

 

По возможности объединения информации из совокупности однотипных выборок можно выделить три типовые ситуации:

· различные слои представляют собой однородные выборки. Это является следствием однотипности объектов, близости режимов использования и одинаковости внешних воздействий на исследуемые средства. В такой идеализированной ситуации выборки можно объединить и определять искомые параметры, используя традиционный аппарат математической статистики. Данная ситуация предоставляет наибольшие возможности использования информации, содержащейся в ЭД, именно в таком случае удается достичь максимальной эффективности оценок показателей, т.е. объединение обеспечивает потенциальную возможность полного использования сведений, содержащихся в выборках;

· совокупность слоев частично неоднородна. Тогда однородные слои, если таковые обнаружатся, целесообразно объединить, а оставшиеся неоднородные группы выборок обрабатывать раздельно. В этой ситуации всю содержащуюся в выборках информацию полностью извлечь не удается. Однако существуют простые приемы получения некоторых оценок параметров распределения по совокупности неоднородных выборок;

· слои полностью или частично неоднородны. Но, в дополнение к результатам наблюдений, имеется априорная информация о взаимосвязи параметров Θi различных выборок. Такие взаимосвязи устанавливаются на основе изучения сущности процессов, протекающих в объектах, и могут задаваться различными способами – в виде аналитических соотношений, ограничений на значения параметров и т. п. Чем выше уровень априорной информированности о взаимосвязях параметров, тем потенциально более высокой эффективности оценок показателей можно достичь.

Следовательно, объединение слоев всегда следует начинать с проверки однородности выборок.

 

 

Простое объединение рекомендуется только для однородных выборок. Постановка задачи проверки однородности выборок формулируется следующим образом.

Имеются результаты наблюдений в виде совокупности выборок типа (6.1), задан уровень значимости a для проверки статистической гипотезы об однородности выборок.

Необходимо проверить однородность слоев.

Допущение: законы распределения случайных величин для различных слоев неизвестны.

Проверка однородности полной расслоенной выборки относительно сложна в реализации и не позволяет выделить те выборки, которые существенно различаются по своим свойствам. Более практично использовать последовательную процедуру проверки и попарного объединения выборок. В качестве исходной выборки можно взять любую, например, первую или наибольшую по количеству элементов. В качестве второй выбирается любая из оставшихся выборок. Эти две выборки проверяются на однородность. При ее наличии выборки объединяются в одну, а при ее отсутствии вторая выборка остается самостоятельной. Указанную проверку и объединение повторяют для всех слоев исходной выборки.

Определение однородности двух выборок проводится на основе проверки статистической гипотезы Н0 о том, что выборки и принадлежат одному, пусть и неизвестному, закону распределения. При этом применяют критерии знаков, критерий Вилкоксона (Вилкоксона – Мана – Уитни) и другие. Существенной особенностью критерия знаков является требование равного объема сравниваемых выборок, правда, это требование легко выполнить, "обрезав" при рассмотрении более длинную выборку (но такая операция приводит к потере части информации при сопоставлении выборок). В интересах решения поставленной задачи целесообразно применять второй критерий – критерий Вилкоксона.

Проверка однородности выборок по критерию Вилкоксона состоит в следующем. Пусть для случайной величины Х имеется выборка объема nx и для случайной величины Y выборка объема ny. По этим выборкам необходимо с уровнем значимости a проверить гипотезу Н0 о том, что функция распределения F(x) случайной величин Х равна функции распределения F(y) случайной величины Y. Конкурирующая гипотеза – функции распределения случайных величин различны: F(x) < F(y) или F(x) > F(y), т.е. критическая область двусторонняя.

Сущность проверки основана на простой идее: если верна гипотеза Н0,то нельзя ожидать преобладания наблюдений одной из выборок на любом из концов вариационного ряда, иначе говоря, результаты наблюдений из каждого слоя должны быть рассеяны по всему вариационному ряду. Такая проверка осуществляется только по порядковым соотношениям x > y и x < y между элементами выборок.

Далее считается, что объем первой выборки не превышает объема второй. Если это условие не выполняется, то выборки просто меняются местами. Проверка гипотезы однородности имеет свою специфику для разных объемов выборок.

Пусть nx >3, ny >3 и суммарный объем обеих выборок не превосходит 25. Проверка гипотезы осуществляется поэтапно:

· из выборок исключаются одинаковые элементы (вероятность совпадения элементов весьма невелика, поэтому число исключаемых членов выборок не будет большим);

· на основе элементов обеих выборок строится общий вариационный ряд, индексы и конкретные значения элементов можно опустить. В результате получится просто последовательность букв y и x, например xxxyxyyxxxyyy;

· подсчитывается сумма порядковых номеров u вариант первой (меньшей по объему) выборки. В приведенном примере nx > n y (nx = 7 и ny = 6), поэтому первой будем считать выборку для величины Y. Буква y встречается на четвертом, шестом, седьмом, одиннадцатом, двенадцатом и тринадцатом местах, следовательно

u =4+6+7+11+12+13=53.

Случайная величина u имеет распределение Вилкоксона. Для нее построена специальная таблица нижних критических точек распределения.

· по таблице критических точек для ny = 6, nx = 7, заданного уровня значимости, например a = 0,05 (критическая область двусторонняя, следовательно, каждая сторона критической области соответствует уровню значимости a /2 = 0,025), определяется нижняя критическая точка ин. В данном случае uн = 27;

· вычисляется верхняя критическая точка uв = (ny+nx+ 1) nyuн. Для рассматриваемого примера

uв = (6+7+1)6 – 27 = 57;

· если u < uн или u > uв, то нулевую гипотезу отвергают. В противном случае нет оснований для отклонения нулевой гипотезы. В приведенном примере нулевая гипотеза об однородности выборок принимается.

Сумма порядковых номеров вариант первой выборки с увеличением общего объема выборок стремится к нормальному распределению. Нормальное распределение можно применять, если nx >3, ny >3 и объем хотя бы одной из выборок превосходит 25. В таком случае значение нижней критической точки величины u при nx · ny

 

(6.2)

 

где t1– a/2 – квантиль уровня 1– a /2 стандартизованной нормальной случайной величины.

Остальные этапы проверки ничем не отличаются от рассмотренных выше, применительно к малому объему слоев.

В результате выполнения рассмотренных процедур однородные выборки будут объединены.




Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 341; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.