Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Составляющая дисперсионного анализа

Тема: ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА КАК

Поиск адреса электронной почты».

Поиск файла».

1) Ввести в поле поиска системы FTP Search имя файла ICQ2000. Существует возможность уточнить параметры поиска файла (тип файла, домен и др.) и параметры вывода списка найденных ссылок (количество, формат и др.).

2) Пользователю будет представлен список со ссылками на FTP-сервера, хранящих файл с заданным именем.

Активизация любой из ссылок приводит к началу процесса загрузки файла на локальный компьютер.

Www.whowhere.lycos.com является специализированной поисковой системой, позволяющей искать адрес электронной почты по имени человека или, наоборот, имя человека, хозяина определенного адреса электронной почты. В окно поиска необходимо ввести имя и фамилию, после чего система осуществит поиск e-mail адреса в базе данных, содержащей абонентов зарегистрированных в системе.

Ввести в поле поиска системы WhoWhere? имя и фамилию. Можно также ввести предполагаемый домен, в котором находится почтовый сервер.

Содержание отчета и его форма

Ознакомьтесь с теоретическим обоснованием. Выполните все описанные задания, письменно оформите отчет, который должен содержать:

- Тему, цель лабораторной работы,

- краткий конспект теоретического материала,

- перечень выполненных заданий,

- вывод.

Контрольные вопросы и защита работы

Контрольные вопросы:

- Что представляет собой поисковый сервер?

- Какие существуют поисковые системы общего назначения?

- Какие вы знаете специализированные поисковые системы?

Защита лабораторной работы включает:

- Выполнение работы на компьютере,

- ответы на контрольные вопросы,

- предоставление отчета.

 

1o. Цель планирования эксперимента

На примере дисперсионного анализа можно показать, что методы математической статистики не только сводятся к пассивной обработке результатов наблюдений, а могут активно регулировать процесс формирования выборки для повышения ее информативности.

Действительно, при дисперсионном анализе с увеличением числа факторов, воздействующих на признак генеральной совокупности, растет число необходимых наблюдений. Так, если имеется k таких факторов (А 1, А 2, …, Аk)причем j -й фактор действует на mj уровнях, то для проведения хотя бы по 2 наблюдения для каждой комбинацией уровней необходимо выполнить 2· m 1· m 2·…· mk наблюдений. Например, при k = 4 факторах и 5-ти уровнях каждого из них необходимо выполнить не менее 2·5·5·5·5 = 1250 наблюдений.

В связи с таким огромным числом требуемых наблюдений возникает задача планирования эксперимента с целью, во-первых, сделать число наблюдений по возможности, гораздо меньшим, а, во-вторых, получить достаточно аргументированные статистические выводы. Т.о., цель планирования эксперимента как составной части многофакторного дисперсионного анализа заключается в получении большего объема информации, минимизируя объем совокупной выборки.

Определим ход эксперимента.

В силу множественности действия независимых факторов на случайную величину генеральной совокупности Х на уровнях m 1; m 2; …; mk можно считать, что результат наблюдения всех k факторов на конкретном совмещенном уровней, представляющем определенную комбинацию уровней i 1, i 2, …, ik (где i 1 = , …, ik = ) является нормально распределенной величиной с неизвестным средним и неизвестной дисперсией s2, не зависящей от уровней действия факторов. Для линейной модели действия независимых факторов должно выполняться равенство = . Следовательно, планирование эксперимента можно сформулировать следующим образом: требуется указать все возможные комбинации (i 1, i 2, …, ik) совмещенных уровней действия факторов, позволяющих при не слишком большом числе наблюдений достаточно убедительно проверить гипотезы об отсутствии действия каждого фактора (как в отдельности, так и совместно с другими), т.е. гипотезы Н 0( s ): .

Планом эксперимента называется составленный перечень тех комбинаций (i 1, i 2, …, ik) s из всех возможных комбинаций совмещенных уровней, именно для которых потребуется произвести статистические наблюдения. Предполагается, что для каждой комбинации, входящей в план эксперимента, выполняется только одно наблюдение.

 

2o. Способы построения планов эксперимента [Бочаров П.П., Печинкин А.В. Математическая статистика: Учебное пособие. – М.: Изд-во РУДН, 1994. – 164 с. ]

Рассмотрим случай, когда число уровней действия для всех факторов одинаково, т.е. m 1 = m 2 = … = mk = т. Потребуем, чтобы для любых факторов Аj 1и Aj 2и уровней их действия ij 1и ij 2в план эксперимента входила, по крайней мере, одна комбинация, содержащая пару ij 1и ij 2, т.е. хотя бы в одном наблюдении фактор Аj 1подействовал на уровне ij 1, а фактор Aj 2– на уровне ij 2. С другой стороны, для минимизации числа наблюдений целесообразно ограничиться только планами, в которых каждая пара (ij 1, ij 2) уровней действия факторов Аj 1и Aj 2встречается не более одного раза. Т.е. согласно этим двум требованиям получаем, что каждая пара уровней двух любых факторов должна входить в план эксперимента ровно один раз. При этом любой план, составленный при этих условиях, будет содержать ровно т 2 наблюдений.

Следует отметить, что такие планы эксперимента можно составить не всегда. Например, в случае, когда число уровней у каждого фактора т = 6, или в случае, когда число факторов k > m.

Приведем примеры таких планов.

Пусть имеем k = 3 факторов и т = 3 уровней у каждого фактора. План эксперимента будет содержать т 2= 9 комбинаций уровней:

 

     
     
     

 

Пусть имеем k = 3 факторов и т = 4 уровней у каждого фактора. План эксперимента будет содержать т 2= 16 комбинаций уровней:

 

       
       
       
       

 

Пусть имеем k = 3 факторов и т = 5 уровней у каждого фактора. План эксперимента будет содержать т 2= 25 комбинаций уровней:

 

         
         
         
         
         

 

Отметим, что первые цифры комбинаций уровней образуют так называемый «латинский квадрат». В последнем случае «латинский квадрат» 5-го порядка, полученный циклическим сдвигом первой строки на единицу, имеет вид:

 

         
         
         
         
         

 

(в «латинском квадрате» т -го порядка каждое из натуральных чисел от 1 до т в каждой строке и в каждой строке встречается ровно один раз).

После заполнения расчетной таблицы значениями наблюдений на уровнях, указанных в полученном плане, эти значения в каждой клетке складываются и при полученной сумме указывается комбинация соответствующих уровней в виде индекса, т.е. в каждой клетке таблицы из п 2 клеток получаем число xijk, где i – уровень 1-го фактора, j – уровень 2-го фактора, k – уровень третьего фактора соответствующего плана.

После этого начинается расчет наблюдаемых критериев. Рассмотрим случай k = 3, т = 5, a = 0,05.

Общая вариативность Q = = (т 2 3 m + 2)·+ (m – 1)· s 12 + (m – 1)· s 22+ (m – 1)· s 32, где s 12 = , s 22 =, s 32= – несмещенные точечные оценки дисперсий, обусловленных действием независимых 1-м, 2-м и 3-м фактором соответственно; – несмещенная точечная оценка дисперсии, обусловленной совместным действием всех трех факторов; = , = , = – групповые средние по наблюдениям, в которых 1-й, 2-й и 3-й факторы действовали на i -м, j -м и k -муровнях соответственно; = – выборочное среднее объединенной выборки.

Проверку гипотез о незначимости действия факторов находят сравнением наблюдаемых значений критериев K н(1) = s 12/, K н(2) = s 2/, K н(3) = s 32/, и критическими значениями правостороннего критерия Фишера-Снедекора K кр1= K кр2= K кр3= F a(k 1 = т – 1; k 2 = т 2 – 3 m + 2).

Пусть получены следующие результаты наблюдений:

 

(–4; 2; 3)111 (0; 1; 0)222 (–2; 1; 3)333 (–3; –1; 4)444 (–2; 0; 2)555
(–1; 1; 3)234 (–1; 0; 3)345 (–2; 0; 2)451 (–4; –1; 4)512 (0; 1; 2)123
(–1; 0; 1)352 (–1; 0; 2)413 (–2; 1; 2)524 (–2; –2; 2)135 (–1; 0; 2)241
(–2; 1; 2)425 (0; 1; 1)531 (1; 1; 1)142 (–1; 1; 1)253 (1; 2; 0)314
(1; 1; –1)543 (2; 0; –1)154 (–2; –1; 0)215 (0; 0; 2)321 (1; 0; 1)432

 

Суммируя результаты наблюдений в каждой клетке таблицы, получаем значения xijk:

 

1111 1222 2333 0444 0555
3234 2345 0451 –1512 3123
0352 1413 1524 –2135 1241
1425 2531 3142 1253 3314
1543 1154 –3215 2321 2432

Находим = = (1 + 1 + 2 + 0 + 0 + 3 + 2 + 0 – 1 + 3 + 0 + 1 + 1 – 2 + 1 + 1 + 2 + 3 + 1 + 3 + 1 + 1 – 3 + 2 + 2)/25 = 1.

Находим согласно комбинациям уровней, приведенным в плане:

= = (х 1 11 + х 1 23 + х 1 35 + х 1 42 + х 1 54)/ т = (1 + 3 – 2 + 3 + 1)/5 = 6/5 = 1,2;

= = (х 2 22 + х 2 34 + х 2 41 + х 2 53 + х 2 15)/ т = (1 + 3 + 1 + 1 – 3)/5 = 3/5 = 0,6;

= = (х 3 33 + х 3 45 + х 3 52 + х 3 14 + х 3 21)/ т = (2 + 2 + 0 + 3 + 2)/5 = 9/5 = 1,8;

= = (х 4 44 + х 4 51 + х 4 13 + х 4 25 + х 4 32)/ т = (0 + 0 + 1 + 1 + 2)/5 = 4/5 = 0,8;

= = (х 5 55 + х 5 12 + х 5 24 + х 5 31 + х 5 43)/ т = (0 – 1 + 1 + 2 + 1)/5 = 3/5 = 0,6.

Находим согласно комбинациям уровней, приведенным в плане:

= = (х 1 1 1 + х 5 1 2 + х 4 1 3 + х 3 1 4 + х 2 1 5)/ т = (1 – 1 + 1 + 3 – 3)/5 = 1/5 = 0,2;

= = (х 2 2 2 + х 1 2 3 + х 5 2 4 + х 4 2 5 + х 3 2 1)/ т = (1 + 3 + 1 + 1 + 2)/5 = 8/5 = 1,6;

= = (х 3 3 3 + х 2 3 4 + х 1 3 5 + х 5 3 1 + х 4 3 2)/ т = (2 + 3 – 2 + 2 + 2)/5 = 7/5 = 1,4;

= = (х 4 4 4 + х 3 4 5 + х 2 4 1 + х 1 4 2 + х 5 4 3)/ т = (0 + 2 + 1 + 3 + 1)/5 = 7/5 = 1,4;

= = (х 5 5 5 + х 4 5 1 + х 3 5 2 + х 2 5 3 + х 1 5 4)/ т = (0 + 0 + 0 + 1 + 1)/5 = 2/5 = 0,4.

Находим согласно комбинациям уровней, приведенным в плане:

= = (х 11 1 + х 45 1 + х 24 1 + х 53 1 + х 32 1 )/ т = (1 + 0 + 1 + 2 + 2)/5 = 6/5 = 1,2;

= = (х 22 2 + х 51 2 + х 35 2 + х 14 2 + х 43 2 )/ т = (1 – 1 + 0 + 3 + 2)/5 = 5/5 = 1;

= = (х 33 3 + х 12 3 + х 41 3 + х 25 3 + х 54 3 )/ т = (2 + 3 + 1 + 1 + 1)/5 = 8/5 = 1,6;

= = (х 44 4 + х 23 4 + х 52 4 + х 31 4 + х 15 4 )/ т = (0 + 3 + 1 + 3 + 1)/5 = 8/5 = 1,6;

= = (х 55 5 + х 34 5 + х 13 5 + х 42 5 + х 215)/ т = (0 + 2 – 2 + 1 – 3)/5 = –2/5 = – 0,4.

Находим общую вариативность Q = = (1 ­– 1)2 + (1 ­– 1)2 + (2 – 1)2 + (0 – 1)2 + (0 – 1)2 + (3 – 1)2 + (2 – 1)2 + (0 ­– 1)2 + (– 1 ­– 1)2 + (3 – 1)2 + (0 – 1)2 + (1 – 1)2 + (1 – 1)2 + (– 2 – 1)2 + (1 ­– 1)2 + (1 – 1)2 + (2 – 1)2 + (3 – 1)2 + (1 – 1)2 + (3 – 1)2 + (1 ­– 1)2 + (1 ­– 1)2 + (– 3 – 1)2 + (2 – 1)2 + (2 – 1)2 = 1 + 1 + 1 + 4 + 1 + 1 + 4 + 4 + 1 + 9 + 1 + 4 + 4 + 16 + 1 + 1 = 54.

Находим оценки факторных дисперсий: s 12 = = [(1,2 – 1)2 + (0,6 – 1)2 + (1,8 – 1)2 + (0,8 – 1)2 + (0,6 – 1)2] =(0,04 + 0,16 + 0,64 + 0,04 + 0,16) = 1,3; s 22 = = [(0,2 – 1)2 + (1,6 – 1)2 + (1,4 – 1)2 + (1,4 – 1)2 + (0,4 – 1)2] = (0,64 + 0,36 + 0,16 + 0,16 + 0,36) = 2,1; s 32== [(1,2 1)2 + (1 1)2 + (1,6 1)2 + (1,6 – 1)2 + (– 0,4 – 1)2] = (0,04 + 0,36 + 0,36 + 1,96) 3,4.

Находим оценку многофакторной дисперсии = (54 – 4·1,3 – 4·2,1 – 4·3,4) ≈ 2,23.

Находим наблюдаемые значения критериев: K н(1) = s 12/= 1,3/2,23 ≈ 0,58, K н(2) = s 2/= 2,1/2,23 ≈ 0,94, K н(3) = s 32/= 3,4/2,23 ≈ 1,52.

По табличным значениям критических точек F- критерия Фишера-Снедекора для уровня значимости a = 0,05 и соответствующим степеням свободы: K кр(1)= K кр(2)= K кр(3)= F a(k 1 = т – 1; k 2 = т 2 – 3 m + 2) = F 0,05(k 1 = 4; k 2 = 12) = 3,26.

Поскольку K н(1) < K кр(1), то гипотеза об отсутствии влияния 1-го фактора принимается.

Поскольку K н(2) < K кр(2), то гипотеза об отсутствии влияния 2-го фактора принимается.

Поскольку K н(3) < K кр(3), то гипотеза об отсутствии влияния 3-го фактора принимается.

 

В случае k = 4 общая вариативность Q вычисляется по формуле Q = = (т 2 4 m + 3)·+ (m – 1)· s 12 + (m – 1)· s 22+ (m – 1)· s 32 + (m – 1)· s 42, и т.д.

<== предыдущая лекция | следующая лекция ==>
 | Рынок и государство
Поделиться с друзьями:


Дата добавления: 2014-01-15; Просмотров: 245; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.