Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Область применения. Изучение деревьев классификации широко используется в таких прикладных областях, как медицина (диагностика)




Изучение деревьев классификации широко используется в таких прикладных областях, как медицина (диагностика), программирование (анализ структуры данных), ботаника (классификация) и психология (теория принятия решений). Деревья классификации идеально приспособлены для графического представления, и поэтому сделанные на их основе выводы гораздо легче интерпретировать, чем если бы они были представлены только в числовой форме.

Возможность графического представления результатов и простота интерпретации во многом объясняют большую популярность деревьев классификации в прикладных областях, однако наиболее важными отличительными свойствами деревьев классификации является их иерархичность и широкая применимость.

Достоинства метода деревьев классификации

Преимущества метода деревьев классификации перед такими традиционными методами, как линейный дискриминантный анализ, можно проиллюстрировать на простом примере (приложение Л), в котором имеются данные о классе и координатах – долготе и широте для 37 циклонов в Северной Атлантике, достигающих силы урагана, по двум классификациям циклонов: бароклинные и тропические (рисунок 8).

Рисунок 8 – Граф дерева классификаций для 37 циклонов

На рисунке 8 показан граф дерева классификации циклонов, построенный с помощью пакета программ STATISTICA [15], в котором используется полный перебор деревьев с одномерным ветвлением по методу CART.

Полученное таким образом дерево классификации имеет 5 ветвлений и 6 терминальных вершин. Терминальные вершины (листья) это узлы дерева, начиная с которых никакие решения больше не принимаются. На рисунке терминальные вершины показаны пунктирными линиями, а остальные – так называемые решающие вершины или вершины ветвления – сплошными линиями. Началом дерева считается самая верхняя решающая вершина, которую иногда также называют корнем дерева. На рисунке она помечена цифрой 1 у левого угла вершины. Первоначально все 37 циклонов приписываются к этой корневой вершине и предварительно классифицируются как тропические – на это указывает надпись троп в вершине.

Столбики гистограммы в каждой вершине, отражающие бароклинные циклоны, изображены сплошной линией, а тропические – штриховой линией. Название вершины соответствует классу наиболее встречающихся в этой вершине циклонов, изображенных в верхней части гистограммы. Если в каждом классе одинаковое количество циклонов, то они изображены в верхней части.

Корневая вершина разветвляется на две новых. Под корневой вершиной имеется текст, описывающий условие данного ветвления. Из него следует, что циклоны, имеющие значение широты меньшее либо равное 16,5 градусов северной широты, отнесены к вершине номер 2 и предположительно классифицированы как тропические. Циклоны с широтой, большей 16,5 градусов, приписаны к вершине 3 и классифицированы как бароклинные. Числа 19 и 18 над вершинами 2 и 3 соответственно обозначают число наблюдений, попавших в эти две дочерние вершины из родительской корневой вершины. Затем точно так же разветвляется вершина 2. В результате 2 наблюдения циклонов со значениями долготы меньшими либо равными 60,75 градусов приписываются к вершине 4 и классифицируются как бароклинные, а остальные 17 наблюдений с долготой большей 60,75 градусов – к вершине 5 и классифицируются как тропические. И так далее.


Рисунок 9 – Район зарождения ураганов в Центральной Америке

 

На рисунке 9 изображен район Карибского моря, в котором зарождались все 37 циклонов: ниже штриховой линии – 20 тропических, а выше – 17 бароклинных. На горизонтальной оси отмечены градусы западной долготы, а на вертикальной оси – градусы северной широты. Штриховая линия соответствует условиям ветвления вершин на рисунке 8. Вся информация представлена в простом и удобном для восприятия виде, так что для ее понимания требуется гораздо меньше времени, чем ушло на чтение трех последних абзацев. Если теперь мы посмотрим на гистограммы терминальных вершин дерева (рисунок 8), расположенных в нижней части рисунка, то увидим, что дерево классификации сумело абсолютно правильно расклассифицировать циклоны. Каждая из щести терминальных вершин "чистая", то есть не содержит неправильно классифицированных наблюдений.


Список литературы

1. Виленкин Н.Я. Комбинаторика [Текст] / Н.Я. Виленкин. – М.: Наука, 1969. – 159 с.

2. Виленкин Н.Я. Популярная комбинаторика [Текст] / Н.Я. Виленкин. – М.: Наука, 1975. – 98 с.

3. Вентцель Е.С. Теория вероятностей [Текст] / Е.С. Вентцель. – М.: Высш. шк., 2001. – 576 с.

4. Вентцель Е.С. Теория вероятностей и ее инженерные приложения [Текст] / Е.С. Вентцель, Л.А. Очаров. – М.: Высш. шк., 2000. – 522 с.

5. Вентцель Е.С. Задачи и упражнения по теории вероятностей [Текст] / Е.С. Вентцель, Л.А. Очаров. – М.: Высшая школа, 2000. – 456 с.

6. Кремер Н.Ш. Теория вероятностей и математическая статистика [Текст] / Н.Ш. Кремер. – М.: ЮНИТИ, 2000. – 329 с.

7. Гмурман В.Е. Теория вероятностей и математическая статистика [Текст] / В.Е. Гмурман. – М.: Высш. шк., 1998. – 479 с.

8. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике [Текст] / В.Е. Гмурман. – М.: Высш. шк., 1998. – 400 с.

9. Джонсон Н. Статистика и планирование эксперимента в технике и науке. Методы обработки данных [Текст] / Н. Джонсон, Ф. Лион. – М.: Мир, 1980. – 510 с.

10. Рунион Р. Справочник по непараметрической статистике. Современный подход [Текст] / Р. Рунион. – М.: Финансы и статистика, 1982. – 198 с.

11. Кендалл М.Дж. Статистические выводы и связи [Текст] / М.Дж. Кендалл, А. Стьюарт – М: Наука, 1973. – 480 с.

12. Тьюки Дж. Анализ результатов наблюдений [Текст] / Дж. Тьюки – М.: Мир, 1981. – 320 с.

13. Выявление экспертных знаний [Текст] / под ред. О.И. Ларичева и др – М.: Наука, 1989. – 301 с.

14. Райфа Г. Прикладная теория статистических решений [Текст] / Г. Райфа, Р. Шлейфер – М.: Статистика, 1977. – 433 с.

15. Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов [Текст] / В. Боровиков – СПб.: Питер, 2003. – 688 с.

16. Элементы комбинаторики, теории вероятностей и математической статистики [Текст]: метод. указ. / НФИ КемГУ, составитель Г.Л. Линдин. – Новокузнецк, 2006. – 37 с.


Приложение А

Таблица значений функции j (х)


Приложение Б

Таблица значений функции Лапласа F (х)


Приложение В

Критические точки распределения c 2

Число степеней свободы k Уровень значимости a
0,01 0,025 0,05
  6,6   3,8
  9,2 7,4  
  11,3 9,4 7,8
  13,3 11,1 9,5
  15,1 12,8 11,1
  16,8 14,4 12,6
  18,5   14,1
  20,1 17,5 15,5
  21,7   16,9
  23,2 20,5 18,3
  24,7 21,9 19,7
  26,2 23,3  
  27,7 24,7 22,4
  29,1 26,1 23,7
  30,6 27,5  
    28,8 26,3
  33,4 30,2 27,6
  34,8 31,5 28,9
  36,2 32,9 30,1
  37,6 34,2 31,4

 

Приложение Г

Критические точки распределения стьюдента

Число степеней свободы k Уровень значимости a = 0,05 Число степеней свободы k Уровень значимости a = 0,05 Число степеней свободы k Уровень значимости a = 0,05
  2,31   2,11   2,06
  2,26   2,1   2,05
  2,23   2,09   2,05
  2,2   2,09   2,05
  2,18   2,08   2,04
  2,16   2,07   2,02
  2,14   2,07   2,00
  2,13   2,06   1,985
  2,12   2,06   1,984

Приложение Д

Критические точки F - распределения Фишера-Снедекора при уровне значимости a = 0,05

k 2 k 1
                   
  5,19 5,05 4,98 4,88 4,82 4,77 4,74 4,71 4,68 4,62
  4,53 4,39 4,28 4,21 4,15 4,1 4,06 4,03 4,00 3,94
  4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57 3,51
  3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,22
  3,63 3,48 3,57 3,29 3,23 3,18 3,14 3,10 3,07 3,01
  3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,88
  2,87 2,71 2,60 2,51 2,45 2,39 2,33 2,30 2,28 2,20
  2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,12 2,09 2,01
  2,61 2,45 2,34 2,28 2,18 2,12 2,08 2,04 2,00 1,92
  2,57 2,41 2,29 2,22 2,14 2,08 2,03 1,99 1,96 1,88
  2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92 1,84

 

Приложение Е

Границы значимости для критерия Вальда-Вольфовица при уровне

значимости a = 0,05

n 2 n 1
                     
           
             
               
                 
                   
                     
                       
                       

Приложение Ж

Границы значимости для критерия Вилкоксона при уровне значимости a = 0,01

n 2 n 1
                     
     
       
         
           
             
               
                 
                   
                     
                       
                       

Приложение И

Критические точки распределения Колмогорова-Смирнова

Объем N a = 0,05 a = 0,01 Объем N a = 0,05 a = 0,01
  0,975 0,995   0,375 0,450
  0,842 0,929   0,349 0,418
  0,708 0,828   0,328 0,392
  0,624 0,733   0,309 0,371
  0,565 0,669   0,294 0,356
  0,521 0,618   0,270 0,320
  0,457 0,543   0,240 0,290
  0,410 0,490   0,230 0,270

Приложение К

Критические значения коэффициента ранговой корреляции Спирмена

Объем n a = 0,05 a = 0,01 Объем n a = 0,05 a = 0,01
  0,685 0,833   0,450 0, 591
  0,648 0,818   0,438 0,576
  0,623 0,794   0,428 0,562
  0,591 0,780   0,418 0,549
  0,566 0,745   0,409 0,537
  0,545 0,716   0,400 0,526
  0,525 0,689   0,392 0,515
  0,507 0,666   0,385 0,505
  0,490 0,645   0,377 0,496
  0,476 0,625   0,370 0,487
  0,462 0,608   0,364 0,478

Приложение Л

Координаты и класс 37 циклонов

Широта Долгота Класс Широта Долгота Класс
    BARO     TROP
  59,5 BARO     TROP
    TROP     BARO
  60,5 BARO   66,5 BARO
    TROP   66,5 BARO
    TROP   66,5 BARO
  61,5 BARO     TROP
  61,5 BARO   67,5 BARO
    TROP     TROP
    TROP   68,5 BARO
  63,5 BARO     TROP
    TROP     TROP
  64,5 TROP   69,5 TROP
    TROP   69,5 BARO
    TROP     TROP
    BARO   70,5 TROP
  65,5 TROP     TROP
  65,5 BARO   71,5 BARO
  65,5 BARO  

Приложение М

Семестровая работа по предмету «Теория вероятностей»




Поделиться с друзьями:


Дата добавления: 2015-06-25; Просмотров: 587; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.032 сек.