Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Построение дерева решений




 

Для выделенных регионов построим дерево решений.

Выборка для данного анализа находится в файле Дерево решений.xls. От исходной выборки она отличается только тем, что для каждого региона отмечен класс, определенный на этапе кластерного анализа. Также в выборке остались только те признаки, которые были использованы в кластерном анализе для построения правил. Такими признаками являются: «Бахчевые культуры», «Картофель», «Молоко и молочные продукты», «Рыба и рыбопродукты», «Фрукты и ягоды», «Хлебные продукты» и «Яйца и яйцепродукты».

Основные продукты, потребляемые в регионах, являются входными данными, классы – выходными данными, название региона является информационным.

Построим дерево решений по 49 регионам и только по тем признакам, которые были выбраны в кластерном анализе, используя настройки по умолчанию, то есть минимальное количество примеров в узле, при котором будет создан новый равно 2 и процент доверия равен 20. В результате получилось следующее дерево решений (рис. 20).

Рис. 20. Дерево решений

В данном случае для разбиения на классы используются 4 правила (рис. 21):

Рис. 21. Таблица правил для дерева решений

Но таблица сопряженности (рис. 22) показала, что при классифицировании возникли 3 ошибки классификации.

Рис. 22. Таблица сопряженности

Таблица 2. Ошибки классификации

Регион Классифицирован Фактический класс
Чукотский АО    
Вологодская область    
Ставропольский край    

 

Изменяя параметры построения деревьев решений, попытаемся исправить ошибки распознавания.

Изменение процента доверия при неизменном минимальном количестве примеров в узле привел только к увеличению ошибок классификации. Увеличение минимального количества примеров в узле также привело к увеличению количества ошибок классификации. Уменьшив минимальное количество примеров в узле до 1, получили классификацию с одной ошибкой. Чтобы убрать эту ошибку увеличили процент доверия до 40%, увеличив таким образом количество правил. В результате получили безошибочную классификацию (рис. 23).

Рис. 23. Таблица сопряженности

Дерево решений выглядит следующим образом (рис. 24):

Рис. 24. Дерево решений

Строится данное дерево по следующим правилам:

Рис. 25. Таблица правил для дерева решений

Из проведенного анализа можно сделать вывод, что при увеличении количества правил, улучшается качество распознавания. Правила для дерева решений показали, что для правильной классификации достаточно 5 признаков. Признак «Бахчевые культуры» в данных правилах не используется. Уберем его из выборки.

 




Поделиться с друзьями:


Дата добавления: 2015-06-04; Просмотров: 778; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.