Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Методом общего расстояния




Алгоритм классификации методом общего расстояния является типичным примером эвристического алгоритма, основная идея которого заключается в том, что совокупность объектов, находящихся на одинаковом расстоянии от каждого из k эталонов, образует компактную группу.

Пусть для классификации имеется выборка A1.….AN. представленная в виде матриц размером в m профилей и n пикетов, причем каждый объект этой выборки характеризуется вектором признаков Рассмотрим р - мерное признаковое пространство Xp вместе с функцией , задающей расстояние (или степень близости). Здесь степень близости определяется как обычное евклидово расстояние:

Тогда схема алгоритма имеет вид:

-для всех обрабатываемых признаков оценивается среднее значение:

-каждый признак центрируется на соответствующее значение среднего aijk = aijk - Sк.

-для всех обрабатываемых признаков оценивается значение среднеквадратического отклонения:

-каждый признак нормируется на соответствующее значение среднеквадратического отклонения:

-для каждого из признаков выбирается эталонов .

-рассчитывается матрица (для каждого признака) средних расстояний от объекта до эталонов.

-выбирается общий порог d0 .

-осуществляется классификация приведенных к однородности признаков по правилу, каждому объекту Xi ставится в соответствие код из k двоичных символов . где . если . где l=1.....k и в противном случае.

Выборка разбивается на классы. Объекты, относящиеся к одному классу, имеют одинаковый код.

Существенно повысить качество конечной классификации данного алгоритма позволяет учет следующих замечаний:

1.Нормировка данных по каждому признаку только на обычную дисперсию, из-за специфики геофизических наблюдений, для которых характерно наличие “ураганных” значений, не позволяет решать задачу нормировки корректно. Как показали исследования, качество классификации значительно улучшается, если стандартную нормировку на дисперсию, дополнить нормировкой на межэталонную дисперсию:

2.Мера сходства, также является важнейшим фактором качества классификации. Наиболее эффективным является следующий подход решения этой задачи:

-по каждому признаку рассчитываются средние расстояния от всех анализируемых точек исходной сети до эталонов s1=…=sp.

-находится общее среднее по всем признакам .

-величина 0.3 , в качестве меры сходства, как показало опробование алгоритма на модельных и реальных данных, является наиболее приемлемым.

 




Поделиться с друзьями:


Дата добавления: 2015-06-26; Просмотров: 423; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.