Выделение признаков

Термин “признак” обычно используется для обозначения одного из измерений образа. В более общем смысле признаком можно назвать некоторый объем информации, содержащейся в измерениях, который полезен при принятии решения о принадлежности образа к тому или иному классу. Исходные измерения могут содержать много “информации”, не приносящей пользу в процессе классификации и даже иногда затрудняющей ее. Для исследователя это дезинформация, и в дальнейшем ее рассматривают как шум. Можно сказать, что выделение признаков выполняет две функции:

1. Отделение полезной информации от шума.

2. Сокращение размерности данных с целью упрощения вычислений, выполняемых классификатором.

Вторая функция такая же, что выполняется при отборе признаков.

Рассмотрим влияние сокращения размерности на количество вычислений, необходимых для классификатора по максимуму правдоподобия при использовании многомерных нормальных статистик. Принимая во внимание, что время, необходимое для выполнения умножений, дает подавляющий вклад в общее время каждой классификации, время классификации грубо пропорционально n(n+1), где n – размерность данных (число используемых признаков). Ранее в большинстве работ по ДЗ использовались четыре “лучших” признака 12-канальной многоспектральной сканерной системы. Поскольку (4*5)/(12*13)=0,13, для классификации по 4-м признакам требуется только 13% времени, необходимого для классификации по всем 12 многоспектральным измерениям спектра. Таким образом, при использовании блока выделения признаков может быть получено значительное сокращение стоимости классификации. Необходимо также учесть стоимость процесса выделения признаков.

До сих пор предполагалось, что дискриминантные функции вычисляются блоком принятия решений прямо по вектору измерений X. Согласно модели системы (рис. 1) это означает, что выход с рецептора поступает непосредственно на классификатор. Теперь модель изменяется – добавляется блок выделения признаков между рецептором и классификатором (рис. 2).

Рис. 1. Модель системы РО

Рис. 2. Модель системы РО с блоком выделения признаков

Обозначим j-й признак . Если всего имеем m признаков, определим вектор признаков:

Признак или вектор признаков, может быть любым математическим преобразованием измерений образа. Это очень широкое определение. В дальнейшем ограничимся обсуждением трех часто используемых в приложениях ДЗ преобразований, а именно: отбор подмножества признаков, отношения и линейные комбинации.

Подмножества. Нахождение подмножеств признаков – просто отбор признаков. Блок выделения признаков передает m измерений, подавляя оставшиеся. Естественно, что m не превышает n, размерности исходного пространства измерений.

Отношения. В этом случае каждый из m компонент вектора признаков (снова m<n) – отношение двух измерений образа, т.е.

В этом случае следует избегать ситуаций, когда . Для конкретных применений ДЗ были найдены подходящие отношения признаков путем рассуждений, базирующихся на физической сущности связанных с ними явлений и на экспериментах. Иногда используются отношения, в которых числитель и знаменатель представляют собой суммы или разности измерений образов, что преследует цель “вычитания” или “сокращения” нежелательных влияний атмосферы или меняющейся освещенности сцены.

Линейные комбинации. Каждый из m компонент вектора признаков (m<n) является линейной комбинацией измерений образа, т.е.

, (1.1)

где все – константы. Для записи (1.1) можно использовать векторное/матричное обозначение:

где

В данном случае необходимо знать, как выбрать m и как определить mn констант в матрице B (одна из главных целей при этом – максимизировать точность классификации при минимизации времени вычислений, необходимого для классификации).

Представленные три метода выделения признаков в ДЗ относительно просты. Возможны гораздо более сложные признаки, включая признаки, учитывающие пространственные и временные вариации данных.

Важно понимать, что при выборе признаков нельзя игнорировать предположений, касающихся классификатора. К примеру, если имеем классификатор по максимуму правдоподобия, предполагающий нормальное распределение данных для каждого класса, то если исходные измерения образов имеют нормальное распределение, классификатор может использоваться с признаками, состоящими из любого поднабора или линейной комбинации измерений, т.к. такие признаки также распределены нормально. Однако признаки, которые становятся отношениями нормально распределенных измерений, не подчиняются нормальному распределению и не должны использоваться с таким классификатором.

<== предыдущая лекция	\|	следующая лекция ==>
Анализ маркетинговых данных	\|	Производственная деятельность

Поделиться с друзьями:

Дата добавления: 2015-05-10; Просмотров: 533; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.007 сек.