Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Выбор критерия близости

 

 

Для определения качества процедуры формирования модели измерения, могут быть выбраны критерии близости, использующие разные подходы их формирования.

I. В алгоритмах формирования, использующих детерминированные признаки в качестве меры близости, естественно применить среднеквадратическое расстояние между данным объектом w и совокупностью объектов (w 1, w 2,...., wn), представляющих (описывающих) каждый класс. Для сравнения с классом Wg это выглядит так:

,

где kg – количество объектов, представляющих Wg -й класс.

При этом в качестве методов измерений расстояния между объектами d (w, wg) могут использоваться любые методы. Так, если сравнивать непосредственно координаты (признаки), то

,

где N – размерность признакового пространства.

Если сравнивать угловые отклонения, то рассматривая вектора, составляющими которых являются признаки КО w и класса wg, будем иметь

,

где | и – нормы соответствующих векторов.

В алгоритме формирования, использующем детерминированные признаки можно учитывать и их веса Vj (устанавливать степень доверия или важности). Тогда рассмотренное среднеквадратическое расстояние принимает следующий вид:

.

II. В алгоритмах формирования, использующих вероятностные признаки, в качестве меры близости используется риск, связанный с решением о принадлежности объекта к классу Wi, где i – номер класса. (i = 1, 2,.., m.).

Пусть описание классов представлено

.

В рассматриваемом случае к исходным данным для расчета меры близости относится платежная матрица вида

.

Здесь на главной диагонали – потери при правильных решениях. Обычно принимают Сii =0 или Cii <0.

Если вектор признаков контролируемого объекта w, то риск, связанный с принятием решения о принадлежности этого объекта к классу Wg, когда на самом деле он может принадлежать классам W 1, W 2,..., Wm, наиболее целесообразно определять как среднее значение потерь

С 1 g , C 2 g ,..., Cmg,

то есть потерь, стоящих в g -м столбце платежной матрицы. Тогда этот средний риск можно записать как

,

где P (Wi | Xw) – апостериорная вероятность того, что w Wi.

Для исходных данных, а именно описаний классов, эта вероятность легко может быть определена в соответствии с теоремой гипотез или по формуле Байеса:

.

III. В наиболее общем случае, когда приходится при формировании модели измерения использовать информацию гетерогенного характера, т.е. разнообразную по характеру и содержанию, необходимо применять информационный критерий близости. При этом статистика, определенная разбиением À = , является достаточной для различения, если À разбито на попарно непересекающиеся множества и

I (1:2) = ,

где m2(E 1) = P (x Î E 1| H 2) – вероятность неправильного принятия гипотезы H 1 (ошибка первого рода); m1(E 2) = P (x Î E 2| H 1) – вероятность неправильного принятия гипотезы H 2 (ошибка второго рода).

Из общего анализа процедуры различения можно сформулировать характерные требования, которым должен удовлетворять критерий, определяющий различения между выборками, полученными в результате измерения. Так, в среднем различающая информация, получаемая из статистических наблюдений, положительна. Все x Î E, для которых выполнено условие равенства, можно рассматривать как эквивалентные в задаче различения. Если распределения, соответствующие обеим гипотезам совпадают, то различающая информация не существует. При этом группировка, сгущение или другие преобразования наблюдений с помощью статистики ведут в общем случае к потере информации. В случае достаточной статистики разбиения, когда самые крупные элементы группировки содержат в себе такую же информацию, как разбиение с элементами в виде точек исходного пространства, информация не теряется. Достаточность статистики для семейства распределений не нарушается при усечении или при отборе в соответствии с функцией j(x) = f(T (x)).

Если разбиение пространства X удовлетворяет необходимому и достаточному условиям, т.е. если плотности распределения x при условии Ei одни и те же для обеих гипотез по всем членам разбиения, то можно определить разбиение X = как достаточное разбиение для различения. При достаточности разбиение с самыми крупными элементами группировки содержит в себе такую же информацию, как разбиение с элементами в виде точек пространства X. Понимая под статистикой разбиение пространства X на множества эквивалентных x, можно сказать, что статистика, определенная разбиением X = является достаточной для различения, если необходимое и достаточное условие того, что информация не уменьшается после группировки =выполнено, т.е. “статистика отбирает для суммирования всю относящуюся к делу информацию, доставляемую выборкой” [77].

Пусть Y = T (x) – статистика, т.е. T (x) является функцией с областью определения X и областью значений Y, и пусть Г – аддитивный класс подмножеств Y. Предположим, что T (x) – измеримая функция, т.е. для любого множества G Î Г полный прообраз T – 1(G)={ x: T (xG } [ T – 1(G) – есть совокупность элементов x таких, что T (xG ] прнадлежит классу S измеримых подмножеств пространства X. Класс всех множеств вида T – 1(G), где G ÎГ, обозначается T – 1(Г). Таким образом, имеем измеримое отображение T вероятностного пространства (X, S, m i) в вероятностное пространство (Y, Г, vi), где vi (G) m i (T – 1(G)).

Если определить g(G) = l(T – 1(G)), v 1 º v 2 º g (меры абсолютно непрерывны одна относительно другой), то теорема Радона – Никодима позволяет утверждать существование таких плотностей вероятности gi (y), i = 1, 2, что

vi (G) = , i = 1, 2, G Î Г,

для всех G Î Г. Функция gi (y) является условным математическим f (x) при условии T (x) = y и обозначается E l(fi ½ y). В этом случае в терминах вероятностных пространств (Y, G, vi), i = 1, 2, различающая информация определяется различием

I (1:2; G) =

и

I (1:2; Y) = .

При этом вероятностные меры m1 и m2 должны быть абсолютно непрерывны одна относительно другой. Это требование связано с возможностью определения I (1:2) и I (2:1), чтобы могло существовать расхождение

J (1:2) = I (1:2) + I (2:1) = ,

которое и определяет информационное различие между двумя элементами.

IV. Для алгоритмов, основанных на логических признаках, достаточно подставить их в булевы соотношения между классами и признаками, чтобы сразу получить результат как истинность или ложность булевой функции описания того или иного класса.

V. Для алгоритмов, основанных на структурных (лингвистических) признаках, понятие “меры близости” более специфично.

С учетом того, что каждый класс описывается совокупностью предложений, характеризующих структурные особенности объектов соответствующих классов, выбор неизвестного объекта осуществляется идентификацией предложения, описывающего этот объект с одним из предложений в составе описания какого-либо класса. При этом идентификация может подразумевать наибольшее сходство предложения, описывающего контролируемый объект с предложениями из наборов описания каждого класса.

Формирование модели осуществляется последовательными приближениями по мере получения дополнительной информации. В этом ряду последовательных приближений главную роль играют признаки измерения. От эффективности их набора зависит эффективность модели контролируемого объекта в целом. В процессе совершенствования модели указанный набор пополняется, неэффективные признаки исключаются. Поэтому одной из задач формирования модели должна быть и задача перехода от априорного словаря признаков к рабочему. То же касается и априорного алфавита классов.

 

 

<== предыдущая лекция | следующая лекция ==>
Общая постановка задачи формирования модели измерения | Способы преобразования переменных модели измерения
Поделиться с друзьями:


Дата добавления: 2014-01-05; Просмотров: 1809; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.