Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Математические методы распознавания




 

С целью обеспечения высокой эффективности сложных, больших систем распознавания наряду с теоретическими исследованиями применяют математическое или (и) физико-математическое моделирование. Например, при построении локационных систем селекции и распознавания разрабатывается комплекс математических моделей, являющийся инструментом для организации исследований на основе выполнения математических экспериментов [7]. Физико-математическое моделирование предусматривает сочетание физических (лабораторных, натурных) и математических экспериментов. При этом, как отмечено в [7], роль математического эксперимента значительнее при лабораторных исследованиях, чем при натурных испытаниях. При разработке большой системы распознавания и ее элементов может реализовываться следующая цепочка: физико-математические исследования - натурные испытания.

Решение задач, возникающих при разработке и эксплуатации распознающих систем, осуществляется с применением математики. Так, для обработки априорной информации логического характера применяется алгебра логики, стохастического характера – теория вероятностей, математическая статистика, теория матриц, теория множеств и т.д. А при разработке системы распознавания применяются также методы исследования операций, теории игр, теории принятия решений и др.

В работе [3] проблема распознавания, заключающаяся в нахождении рабочего алфавита классов, рабочего словаря признаков, описания классов на языке признаков, оптимального состава комплекса технических средств системы распознавания, которые при наилучшем решающем правиле обеспечивают наиболее эффективное решение задачи распознавания, в условиях наличия ограничений на используемые ресурсы для создания комплекса технических средств, сформулирована в виде оптимизационной задачи и приведен метод ее решения, основанный на математическом моделировании.

В работе [1] рассматриваются следующие методы анализа данных:

· дискриминантный анализ - для построения разделяющих функций в признаковом пространстве;

· выделение и выбор признаков - для сужения избыточного множества признаков до подмножества «наилучших признаков» или их комбинаций;

· кластерный анализ - для разделения данных на подобные группы объектов.

В дискриминантном анализе формирование разделяющих функций основывается на одном из статистических или эвристических методов. Статистические методы нацелены на минимизацию ошибки классификации, представляющей собой вероятность неправильной классификации поступившего на распознавание k-мерного объекта Х. К таким методам относят [1]:

· разделение с помощью квадратичной функции на основе использования плотностей нормального распределения;

· разделение с помощью линейных функций на основе использования плотностей нормального распределения;

· непараметрические методы, применяемые в случае отсутствия информации о виде кривой плотности распределения;

· применение адаптивных разделяющих функций, позволяющих внесение изменений в значения их параметров при неправильной классификации.

Эвристические методы ориентированы на критерии, непосредственно связанные с имеющимися исходными данными. К этим методам относят [1]:

· правило ближайшего соседа, в соответствии с которым, исследуемый объект относят к тому классу, к которому принадлежит его ближайший сосед из обучающей выборки;

· правило К ближайших соседей;

· оптимизация по какому-либо критерию ошибки выбранной разделяющей функции (линейной, квадратичной и т.д.), например, число неправильно классифицированных объектов из обучающей выборки, расстояние (среднее или "взвешенное") между обучающей выборкой и разделяющей функцией;

· иерархическое разделение на основе применения дерева решений, в каждой вершине которого исследуется один из многих признаков, в зависимости от значения которого выбирается очередная ветвь. В нижней вершине принимается классификационное решение.

Выделение и выбор признаков может обуславливаться следующим: необходимостью нахождения совокупности признаков, порождающих только различие между классами; ограничением на время выполнения вычислительных процедур; ограниченными ресурсами на приобретение и создание технических средств системы распознавания и др. Для реализации этой цели применяется ряд критериев адекватности набора признаков. Например, критерий Фишера как одномерный критерий адекватности каждого признака для разделения двух классов, расстояние Махаланобиса как многомерный критерий для разделения различных классов, оценка совокупности признаков при полном или частичном переборе выбираемого подмножества признаков из исходного избыточного множества признаков и др.

Кластерный анализ служит инструментом для выделения структур, классов, множеств подобных объектов из исходных неклассифицированных совокупностей. Ввиду многоаспектного характера применения кластерного анализа (социология, психология, биология, медицина, геология, астрономия и др.) в нем применяются разнообразные критерии, определяемые конкретными целями анализа в различных прикладных задачах. В литературе описано множество методов кластеризации, основанных на творческом подходе к использованию приемов кластерного анализа для создания «своего» метода кластеризации. Основы кластерного анализа изложены в работе [5].

Рассмотрим некоторые разновидности кластерного анализа. Одной из разновидностей методов кластерного анализа являются методы, основанные на отыскании моды распределения. В них полагается связь между кластерами и максимумами плотности распределения данных. Оценивая плотности распределения одним из известных методов и находя максимумы (моды) их соотносят с некоторыми кластерами. При необходимости возможно объединение ряда кластеров с целью реализации принадлежности исследуемого элемента среды к одному из кластеров.

При априорно известном числе кластеров возможно применение метода кластерного анализа,. критерием в котором является отношение внутрикластерной дисперсии к межкластерной дисперсии. В этом случае возможно также применение итеративного самоорганизующегося метода анализа данных, основанного на идее принадлежности объектов к кластеру с наиболее близким средним значением. Вначале, на первом шаге, случайным образом выбирают средние значения для исходного разбиения «сгустков» объектов. Затем, на втором шаге, осуществляют отнесение объектов к тем кластерам, центры которых находятся от них на наименьшем расстоянии. Рассчитываются новые средние значения для кластеров и циклически повторяют второй шаг до завершения процесса кластеризации.

Следующей разновидностью методов кластерного ангализа являются иерархические схемы кластеризации. Вначале каждый объект рассматривается как отдельный кластер. Затем, пошагово осуществляют объединение исходных кластеров на основе установленных способов измерения расстояния между кластерами до тех пор, пока не будет получена искомая совокупность кластеров. При этом возможно применение интерактивного режима.

В распознавании объектов, явлений, ситуаций и т. д. возможно применение идей теории нечетких множеств, в которых принадлежность элементов к таким множествам может принимать любые значения в диапазоне 0 – 1. Нечеткие множества можно применять в условиях неопределенности для квантифицирования и формализации различных неопределенных и интуитивных утверждений типа «теплый день», когда установлено всего лишь два класса дней: «жаркий день» и «холодный день». Тогда «теплый день» может принадлежать классу «жаркий день», например, со значением принадлежности 0,6 и к классу «холодный день» со значением принадлежности 0,15. Сумма указанных двух значений может быть отличной от единицы. В теории нечетких множеств вводятся понятия объединения и пересечения множеств. Например, принадлежность к объединению нечетких множеств А и В элемента X(fAÈB(x)), имеющего значение принадлежности к множеству А – fA(x). и к множеству В – fB(x), можно определить как:

fAÈB(x) = max{ fA(x), fB(x)}, (11.5)

а принадлежность к пересечению нечетких множеств А и В – как

fAÇB(x) = max{ fA(x), fB(x)}, (11.6)

В распознавании, например, могут применяться нечеткие метки, нечеткие признаки и нечеткие классификации.

Нечеткие метки могут использоваться для отражения неопределенности в принадлежности объектов обучающего множества к соответствующим классам. Это означает необходимость классификации объектов с учетом всех возможных классов. Использование нечетких меток в процессе обучения распознающей системы, вместо четких меток, указывающих однозначно принадлежность к определенному классу, может привести к получению более точных результатов классификации на этапе функционирования системы распознавания, поскольку в этом случае на этапе обучения используется больший объем информации и имеется возможность работать с более репрезентативным обучающим множеством, так как все объекты, включая сомнительные и «выбросы», могут быть помечены.

Введение понятия «нечеткие признаки» связано с искусственным «размыванием» значений признаков Х, представляющих результаты объективных измерений и не содержащих нечеткостей, посредством отображения на интервале 0,1, например, в виде:

fl(x) = exp(-a½x-xl0½b), (11.7)

 

где a и b- положительные постоянные, подлежащие определению,

xl0 - «идеальное» значение признака для класса l.

В процессе распознавания над значениями признаков могут выполняться операции объединения, пересечения с помощью выше приведенных формул:

 

fAÈB(x), fAÇB(x), (11.8)

 

Нечеткие классификации могут быть получены, реализуя указанные выше процедуры установления значений принадлежности элементов для всех классов. Нечеткость результатов классификации можно устранить либо алгоритмически – относя объект к классу, которому соответствует наибольшее значение принадлежности, либо в интерактивном режиме, когда лицо, принимающее решение, вырабатывает свое правило отнесения объекта к определенному классу, располагая при этом сведениями о вычисленных значениях принадлежности. Нечеткие классификации можно использовать в кластерном анализе при формировании критерия выделения кластеров с целью получения гибкого и исчерпывающего описания реально используемой стратегии.

При создании систем распознавания символов, речи, отпечатков пальцев, для обнаружения дефектов промышленных объектов, деталей машин и механизмов, в биологии, медицине и других отраслях описание образов выполняется через непроизводные элементы и их отношения на некотором «языке». Для описания таких образов создаются специальные грамматики, содержащие набор правил, позволяющих составлять образы из непроизводных элементов. Способы распознавания представленных таким образом объектов базируются на лингвистических (структурных) методах.

В заключение следует отметить, что в условиях многоаспектности предметных областей распознавания, разработано мощное множество конкретных методов, используемых в различных системах распознавания в разных целях. Эти методы являются результатом творчества их авторов во взаимодействии со знаниями, полученными в различных дисциплинах, например, таких как математика, физика, теория автоматов, теория информации, кибернетика, искусственный интелект, информатика, обработка изображений, лингвистика, теория нервных сетей, биология, социология и психология. Распознавание можно использовать в различных областях, как для имитации органов чувств человека или в качестве вспомогательного средства, так и для анализа сложных структур данных, например, с целью получения новых знаний.

 

Вопросы для самоконтроля

 

1. В чем заключается сущность распознавания?

2. Что представляет собой процесс распознавания?

3. Из каких частей состоит процесс распознавания и каково их назначение?

4. Какие этапы включаются в процесс разработки метода распознавания и чем заключается их сущность?

5. Какие этапы включаются в процесс функционирования метода распознавания и в чем заключается их сущность?

6. Что представляет собой система распознавания?

7. Назовите блоки, входящие в структуру системы распознавания?

8. По каким критериям целесообразно классифицировать системы распознавания?

9. Какие выделяют разновидности систем распознавания по критерию участия персонала в процессе их функционирования?.

10. Какие виды обучения применяются в системах распознавания, в чем заключается их сущность?

11. Какие задачи решаются в процессе создания и эксплуатации системы распознавания?

12. Какова роль субъекта в процессе создания и функционирования системы распознавания?

13. Зачем надо формулировать цели для создания и работы системы распознавания, какие требования предъявляются к ним?

14. В чем состоит сущность принципа опознавания?

15. В чем заключается проблематика формирования рабочего алфавита классов и рабочего словаря признаков системы распознавания?

16. Какие разновидности признаков включаются в словарь признаков системы распознавания и в чем заключается их сущность?

17. Зачем выполняется описание классов на языке признаков?

18. Каковы особенности построения алгоритмов распознавания для различных разновидностей признаков, включенных в словарь признаков распознающей системы?

19. В чем заключается проблематика выбора состава комплекса технических средств и структуры системы распознавания?

20. Какие разделы математики могут применятся при разработке и функционировании систем распознавания?

21. Какие методы анализа данных известны Вам?

22. Какие методы дискриминантного анализа известны Вам?

23. Зачем применяют кластерный анализ в распознавании?

24. Для чего могут применятся нечеткие множества в распознавании?

25. Укажите области применения лингвистических методов в распознавании?

 

Литература

1. Верхаген К., Дейн Р., Грун Ф. и др. Распознавание образов: состояние и перспективы. М.: «Радио и связь», 1985.

2. Глушков В.М. Основы безбумажной информатики. М.: «Наука», 1987.

3. Горелик А.Л., Скрипкин В.А. Методы распознавания. М.: «Высшая школа», 1984.

4. Горелик А.Л., Гуревич И.Б., Скрипкин В.А. Современное состояние проблемы распознавания. М.: «Радио и связь», 1985.

5. Дуда Р., Харт П. Распознавание образов и анализ сцен. М: «Мир», 1976.

6. Журавлев Ю.И. Об алгебраическом подходе к решению задач распознавания или классификации. «Проблемы кибернетики». М.: «Наука», 1978, вып. 33.

7. Селекция и распознавание на основе локационной информации/ А.Л.Горелик, Ю.Л.Барабаш, О.В.Кривошеев и др. Под ред. А.Л.Горелика. М.: «Радио и связь», 1990.

8. Харкевич А.А. Опознавание образов. «Радиотехника», 1959, т.14, 15.

9. Цыпкин Я.З. Основы теории обучающихся систем. М.: «Наука», 1970.

10. Энциклопедия кибернетики. Киев: Главная редакция Украинской советской энциклопедии,1975.

11. Rosenblatt F. Perceptron simulation experiments. Proc. I.R.E. 1960.

Глава 12

“Чёрный” и “белый” ящики как научные методы

12.1 Понятие “чёрного” и “белого” ящика

Под “чёрным ящиком” понимается объект исследования, внутреннее устройство которого неизвестно. Понятие “чёрный ящик” предложено У. Р. Эшби. В кибернетике оно позволяет изучать поведение систем, то есть их реакций на разнообразные внешние воздействия и в тоже время абстрагироваться от их внутреннего устройства. На рис. 12.1. приведено схемное построение входов X (x1,x2, …,xn), выходов Y(y1,y2,…ym), характеризуемых функцией перехода (d) и функцией выхода (l) “чёрного" ящика.

 

 
 


x1 y1

 

x2 y2

X Ч Я Y

……. …….

xn ym

 

(d) (l)

 

Рис. 12.1. Схема взаимодействия входов и выходов “чёрного” ящика

 

Манипулируя только лишь со входами и выходами, можно проводить определённые исследования. На практике всегда возникает вопрос, насколько гомоморфизм “чёрного” ящика отражает адекватность его изучаемой модели, то есть как полно в модели отражаются основные свойства оригинала.

Описание любой системы управления во времени характеризуется картиной последовательности её состояний в процессе движения к стоящей перед нею цели. Преобразование в системе управления может быть либо взаимнооднозначным и тогда оно называется изоморфным, либо только однозначным, в одну сторону. В таком случае преобразование называют гомоморфным.

“Чёрный” ящик представляет собой сложную гомоморфную модель кибернетической системы, в которой соблюдается разнообразие. Он только тогда является удовлетворительной моделью системы, когда содержит такое количество информации, которое отражает разнообразие системы. Можно предположить, что чем большее число возмущений действует на входы модели системы, тем большее разнообразие должен иметь регулятор.

В настоящее время известны два вида “чёрных” ящиков. К первому виду относят любой “чёрный” ящик, который может рассматриваться как автомат, называемый конечным или бесконечным. Поведение таких “чёрных” ящиков известно. Ко второму виду относятся такие “чёрные” ящики, поведение которых может быть наблюдаемо только в эксперименте. В таком случае в явной или неявной форме высказывается гипотеза о предсказуемости поведения “чёрного” ящика в вероятностном смысле. Без предварительной гипотезы невозможно любое обобщение, или, как говорят, невозможно сделать индуктивное заключение на основе экспериментов с “чёрным” ящиком.

Для обозначения модели “чёрного” ящика Н. Винером [2] предложено понятие “белого” ящика. “Белый” ящик состоит из известных компонентов, то есть известных X, Y, d, l. Его содержимое специально подбирается для реализации той же зависимости выхода от входа, что и у соответствующего “чёрного” ящика. В процессе проводимых исследований и при обобщениях, выдвижении гипотез и установления закономерностей возникает необходимость корректировки организации “белого” ящика и смены моделей. В связи с этим, при моделировании исследователь должен обязательно многократно обращаться к схеме отношений “чёрный” – “белый” ящик.

 




Поделиться с друзьями:


Дата добавления: 2014-11-25; Просмотров: 659; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.