Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Марковские цепи с доходами (платежами)

Автор: Вилисов Валерий Яковлевич, профессор кафедры Математики Технологического университета (г. Королев, Моск. обл.)

Случайным процессом называют функцию времени, принимающую случайные значения в каждый фиксированный момент времени.

Случайной последовательностью (цепью) называют случайный процесс с дискретными состояниями () и временем ().

Если вероятность перехода () из предыдущего в последующее состояние зависит только от предыдущего состояния, то такой процесс называется процессом без последействия. Случайную последовательность, обладающую таким свойством, обычно называют марковской цепью (МЦ) или цепью Маркова, а само это свойство - марковостью.

МЦ называется однородной (стационарной), если переходные вероятности не изменяются во времени.

МЦ считается заданной, если заданы: матрица вероятностей перехода (переходная матрица) процесса за один шаг и вектор вероятностей начальных состояний:

. (1)

Кроме матричной формы марковская цепь может быть представлена и в виде ориентированного взвешенного графа (см. рисунок для случая трех состояний),

где вершины соответствуют состояниям, а значения, указанные на дугах - вероятностям перехода из одного состояния в другое за один шаг процесса.

Важной характеристикой МЦ, является вектор предельных (финальных) вероятностей , отражающий то, с какой вероятностью процесс окажется в том или ином состоянии через шагов.

Все свойства процесса, в том числе и , полностью определяются элементами (1), однако если возможность принимать некоторые решения, управляющие переходными вероятностями, то можно и воздействовать на . Такие МЦ называют управляемыми МЦ (УМЦ).

Управлением может быть, например, решение о внесении удобрений перед посевом сельхоз культур, что может повлиять на распределение вероятностей получения того или иного объема урожая.

К классу УМЦ относятся марковские цепи с платежами (МЦП). Их отличие от обычных МЦ в следующем:

1. На каждом (- ом) шаге процесса перед переходом на следующей (() - й) шаг можно принять одно из множества решений: .

2. Для каждого варианта решения () задана своя матрица условных вероятностей перехода за один шаг (МВП): . Здесь под условным имеется в виду следующее: «- это вероятность перехода в состояние на () – ом шаге при условии, что на - ом шаге процесс находился в состоянии , если было принято решение ».

3. Для каждого варианта решения () кроме МВП задана и матрица условных платежей за один шаг (МП): , где - платеж (или доход) за один шаг при переходе в состояние на () – ом шаге при условии, что на - ом шаге процесс находился в состояния и было принято решение .

Остальные элементы аналогичны обычным МЦ:

  1. Множество состояний процесса .
  2. Вектор вероятностей начальных состояний .

Пример. Приведенный выше типовой пример распределения рекламного бюджета на трех шагах можно представить следующими элементами:

?

Таким образом, МЦП является моделью принятия решений, в которой:

· есть что выбирать - решения на каждом шаге;

· есть чем измерить качество выбираемого решения - платежами, накопленными за множество шагов или средние по всем шагам.

Существует два основных алгоритма поиска решений для МЦП:

· рекуррентный алгоритм, основанный на уравнении Р. Беллмана, где максимизируется накопленный выигрыш;

· итерационный алгоритм, где максимизируется средний выигрыш за один шаг.

 

<== предыдущая лекция | следующая лекция ==>
Типовой пример | Рекуррентный алгоритм поиска решения МЦП
Поделиться с друзьями:


Дата добавления: 2014-01-04; Просмотров: 1718; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.