КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Статистическая регуляризация данных
Как следует из выражения (11.2.21), для практического использования информации из дополнительных потоков данных необходимо установить значения и дисперсию D(M), причем, исходя из задания последней по выражению (11.2.11), должно быть известно значение dx - относительной средней квадратической флюктуации величины х. Применительно к СРД определение значений и dx по зарегистрированным массивам данных не представляет затруднений как в целом по пространству измерений, так и в виде распределений в скользящем окне усреднения данных. Последнее эквивалентно приведению Dxm => 0 для текущей точки обработки данных по информации ее ближайших окрестностей и позволяет производить максимальное извлечение полезной информации из дополнительных потоков сигналов, если частотный спектр распределения величины х по пространству измерений много меньше частотного спектра полезного сигнала. Отметим, что информация о распределении х также может иметь практическое значение (в частности, при гамма-опробовании с дополнительным потоком сигналов в низкоэнергетическом диапазоне спектра излучения - для оценки эффективного атомного номера горных пород). Проверка теоретических положений метода АРД проводилась путем статистического моделирования соответствующих массивов данных и их обработки цифровыми фильтрами. В таблице 1 приведены 4 группы результатов обработки по формулам (11.2.20-21) двух статистически независимых и постоянных по средним значениям массивов данных n и m (модели постоянных полей) при различных установках СРД по скользящему окну Кс счета текущих значений = mi/ni и Di(М) по массиву m. Текущая точка обработки данных – по центру окна. Количество отсчетов в каждом массиве – 1000, распределение значений отсчетов соответствует закону Пуассона. Определение прогнозных отсчетов Мi по массиву m для использования в уравнении (11.2.20) проводилось со сглаживанием отсчетов в скользящем окне Ks низкочастотного цифрового фильтра (вариант без сглаживания при Ks = 1). В качестве низкочастотного фильтра в алгоритме СРД используется (здесь и в дальнейшем) весовое окно Лапласа-Гаусса. Теоретическое значение Dz.т. дисперсии результатов z определялось по выражению (11.2.22) с расчетом дисперсии D(M) по выражению D(M) =[1+(1/(Kc)+1/(Kc))]. При сглаживании прогнозных отсчетов значение DM в выражении (11.2.22) принималось равным DM. = ×Hs, где Hs – коэффициент усиления сглаживающим фильтром дисперсии шумов (сумма квадратов коэффициентов цифрового фильтра). Дополнительно в таблице приводятся зарегистрированные средние значения коэффициента снижения статистических флюктуаций h = dn2/dz2. Таблица 1. Статистика результатов моделирования СРД. (Основной массив = 9.9, Dn = 9.7, дополнительный массив = 9.9, Dm = 9.9, 1000 отсчетов.)
Как видно из данных таблицы, практические результаты фильтрации достаточно хорошо совпадают с ожидаемыми по данным теоретических расчетов. Некоторое уменьшение среднего значения z по отношению к исходному среднему значению n определяется асимметричностью пуассоновского типа модели. При малых средних значениях модельных отсчетов в массиве m это приводит к определенной статистической асимметрии в работе СРД, т.к. при (+sm)2 > (-sm)2 среднестатистическое доверие к дополнительной информации с отсчетами Mi+s меньше, чем с отсчетами Mi-s. Этим же фактором, по-видимому, вызвано и большее расхождение между теоретическими и фактическими значениями Dz при малых значениях окна Кс. Можно также заметить, что по значению коэффициента h фильтрация выходит на теоретические значения (Þ 1+M/N) только при достаточно точном определении значений и Di(М), что требует увеличения окна Кс счета этих параметров для полного использования дополнительной информации.
Эффект использования дополнительной информации, в полном соответствии с выражением (11.2.22), усиливается при предварительном сглаживании статистических вариаций отсчетов Mi и при увеличении значений отсчетов дополнительного массива (материалы по последнему случаю не приводятся, т.к. не имеют какой-либо дополнительной информации). В спокойных по динамике полях еще большая глубина регуляризации может быть достигнута при счете значений и Dm по сглаженному массиву М, что позволяет повысить вес прогнозных отсчетов Mi. Результаты моделирования данного варианта в тех же условиях, что и для таблицы 1, приведены в таблице 2. Такой же эффект, в принципе, может достигаться и непосредственным введением дополнительного коэффициента веса в выражение (11.2.20) в качестве множителя для значения D(M), что позволяет осуществлять внешнее управление глубиной регуляризации. Оценка сохранения разрешающей способности полезной информации была проведена на фильтрации детерминированных сигналов n и m предельной формы – в виде прямоугольных импульсов. Оценивались два фактора: сохранение формы полезного сигнала и подавление статистических шумов, наложенных на полезный сигнал. При установке СРД без усреднения данных по массиву М (Кs = 1, прогноз Мi по текущим значениям массива М) при любых значениях окна Кс выходной массив Z без всяких изменений повторяет массив N, т.е. не изменяет полезный сигнал и полностью сохраняет его частотные характеристики. Естественно, при условии, что массив М пропорционален массиву N. При Кs > 1 форма выходных кривых несколько изменяется и приведена на рис. 11.3.1. В индексах выходных кривых z приведена информация по установкам окон СРД: первая цифра - окно счета дисперсии DM и текущего значения (в количестве точек отсчетов), вторая цифра (через флеш) - окно сглаживания отсчетов М весовой функцией Лапласа-Гаусса и определения прогнозных отсчетов Мi. Для сравнения с результатами типовой низкочастотной фильтрации на рисунке приведена кривая n25 отсчетов N, сглаженных весовой функцией Лапласа-Гаусса с окном 25 точек. Рис. 11.3.1. СРД прямоугольного импульса. Счет Dm по несглаженному массиву М. На рис. 11.3.1а приведен результат СРД прямоугольного импульса с амплитудным значением 10 на фоне 5 при отношении m/n = 1 (равные значения отсчетов N и М). Дисперсия DN в выражении (11.2.21) принималась равной значению отсчетов N (статистика Пуассона). Как видно на рисунке, при сохранении фронтов сигнальной функции сглаживание прогнозных значений Мi приводит к появлению искажения формы сигнала по обеим сторонам скачка, интервал которого тем больше, чем больше значение Ks. Амплитудное значение искажений, как это и следует из выражения (11.2.21), в первую очередь зависит от соотношения текущих значений DN и D(M) и в меньшей степени от глубины сглаживания прогнозных отсчетов. Максимальную величину искажения для точек скачка в первом приближении можно оценить из следующих соображений. Значения D(M) между точками скачка равны D(M) = А2/4, где А - амплитуда скачка, при этом значения коэффициента b для нижней и верхней точек скачка определяются выражениями b» А2/(4DN+A2), где DN = N точки скачка (для статистики Пуассона). Отсюда, при прогнозном значении М» N+А/2 для нижней точки скачка и M» N-A/2 для верхней точки относительная величина изменений N определится выражением d» 1/(2N/A+A), т.е. будет тем меньше, чем больше значения А и N и больше отношение N/A, что можно наглядно видеть на рис. 11.3.1в. Из этого выражения также следует, что максимальные искажения скачков, вносимые системой СРД, будут всегда в несколько раз меньше, чем статистические флюктуации непосредственных отсчетов d = 1/на краях скачков. При увеличении глубины регуляризации введением счета дисперсии D(M) по сглаженному массиву М картина искажений несколько изменяется и приведена на рис. 11.3.2. Реакция СРД на сглаживание дисперсии D(M) проявляется в своеобразной компенсации абсолютных отклонений отсчетов непосредственно по сторонам скачка отклонениями противоположного знака в более дальней зоне от скачка. Максимальные значения искажений остаются примерно на таком же уровне, как и для работы по несглаженной дисперсии D(M), с несколько меньшей зависимостью от увеличения значений N и А. Рис. 11.3.2. СРД прямоугольного импульса. Счет Dm по сглаженному массиву М. В приведенных примерах значение окна счета Кс принималось равным значению окна сглаживания Кs дополнительного массива М. При Кс > Ks картина процесса практически не изменяется. При обратном соотношении размеров окон вступает в действие второй фактор - отклонение от фактических значений счета текущих значений xi = m/n в малом окне Кс по массиву отсчетов, сглаженных с большим окном Ks. На расстояниях от скачка функции, больших Кс/2, СРД переходит в режим предпочтения сглаженных значений массива М, т.к. D(M) Þ 0, что при Кс < Ks может приводить к появлению существенной погрешности – выбросов на расстояниях ± Кс/2 от скачков. Естественно, что при практических измерениях таких условий наблюдаться не будет и эффект резко уменьшится, но для полного его исключения вариант Kc ³ Ks можно считать предпочтительным.
Рис. 11.3.3. СРД сигнала N по массиву M. Рис. 11.3.4. Коэффициент b. (Счет Dm по несглаженному массиву М). (Среднее статистическое по 50 циклам) На рис. 11.3.3 приведен пример регистрации рандомизированного модельного сигнала в виде прямоугольного импульса амплитудой 40 на фоне 10, на котором виден принцип работы СРД. Как и следовало ожидать, СРД производит сглаживание статистических флюктуаций фона и сигнала за пределами зоны ±Кс от скачка, отдавая предпочтение сглаженным прогнозным значениям Мi, и не изменяет значения фона и сигнала в пределах этой зоны в связи с резким возрастанием текущих значений D(M) в выражении (11.3.21). Изменение коэффициента b в зоне скачка, управляющего формированием выходных отсчетов, приведено на рис. 11.3.4 (среднестатистическое по 50-ти циклам рандомизации для модельного импульса на рис. 11.3.3) и наглядно показывает принцип адаптации СРД к динамике изменения значений обрабатываемых сигналов. Статистическая оценка регуляризации данных по прямоугольным импульсам проводилась по 50-ти циклам рандомизации исходных массивов N и M. В качестве примера на рисунках 11.3.5 и 6 приведены результаты обработки статистики массивов N и Z. Кроме статистики циклов рандомизации проводилась суммарная обработка всех циклов по общей статистике фона и вершины импульсов. Результаты обработки для тех же установок фильтров приведены в таблице 3.
Рис. 11.3.5. Статистика сигнала N Рис. 11.3.6. Статистика сигнала Z (Измерения по 50-ти циклам). (50 циклов. Счет Dm по несглаженному М) Таблица 3. Статистика значений фона и вершины импульсов (50 циклов).
Результаты моделирования подтверждают преимущество СРД перед простыми методами сглаживания. В числовой форме это наглядно проявляется в снижении дисперсии отсчетов выходного массива Z при практическом сохранении средних значений массива N и для фоновых отсчетов, и для амплитудных значений сигнала. При простом сглаживании "развал" фронтов сигнала (подавление высокочастотных составляющих спектра сигнала), как и должно быть при использовании низкочастотных фильтров, вызывает снижение по отношению к исходному массиву средних значений в максимумах и повышение фоновых значений сигнала, которое тем больше, чем больше окно весовой функции. Этот эффект особенно отчетливо проявляется в интервале окна фильтра по обе стороны от резких изменений сигнала. При отсутствии дополнительных массивов М, коррелированных с регуляризируемым массивом N, формирование прогнозных значений Мi может производиться по ближайшим окрестностям текущих значений Ni в скользящем окне Ks. При строго корректном подходе текущая точка Ni не должна включаться в число счета прогнозных значений Mi, но, как показало моделирование, это практически не влияет на результаты регуляризации. При прогнозировании Mi по всем точкам окна Ks массив М формируется любым методом сглаживания из массива N, и все особенности работы СРД по сглаженным массивам М, рассмотренные выше, остаются без изменений при условии счета значений Dm в окне Кс по массиву М. Для исключения выбросов по обе стороны от скачков полезного сигнала счет Dm как дисперсии прогнозных значений Mi необходимо выполнять непосредственно по массиву N. Фундаментальной особенностью СРД является возможность последовательной многократной фильтрации данных, при которой может осуществляться преимущественное повышение степени регуляризации данных с минимальными искажениями формы полезного сигнала. Для выполнения последнего размер окна Кс счета xi и Dm устанавливается минимальным (3-5 точек), а глубина регуляризации данных (степень подавления шумов) устанавливается количеством последовательных операций фильтрации (до 3-5 проходов). Пример регуляризации модельного массива N в три прохода приведен на рис. 11.3.7. Рис. 11.3.7. СРД одиночного массива N (3 прохода. Счет Dm по массиву n) Для сравнения пунктиром на рисунке приведено сглаживание массива 5-ти точечным фильтром Лапласа-Гаусса, который имеет коэффициент подавления шумов, эквивалентный 3-х проходному СРД (см. рис. 11.3.9). На рисунках 11.3.8 и 11.3.9 приведены результаты статистической обработки 3-х проходной СРД для 25 циклов моделирования в сравнении с 1-м проходом и с 5-ти точечным фильтром Лапласа-Гаусса (кривая n5). Рис. 11.3.8. Статистика средних значений Рис. 11.3.9. Статистика дисперсий (25 циклов. Счет Dm по массиву n) (25 циклов. Счет Dm по массиву n) Количество проходов может ограничиваться в автоматическом режиме, например, по среднеквадратическому значению корректирующих отсчетов Dzi = Ni - zi в каждом проходе по сравнению с предыдущим проходом, которое сначала резко уменьшается за счет сглаживания флюктуаций, а затем, в зависимости от динамики сигнальной функции, стабилизируется или даже начинает увеличиваться за счет искажения самого сигнала. Частотное представление работы СРД хорошо видно на рис. 11.3.10, где приведены модули спектров рандомизированного сигнала в виде меандра (средние значения в минимуме - 20, в максимуме - 100, 25 периодов по 40 отсчетов, всего 1000 отсчетов) и результатов его обработки СРД (окно Кс= 3, окно Кs= 3). Рис. 11.3.10. Модули спектров модельных сигналов. Рис.11.3.11. Участок спектра. (1– входной массив N, 2– выходной массив Z, один цикл CРД, 3– выходной массив Z, три цикла CРД), 4 – массив нерандомизированного меандра). Модуль спектра основного полезного сигнала (в данном случае чистого меандра) представляет собой последовательность отдельных частотных гармоник по всему диапазону спектра. В спектре рандомизированного меандра эти частотные гармоники суммируются со спектром шума, статистически равномерно распределенным по всему частотному диапазону (спектр шума на рисунке для наглядности сглажен). СРД осуществляет подавление шумовых составляющих сигнала, практически не затрагивая частотных гармоник меандра и не изменяя их по амплитуде. Последнее можно видеть на рис. 11.3.11, где представлен отрезок спектра сигналов в высокочастотной части главного диапазона в области одной гармоники меандра (частотные составляющие шума не сглажены). При 3-х цикловом СРД высокочастотные составляющие шумов подавляются практически на порядок. Пример практического использования СРД приведен на рис. 11.3.12 при опробовании участка скважины, пересекающей пласты каменной соли, на содержание сильвинита по гамма-излучению Калия-40. По данным геологического опробования пласты сильвинита в толще вмещающих пород (галита) имеют достаточно резкие границы и однородны по содержанию сильвинита в пределах пластов. Исходная диаграмма ГК (детектор CsJ(Tl) со свинцовым фильтром толщиной 2 мм) и результаты фильтрации исходного массива данных ГК с использованием СРД и низкочастотного фильтра с весовым окном Лапласа-Гаусса приведены на рис. 11.3.12. Рис. 11.3.12. Диаграммы ГК. Результаты интерпретации диаграмм ГК симметричным деконволюционным цифровым фильтром (окно 13 точек) приведены на рис. 11.3.13. Как видно на рисунке, деконволюция по несглаженной диаграмме ГК дает существенные вариации содержания сильвинита в пределах пластов. Применение низкочастотной фильтрации диаграммы ГК снимает флюктуации содержания в пределах пластов, но существенно сглаживает границы пластов. Использование СРД позволяет устранить этот недостаток. Рис. 11.3.13. Результаты интерпретации диаграмм ГК. В заключение отметим, что СРД может использоваться для регуляризации не только ядернофизических данных, но и любых других числовых массивов непрерывных измерений, если радиус их корреляции не менее 3-5 отсчетов. В качестве примера на рис. 11.3.14 приведена диаграмма акустического каротажа, зарегистрированная с шагом дискретизации данных 20 см, сглаживание которой проведено СРД без потери пространственного разрешения. Рис. 11.3.14. Диаграмма акустического каротажа и результат ее обработки СРД (5 циклов, Kc = Ks = 3, физическое окно 0.6 м).
Дата добавления: 2014-01-03; Просмотров: 494; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |