Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Пример выполнения работы




I. Обработка результатов прямых измерений с многократными наблюдениями.

Методика обработки результатов измерений с многократными наблюдениями зависит от свойств погрешностей. Например, если погрешность за время измерений описывается стационарным случайным процессом, то эту стационарность следует контроли­ровать. Нестационарность процесса чаще всего может проявляться в форме изменений математического ожидания — систематичес­кой погрешности. Поэтому в ходе обработки данных необходимо убедиться в отсутствии ухода систематической погрешности.

Результаты измерений не должны содержать грубых погреш­ностей, которые исключают из расчетов. Для правильного выбора алгоритма обработки результатов наблюдений необходимо знать закон распределения погрешностей, который оценивают по экспе­риментальным результатам.

 

II. Идентификация формы закона распределения погрешностей.

Экспериментальные исследования погрешностей средств изме­рений различных типов показали, что существует много законов распределения погрешностей, причем часто они существенно отли­чаются от гауссовского. Поскольку знание реального закона распределения необходимо для выбора методики получения оцен­ки измеряемой величины, то в необходимых случаях приходится выбирать закон распределения, в наибольшей мере соответствую­щий экспериментальным данным — идентифицировать форму за­кона распределения.

Гистограмма. Исходные данные для выбора закона распреде­ления получают из гистограммы. Для ее построения по результа­там многократных наблюдений строят вариационный ряд — рас­полагают результаты в порядке возрастания и выбирают мини­мальное x 1 и максимальное xn значения — крайние члены вариа­ционного ряда. Отрезок xnx 1между ними делят на т интерва­лов одинаковой протяженности d. Интервалы ограничены - значе­ниями xi и xi +1, где xi = x 1+(i -1) d; xi +1= x 1+ id (I= 1,2,3…. m +1). Заметим, что верхняя граница последнего интервала xm +1 = xn. По вариационному ряду определяют число ni резуль­татов, попавших в каждый интервал, а затем вычисляют отно­сительные частоты ni/n.

Относительные частоты являются оценками вероятности pi /попадания результатов в данный интервал, т. е. . Норми­рованные по ширине интервала относительные частоты ni/nd могут служить оценкой среднего значения плотности вероятностей на интервале. Границы интервалов откладывают на числовой оси, а на каждом интервале строят столбик высотой ni/nd. По совокупности столбиков оценивают форму изменения плотности вероятностей. В пределе при п ®¥и d ®¥ гистограмма превра­щается в плавную кривую.

Рис. 2.5 Пример построения гистограммы

 

Расчет гистограммы на ЭВМ имеет некоторые особенности. Границы гистограммы иногда определяют, исходя из априорных сведений о погрешностях с некоторым запасом. После выбора числа разбиений т и расчета границ интервалов переходят к вычислению ni. Перебор результатов наблюдений требует опреде­ленных затрат машинного времени, его можно существенно сократить, если номер интервала, в который попадает данный результат, определять как частное (xi-x 1 )/d, значение которого округляют в большую сторону до ближайшего целого. Принятая методика позволяет рассчитывать гистограмму в реальном масш­табе времени по мере поступления экспериментальных данных.

Выбор числа разбиений при построении гистограммы. Изре­занность гистограммы можно уменьшить путем укрупнения интер­валов. Так, увеличение интервала вдвое приведет к возрастанию приблизительно в два раза, а относительное СКО высоты столбцов уменьшится в раз. Однако cростом интервала d теряется информация о форме изменения искомой плотности вероятностей, так как сглаживаются его особенности. Так, по гистограмме из трех столбиков любое колоколообразное или трапецеидальное распределение будет оценено как треугольное. Если же взять один интервал, то независимо от формы исходной плотности вероятностей распределение будет сведено к равномер­ному.

Для каждого вида закона распределения существует оптималь­ное число интервалов, при котором гистограмма будет в наиболь­шей мере соответствовать изменению плотности вероятности.

Оптимальное число интервалов в первую очередь должно зави­сеть от числа наблюдений. Действительно, если принять СКО высоты столбцов не зависящим от числа измерений, то с ростом п число интервалов также должно возрастать. Кроме того, число интервалов зависит от эксцесса. Исследования показали, что для большинства встречающихся на практике законов рас­пределения, включая трапецеидальный, гауссовский, Лапласа, оптимальное число интервалов:

.

Если эксцесс закона распределения неизвестен, но заключен в интервале — 1, 2... 3, то оптимальное число m лежит от mн = 5,4* lg n /10 до тв = 9,8lg n /10. Область значений т при разных чис­лах наблюдений показана на рис. 2.6.

Рис 2.6

 

Выбор интервалов одинаковой длины не всегда целесообразен. Так, на участках быстрого изменения плотности вероятностей или в тех точках, где плотность вероятностей меняется скачкообраз­но, интервалы следует уменьшить. Крайние же столбцы гисто­граммы можно сделать более протяженными.

 

III. Обработка результатов наблюдений, содержащих грубые погрешности.

В ходе статистической обработки результатов многократных наблюдений иногда выясняется, что некоторые результаты ано­мальны, т.е. значительно превышают ожидаемую погрешность. Аномальные результаты могут быть проявлением случайного характера погрешностей или особенностей измеряемой величины. Такие результаты следует сохранить для последующей обработки. Однако появление аномальных результатов может быть и обуслов­лено факторами, не отражающими сущность эксперимента. Напри­мер, причиной аномальных результатов могут быть скачки питаю­щего напряжения, вызванные включением в сеть мощных потреби­телей энергии. Помехи такого типа не в полной мере подавляются стабилизаторами источников питания средств измерений и могут вызывать резкие непредсказуемые изменения показаний. В этом случае считают, что результат содержит грубую погрешность, и его исключают из дальнейшей обработки.

Разработка и анализ методов исключения имеют большое практическое значение, поскольку при использовании сложной измерительной аппаратуры доля аномальных результатов может достигать 10...15% общего числа измерений.

Общие методы исключения грубых погрешностей. Вопрос об исключении аномальных результатов невозможно однозначно ре­шить в общем виде, поскольку для принятия такого решения необходим тщательный анализ конкретных целей эксперимента, особенностей измерительной аппаратуры и характера поведения измеряемой величины. Особую осторожность следует проявлять тогда, когда исследуются процессы с мало изученными харак­теристиками.

Иногда основанием для исключения аномальных результа­тов могут служить эвристические b, связанные, напри­мер, с воспоминаниями экспериментатора о нарушениях условий эксперимента. Если же проведение эксперимента и обработку его результатов осуществляют с помощью ИВК, то необходимы фор­мальные признаки исключения грубых погрешностей.

Наиболее распространенным методом исключения результатов, содержащих грубые погрешности, является цензурирование ре­зультатов измерений — исключение результатов, погрешности ко­торых превышают установленные границы цензурирования ± x ­ ц. Грубые оценки границы получают, пользуясь правилом «трех сиг­ма», согласно которому границы цензурирования хц = 3s. Для гауссовского закона распределения погрешностей вероятность пре­вышения погрешностью этого уровня составляет 0,0027 (рис. 2.7) и результат с такой погрешностью исключают. При равномерном законе промахами вызваны все результаты, превышающие уровень , поэтому граница оказывается сильно завышенной.

Рис. 2.7

Для зако­на Лапласа вероятность выхода погрешности за пределы ±3s сос­тавляет 0,05, так что такие события нельзя считать маловероят­ными и исключать результаты неправомерно.

Таким образом, границу цензурирования следует выбирать в зависимости от того, насколько быстро спадает плотность вероят­ности на краях графика. Протяженность спадающей части графика характеризуют эксцессом, поэтому и граница цензуриро­вания должна быть возрастающей функцией эксцесса.

Если задать определенную вероятность а выхода результатов за границу цензурирования, то очевидно, что число результатов, превысивших уровень границы, будет возрастать с ростом числа наблюдений. Для того чтобы практически все результаты, не содержащие грубых погрешностей, не выходили за границы цен­зурирования, необходимо сам уровень увеличивать сростом п.

Границы цензурирования, при которых в среднем из резуль­татов измерений исключается менее одного, определяются соотно­шением:

, (*)

справедливым для гауссовского и равномерного законов распре­деления, а также закона Лапласа.

Иногда границы рассчитывают по формуле xц = s (1+1,3 ).

Методика обработки результатов измерений, содержащих гру­бые погрешности. Для расчета границ цензурирования необхо­димо знать значения s и Е,вместо которых в формулу (*) подставляют их оценки, полученные по результатам наб­людений. При ограниченном числе наблюдений оценки определя­ются со значительными погрешностями, которые сильно возраста­ют из-за наличия результатов, содержащих промахи. Вычисленные на основании грубых оценок границы цензурирования могут быть сильно завышенными и служить основанием для ошибочных выводов. Поэтому задачу цензурирования решают методом последовательных приближений, постепенно уточняя полученные ре­зультаты.

Сначала определяют оценку математического ожидания ме­тодами, устойчивыми к промахам, например, взяв в качестве оценки медиану результатов измерений. Наиболее удаленные от математического ожидания результаты исключают во избежание резкого возрастания погрешностей оценок и рассчитывают гра­ницы цензурирования. Если в пределах границ окажется часть отброшенных результатов, то их возвращают в выборку и снова рассчитывают оценки и .

Если же среди не исключенных имеются результаты, превышаю­щие границы, то их отбрасывают и снова рассчитывают оценки. Процесс повторяют до тех пор, пока не будут исключены все результаты, содержащие грубые погрешности.

На окончательном этапе обработки выбирают эффективную оценку математического ожидания, для которой определяют окон­чательные значения и .

 

IV. Методика обработки результатов многократных наблюдений.

Пусть проведено п наблюдений измеряемой величины и полу­чены независимые результаты х 1, х 2 ,..., хn, каждый из которых содержит постоянную систематическую погрешность q и случай­ную погрешность.

Если в качестве оценки измеряемой величины принято среднеарифметическое полученных значений, то

Отсюда следует, что измерения с многократными наблюдениями не приводят к изменению систематической погрешности. Отдель­ные значения случайной погрешности могут иметь разные знаки, поэтому при суммировании некоторые значения будут взаимно компенсироваться. Можно показать, что дисперсия третьего сла­гаемого, являющегося случайной погрешностью результата изме­рений х, уменьшается с ростом п. Следовательно, многократные наблюдения целесообразно применять тогда, когда доминирует случайная погрешность и ее уменьшение может существенно уменьшить общую погрешность.

Принцип максимального правдоподобия. Пусть результаты xi наблюдений измеряемой величины подчинены закону распре­деления р (xi, X; q), где X — математическое ожидание, s — СКО. Вероятность появления результата измерений xi

pi (xi) = p (xi; X; s)D x, где D x ­– малый интервал.

Вероятность появления совокупности независимых результатов х 1, х 2 ,..., хn определяется как произведение вероятностей:

.

Параметры X и s до измерений неизвестны, поэтому их можно рассматривать как переменные. Метод максимального правдоподобия заключается в подборе таких значений Х и s, при которых вероятность появления результатов измерений макси­мальна.

Полученные оценки называют оценками максимального прав­доподобия. Их отыскивают по максимуму функции правдоподобия которая отличается от вероятности Р (х 1, x 2,..., хn)множителем D xn, не влияющим на решение:

Вычисление оценок максимального правдоподобия. Для гауссовского закона:

Если функция правдоподобия содержит сомножители с пока­зательными функциями, удобнее пользоваться логарифмической функцией правдоподобия

.

В данном случае функция правдоподобия дифференцируема, а ее производные непрерывны в точках xt. Поэтому оценки макси­мального правдоподобия находят, решая систему уравнений:

в результате:

Согласно закону Лапласа:

.

Логарифмическая функция правдоподобия не дифференцируема в точках хi, и ее максимум нельзя отыскать, приравняв нулю частные производные.

Определим максимум функции правдоподобия графическим методом. Для этого сделаем х переменным, заменив его. Семейства зависимостей отдельных слагаемых i, — х| от х для четных и нечетных п построены на рис 2.8 а и 2.8 б. Суммируя их, получаем зависимости от х (рис. 2.8 в и 2.8 г). Функция правдоподобия достигает мак­симума, если сумма минимальна. Следовательно, при нечетном п за оценку максимального правдоподобия следует взять медиану вариационного ряда, т.е.

Рис. 2.8

 

Для четных п функция правдоподобия максимальна на интер­вале от хn/ 2до xn/ 2+1. З а оценку максимального правдоподобия принимают середину этого интервала

При равномерном распределении погрешностей

где

Функция правдоподобия:

.

Очевидно, что все экспериментальные точки должны располагать­ся в пределах графика плотности вероятностей (рис. 2.9 а), т.е. оценки должны удовлетворять условиям , где х 1и xn ­- крайние значения вариационного ряда результатов хi. Функ­ция правдоподобия построена на рис. 2.9 б, из которого следует, что условный максимум функции правдоподобия имеет место при .

Оценка максимального правдоподобия:

Рис. 2.9

 

V. Обработка результатов измерений с многократными наблюдениями, подчиненных гауссовскому закону.

Полученные в IV пункте оценки максимального правдоподобия х и s называют точечными оценками результата измерений. В неко­торых случаях удобнее пользоваться интервальной оценкой – интервалом, в котором с заданной вероятностью лежит измеряемая величина. Пусть результаты наблюдений подчинены гауссовскому закону, статистически независимы и не содержат систематических погрешностей.

Оценка математического ожидания и дисперсии. Оценка мак­симального правдоподобия несмещенная, поскольку

.

Определение ее таким образом можно рассматривать как кос­венные измерения, поэтому СКО оценки

.

Оценка подчиняется гауссовскому закону распределения при любых п, поскольку композиция гауссовских законов при любом числе слагаемых дает гауссовский закон. Плотности вероятности p (xi) и р ()показаны на рис. 2.10.

Рис. 2.10

 

Использовать закон распределения р ()для отыскания дове­рительного интервала нельзя, так как значение s, аследовательно, и обычно неизвестны. Вместо s при анализе используют оценку максимального правдоподобия ее.

Определим, является ли эта оценка несмещенной. Для этого найдем математическое ожидание и после преобразований по­лучим

.

Следовательно, оценка максимального правдоподобия при конечном п является смещенной. При п ®¥ [(n —1)/ n ®¥ и , откуда следует асимптотическая несмещенность оценки.

При расчетах используют несмещенную оценку:

.

Оценка СКО среднеарифметического:

,

которая является случайной величиной.

Критерий согласия хи-квадрат (Пирсона). Пусть произведе­но п независимых измерений некоторой величины X, рассматривае­мой как случайная. Результаты измерений для удобства представляются в виде вариационного ряда, - последовательности измеренных значений величины, расположенных в порядке возрастания от наименьшего до наибольшего. Например, пусть имеются результаты измерений постоянного электрического напряжения U на выходе электронного узла (в порядке произведения измерений) – табл. 2.1:

Таблица 2.1

Номер измере- ния                                        
U, В                                        

 

Данная первичная форма записи результатов измерений преобразуется в вариационный ряд (табл. 2.2):

Таблица 2.2

Номер ряда                                        
U, В                                        

 

Дальше весь диапазон измеренных значений величины U разделяется на некоторое число разрядов (интервалов). Число этих разрядов определяется различными способами; так можно пользоваться формулой

,

где k – число разрядов; n – число измерений.

В рассмотренном примере число разрядов можно принять равным пяти.

После определения числа разрядов вариационного ряда строиться статический ряд-таблица, в которой приведены длины разрядов Ii (в порядке их соответствия оси абсцисс измеряемой величины X), количества значений величины mi, оказавшихся в том или ином разряде, а также статические частоты P * i.

В таблице границы разрядов обозначаются как x i, xi +1. Затем находятся теоретические вероятности попадания величины X в каждый из разрядов: P 1, P 2, …, Pk.

Например, если теоретический закон нормальный, то с помощью формулы нетрудно определить теоретическую вероятность в разряде (xi , xi +1).

,

где mx и - соответственно математическое ожидание и СКО величины X. Поскольку они неизвестны, то при расчетах заменяются статическими значениями m * x – средним арифметическим значением и статическим СКО Sx (табл. 2.3)

Таблица 2.3

Ii x 1; x 2 x 2; x 3 xi, xi +1 xk, xk +1
mi m 1 m 2 mi mk
P*i P* 1 = m 1 / n P* 2 = m 2 / n P*i= mi/n P*k= mk/n

В качестве меры расхождения между теоретическими вероятностями и статистическими частотами критерий хи-квадрат предусматривает использование величины

где n и k – число измерений и разрядов статического ряда соответственно.

К. Пирсон доказал, что при большом числе измерений n закон распределения величины практически не зависит от вида функции F (x), а зависит от числа разрядов k (n). При ограниченном увеличении числа n этот закон близок к распределению «хи-квадрат» с r степенями свободы (это распределение суммы квадратов r независимых случайных величин, каждая из которых распределена по нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице), с плотностью распределения U =

при U > 0,

где - гамма функция.

Число степеней свободы распределения хи-квадрат r = k - s, где s -число независимых условий, которым должны удовлетворять статические вероятности . Число s определяется формой теоретического закона распределения. Для симметричных законов распределения, таких, например, как нормальный, их три.

1. Сумма статических вероятностей должна быть равной единице

2. Математическое ожидание и среднее арифметическое значение должны совпадать

где - среднее значение величины X в i -м разряде.

3. Теоретическая и статическая дисперсии должны совпадать

.

Для симметричных (равномерный, Симпсона) и несимметричных законов число налагаемых независимых условий может возрасти (например, коэффициенты асимметрии или эксцессы теоретического и эмпирического законов распределения должны совпадать).

Если в процессе использования критерия согласия хи-квадрат определена величина , то по числам r и с помощью таблицы (приложение IIB) находится вероятность p того, что величина, имеющая распределение с r степенями свободы, превзойдет данное значение .

Вероятность p есть вероятность того, что за счет чисто случайных причин мера расхождения теоретического и эмпирического распределений должна быть не меньше, чем полученная по результатам измерений.

Если вероятность p достаточно большая, то расхождение между теоретическим и эмпирическим законами распределения следует рассматривать как несущественное, а гипотезу о том, что величина X имеет теоретическое распределение с плотностью (x), считать правдоподобной. Если же вероятность p, наоборот, слишком мала, то гипотезу следует отклонить как неправдоподобную. Ответить на вопрос, какая вероятность p может считаться слишком малой, чтобы отвергнуть гипотезу о постулируемом теоретическом законе распределения, не просто. Все зависит от условий проведения измерений, их тщательности и, в значительной мере, от числа проведенных измерений. Если экспериментатор вполне уверен в качестве выполненной серии измерений, практически исключенных систематических погрешностей, то вероятность p, превышающая 0,2, может рассматриваться как не столь малая, при которой постулируемый теоретический закон следует исключить и рассмотрения. Тем более, если из физических соображений этот закон соответствует выдвинутой гипотезе.

И, наоборот, если вероятность p слишком велика, например, больше 0,95, то следует с настороженностью подойти к принятию гипотезы. Действительно, расхождение между теоретическим и эмпирическим распределениями в этом случае столь мало, что такое «удачное» совпадение скорее вызвано не случайными причинами, а недостатками обработки результатов измерений. Поэтому правдоподобность проверяемой гипотезы можно поставить под сомнение, если только число измерений не составляет более 300…500.

Рассмотрим пример. При проведении 500 опытов для нахождения абсолютной погрешности автоматического наведения радиотелескопа в заданную точку небесной сферы (в угловых секундах) получены результаты, сведенные в статистический ряд (табл. 2.4):

Таблица 2.4

i= i -8;-6 -6;-4 -4;-2 -2;0 0;+2 +2;+4 +4;+6 +6;+8
mi                
0,010 0,052 0,148 0,262 0,274 0,172 0,060 0,022

Требуется идентифицировать закон распределения погрешностей по данным статистического ряда одному из теоретических законов распределения.

1. Построим гистограмму как графическое представление статической плотности распределения. Вид гистограммы на рис. 2.11 свидетельствует о том, что возможной теоретической моделью данного распределения является нормальный закон, который и примем с целью идентификации.

2. Определим статистические оценки числовых параметров нормального распределения – математического ожидания m и дисперсии .

Рис. 2.11 Гистограмма погрешности наведения радиотелескопа

 

Среднее арифметическое значение погрешности найдем по формуле

,

где - среднее арифметическое погрешности в i -м разряде;

= (-7*0,01)+(-5*0,052)+(-3*0,148)+(-1*0,262)+1*0,274+3*0,172+5*0,06+

+7*0,022 = 0,208 угл. с.

Статическую дисперсию определим с помощью формулы

. Тогда = 7,784(угл. с)2. Затем =7,784-0,043 = 7,74 (угл. с.)2. Статическое СКО = 2,78 угл. с.

3. Найдем теоретические вероятности попадания случайной величины в каждый из разрядов, используя формулу и таблицу функции Лапласа (приложение 3A):

p 2=0.0526; p 3=0.1493; p 4=0.2573; p 5=0.2668; p 6=0.1742; p 7=0.0681; p 8=0.0162

Вообще говоря, сумма теоретических вероятностей должна быть равна 1. В нашем случае = 0,99, так как табличные аргументы функции Лапласа обычно позволяют учесть только два разряда после запятой.

4. С помощью формулы определим меру расхождения

5. Находим число степеней свободы распределения хи-квадрат с учетом того, что достаточное число независимых условий для нормального закона равно тем: r = k - s = 8 – 3 = 5.

6. Входим в таблицу приложения 3В и в соответствии с числами = 3,78 и r = 5 определяем значение вероятности сходимости эмпирического и теоретического законов распределения p = 0,6, экстраполируя величину = 3,78 между «соседними» значениями таблицы 3,00 и 4,35.

7. Вероятность p = 0,6 следует считать вполне достаточной для того, чтобы сделать уверенный вывод о том, что гипотеза о соответствии эмпирического закона нормальному закону распределения не противоречит полученным экспериментальным данным. Уверенности такого заключения, конечно, способствует, тот факт, что информация о наблюдаемой погрешности наведения радиотелескопа достаточно самостоятельна (репрезентативна). Так, те же числовые характеристики, полученные всего по 50 измерениям, могли случайно дать столь хорошее совпадение распределений по критерию хи-квадрат или, наоборот, могли привести к необходимости признания экспериментальных данных противоречащими гипотезе о нормальном законе распределения излучаемой величины.

 




Поделиться с друзьями:


Дата добавления: 2015-04-30; Просмотров: 578; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.