КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Пример выполнения работы
I. Обработка результатов прямых измерений с многократными наблюдениями. Методика обработки результатов измерений с многократными наблюдениями зависит от свойств погрешностей. Например, если погрешность за время измерений описывается стационарным случайным процессом, то эту стационарность следует контролировать. Нестационарность процесса чаще всего может проявляться в форме изменений математического ожидания — систематической погрешности. Поэтому в ходе обработки данных необходимо убедиться в отсутствии ухода систематической погрешности. Результаты измерений не должны содержать грубых погрешностей, которые исключают из расчетов. Для правильного выбора алгоритма обработки результатов наблюдений необходимо знать закон распределения погрешностей, который оценивают по экспериментальным результатам.
II. Идентификация формы закона распределения погрешностей. Экспериментальные исследования погрешностей средств измерений различных типов показали, что существует много законов распределения погрешностей, причем часто они существенно отличаются от гауссовского. Поскольку знание реального закона распределения необходимо для выбора методики получения оценки измеряемой величины, то в необходимых случаях приходится выбирать закон распределения, в наибольшей мере соответствующий экспериментальным данным — идентифицировать форму закона распределения. Гистограмма. Исходные данные для выбора закона распределения получают из гистограммы. Для ее построения по результатам многократных наблюдений строят вариационный ряд — располагают результаты в порядке возрастания и выбирают минимальное x 1 и максимальное xn значения — крайние члены вариационного ряда. Отрезок xn – x 1между ними делят на т интервалов одинаковой протяженности d. Интервалы ограничены - значениями xi и xi +1, где xi = x 1+(i -1) d; xi +1= x 1+ id (I= 1,2,3…. m +1). Заметим, что верхняя граница последнего интервала xm +1 = xn. По вариационному ряду определяют число ni результатов, попавших в каждый интервал, а затем вычисляют относительные частоты ni/n. Относительные частоты являются оценками вероятности pi /попадания результатов в данный интервал, т. е. . Нормированные по ширине интервала относительные частоты ni/nd могут служить оценкой среднего значения плотности вероятностей на интервале. Границы интервалов откладывают на числовой оси, а на каждом интервале строят столбик высотой ni/nd. По совокупности столбиков оценивают форму изменения плотности вероятностей. В пределе при п ®¥и d ®¥ гистограмма превращается в плавную кривую. Рис. 2.5 Пример построения гистограммы
Расчет гистограммы на ЭВМ имеет некоторые особенности. Границы гистограммы иногда определяют, исходя из априорных сведений о погрешностях с некоторым запасом. После выбора числа разбиений т и расчета границ интервалов переходят к вычислению ni. Перебор результатов наблюдений требует определенных затрат машинного времени, его можно существенно сократить, если номер интервала, в который попадает данный результат, определять как частное (xi-x 1 )/d, значение которого округляют в большую сторону до ближайшего целого. Принятая методика позволяет рассчитывать гистограмму в реальном масштабе времени по мере поступления экспериментальных данных. Выбор числа разбиений при построении гистограммы. Изрезанность гистограммы можно уменьшить путем укрупнения интервалов. Так, увеличение интервала вдвое приведет к возрастанию приблизительно в два раза, а относительное СКО высоты столбцов уменьшится в раз. Однако cростом интервала d теряется информация о форме изменения искомой плотности вероятностей, так как сглаживаются его особенности. Так, по гистограмме из трех столбиков любое колоколообразное или трапецеидальное распределение будет оценено как треугольное. Если же взять один интервал, то независимо от формы исходной плотности вероятностей распределение будет сведено к равномерному. Для каждого вида закона распределения существует оптимальное число интервалов, при котором гистограмма будет в наибольшей мере соответствовать изменению плотности вероятности. Оптимальное число интервалов в первую очередь должно зависеть от числа наблюдений. Действительно, если принять СКО высоты столбцов не зависящим от числа измерений, то с ростом п число интервалов также должно возрастать. Кроме того, число интервалов зависит от эксцесса. Исследования показали, что для большинства встречающихся на практике законов распределения, включая трапецеидальный, гауссовский, Лапласа, оптимальное число интервалов: . Если эксцесс закона распределения неизвестен, но заключен в интервале — 1, 2... 3, то оптимальное число m лежит от mн = 5,4* lg n /10 до тв = 9,8lg n /10. Область значений т при разных числах наблюдений показана на рис. 2.6. Рис 2.6
Выбор интервалов одинаковой длины не всегда целесообразен. Так, на участках быстрого изменения плотности вероятностей или в тех точках, где плотность вероятностей меняется скачкообразно, интервалы следует уменьшить. Крайние же столбцы гистограммы можно сделать более протяженными.
III. Обработка результатов наблюдений, содержащих грубые погрешности. В ходе статистической обработки результатов многократных наблюдений иногда выясняется, что некоторые результаты аномальны, т.е. значительно превышают ожидаемую погрешность. Аномальные результаты могут быть проявлением случайного характера погрешностей или особенностей измеряемой величины. Такие результаты следует сохранить для последующей обработки. Однако появление аномальных результатов может быть и обусловлено факторами, не отражающими сущность эксперимента. Например, причиной аномальных результатов могут быть скачки питающего напряжения, вызванные включением в сеть мощных потребителей энергии. Помехи такого типа не в полной мере подавляются стабилизаторами источников питания средств измерений и могут вызывать резкие непредсказуемые изменения показаний. В этом случае считают, что результат содержит грубую погрешность, и его исключают из дальнейшей обработки. Разработка и анализ методов исключения имеют большое практическое значение, поскольку при использовании сложной измерительной аппаратуры доля аномальных результатов может достигать 10...15% общего числа измерений. Общие методы исключения грубых погрешностей. Вопрос об исключении аномальных результатов невозможно однозначно решить в общем виде, поскольку для принятия такого решения необходим тщательный анализ конкретных целей эксперимента, особенностей измерительной аппаратуры и характера поведения измеряемой величины. Особую осторожность следует проявлять тогда, когда исследуются процессы с мало изученными характеристиками. Иногда основанием для исключения аномальных результатов могут служить эвристические b, связанные, например, с воспоминаниями экспериментатора о нарушениях условий эксперимента. Если же проведение эксперимента и обработку его результатов осуществляют с помощью ИВК, то необходимы формальные признаки исключения грубых погрешностей. Наиболее распространенным методом исключения результатов, содержащих грубые погрешности, является цензурирование результатов измерений — исключение результатов, погрешности которых превышают установленные границы цензурирования ± x ц. Грубые оценки границы получают, пользуясь правилом «трех сигма», согласно которому границы цензурирования хц = 3s. Для гауссовского закона распределения погрешностей вероятность превышения погрешностью этого уровня составляет 0,0027 (рис. 2.7) и результат с такой погрешностью исключают. При равномерном законе промахами вызваны все результаты, превышающие уровень , поэтому граница оказывается сильно завышенной.
Рис. 2.7 Для закона Лапласа вероятность выхода погрешности за пределы ±3s составляет 0,05, так что такие события нельзя считать маловероятными и исключать результаты неправомерно. Таким образом, границу цензурирования следует выбирать в зависимости от того, насколько быстро спадает плотность вероятности на краях графика. Протяженность спадающей части графика характеризуют эксцессом, поэтому и граница цензурирования должна быть возрастающей функцией эксцесса. Если задать определенную вероятность а выхода результатов за границу цензурирования, то очевидно, что число результатов, превысивших уровень границы, будет возрастать с ростом числа наблюдений. Для того чтобы практически все результаты, не содержащие грубых погрешностей, не выходили за границы цензурирования, необходимо сам уровень увеличивать сростом п. Границы цензурирования, при которых в среднем из результатов измерений исключается менее одного, определяются соотношением: , (*) справедливым для гауссовского и равномерного законов распределения, а также закона Лапласа. Иногда границы рассчитывают по формуле xц = s (1+1,3 ). Методика обработки результатов измерений, содержащих грубые погрешности. Для расчета границ цензурирования необходимо знать значения s и Е,вместо которых в формулу (*) подставляют их оценки, полученные по результатам наблюдений. При ограниченном числе наблюдений оценки определяются со значительными погрешностями, которые сильно возрастают из-за наличия результатов, содержащих промахи. Вычисленные на основании грубых оценок границы цензурирования могут быть сильно завышенными и служить основанием для ошибочных выводов. Поэтому задачу цензурирования решают методом последовательных приближений, постепенно уточняя полученные результаты. Сначала определяют оценку математического ожидания методами, устойчивыми к промахам, например, взяв в качестве оценки медиану результатов измерений. Наиболее удаленные от математического ожидания результаты исключают во избежание резкого возрастания погрешностей оценок и рассчитывают границы цензурирования. Если в пределах границ окажется часть отброшенных результатов, то их возвращают в выборку и снова рассчитывают оценки и . Если же среди не исключенных имеются результаты, превышающие границы, то их отбрасывают и снова рассчитывают оценки. Процесс повторяют до тех пор, пока не будут исключены все результаты, содержащие грубые погрешности. На окончательном этапе обработки выбирают эффективную оценку математического ожидания, для которой определяют окончательные значения и .
IV. Методика обработки результатов многократных наблюдений. Пусть проведено п наблюдений измеряемой величины и получены независимые результаты х 1, х 2 ,..., хn, каждый из которых содержит постоянную систематическую погрешность q и случайную погрешность. Если в качестве оценки измеряемой величины принято среднеарифметическое полученных значений, то Отсюда следует, что измерения с многократными наблюдениями не приводят к изменению систематической погрешности. Отдельные значения случайной погрешности могут иметь разные знаки, поэтому при суммировании некоторые значения будут взаимно компенсироваться. Можно показать, что дисперсия третьего слагаемого, являющегося случайной погрешностью результата измерений х, уменьшается с ростом п. Следовательно, многократные наблюдения целесообразно применять тогда, когда доминирует случайная погрешность и ее уменьшение может существенно уменьшить общую погрешность. Принцип максимального правдоподобия. Пусть результаты xi наблюдений измеряемой величины подчинены закону распределения р (xi, X; q), где X — математическое ожидание, s — СКО. Вероятность появления результата измерений xi pi (xi) = p (xi; X; s)D x, где D x – малый интервал. Вероятность появления совокупности независимых результатов х 1, х 2 ,..., хn определяется как произведение вероятностей: . Параметры X и s до измерений неизвестны, поэтому их можно рассматривать как переменные. Метод максимального правдоподобия заключается в подборе таких значений Х и s, при которых вероятность появления результатов измерений максимальна. Полученные оценки называют оценками максимального правдоподобия. Их отыскивают по максимуму функции правдоподобия которая отличается от вероятности Р (х 1, x 2,..., хn)множителем D xn, не влияющим на решение: Вычисление оценок максимального правдоподобия. Для гауссовского закона: Если функция правдоподобия содержит сомножители с показательными функциями, удобнее пользоваться логарифмической функцией правдоподобия . В данном случае функция правдоподобия дифференцируема, а ее производные непрерывны в точках xt. Поэтому оценки максимального правдоподобия находят, решая систему уравнений: в результате: Согласно закону Лапласа: . Логарифмическая функция правдоподобия не дифференцируема в точках хi, и ее максимум нельзя отыскать, приравняв нулю частные производные. Определим максимум функции правдоподобия графическим методом. Для этого сделаем х переменным, заменив его. Семейства зависимостей отдельных слагаемых |хi, — х| от х для четных и нечетных п построены на рис 2.8 а и 2.8 б. Суммируя их, получаем зависимости от х (рис. 2.8 в и 2.8 г). Функция правдоподобия достигает максимума, если сумма минимальна. Следовательно, при нечетном п за оценку максимального правдоподобия следует взять медиану вариационного ряда, т.е. Рис. 2.8
Для четных п функция правдоподобия максимальна на интервале от хn/ 2до xn/ 2+1. З а оценку максимального правдоподобия принимают середину этого интервала При равномерном распределении погрешностей где Функция правдоподобия: . Очевидно, что все экспериментальные точки должны располагаться в пределах графика плотности вероятностей (рис. 2.9 а), т.е. оценки должны удовлетворять условиям , где х 1и xn - крайние значения вариационного ряда результатов хi. Функция правдоподобия построена на рис. 2.9 б, из которого следует, что условный максимум функции правдоподобия имеет место при . Оценка максимального правдоподобия:
Рис. 2.9
V. Обработка результатов измерений с многократными наблюдениями, подчиненных гауссовскому закону. Полученные в IV пункте оценки максимального правдоподобия х и s называют точечными оценками результата измерений. В некоторых случаях удобнее пользоваться интервальной оценкой – интервалом, в котором с заданной вероятностью лежит измеряемая величина. Пусть результаты наблюдений подчинены гауссовскому закону, статистически независимы и не содержат систематических погрешностей. Оценка математического ожидания и дисперсии. Оценка максимального правдоподобия несмещенная, поскольку . Определение ее таким образом можно рассматривать как косвенные измерения, поэтому СКО оценки . Оценка подчиняется гауссовскому закону распределения при любых п, поскольку композиция гауссовских законов при любом числе слагаемых дает гауссовский закон. Плотности вероятности p (xi) и р ()показаны на рис. 2.10. Рис. 2.10
Использовать закон распределения р ()для отыскания доверительного интервала нельзя, так как значение s, аследовательно, и обычно неизвестны. Вместо s при анализе используют оценку максимального правдоподобия ее. Определим, является ли эта оценка несмещенной. Для этого найдем математическое ожидание и после преобразований получим . Следовательно, оценка максимального правдоподобия при конечном п является смещенной. При п ®¥ [(n —1)/ n ®¥ и , откуда следует асимптотическая несмещенность оценки. При расчетах используют несмещенную оценку: . Оценка СКО среднеарифметического: , которая является случайной величиной. Критерий согласия хи-квадрат (Пирсона). Пусть произведено п независимых измерений некоторой величины X, рассматриваемой как случайная. Результаты измерений для удобства представляются в виде вариационного ряда, - последовательности измеренных значений величины, расположенных в порядке возрастания от наименьшего до наибольшего. Например, пусть имеются результаты измерений постоянного электрического напряжения U на выходе электронного узла (в порядке произведения измерений) – табл. 2.1: Таблица 2.1
Данная первичная форма записи результатов измерений преобразуется в вариационный ряд (табл. 2.2): Таблица 2.2
Дальше весь диапазон измеренных значений величины U разделяется на некоторое число разрядов (интервалов). Число этих разрядов определяется различными способами; так можно пользоваться формулой , где k – число разрядов; n – число измерений. В рассмотренном примере число разрядов можно принять равным пяти. После определения числа разрядов вариационного ряда строиться статический ряд-таблица, в которой приведены длины разрядов Ii (в порядке их соответствия оси абсцисс измеряемой величины X), количества значений величины mi, оказавшихся в том или ином разряде, а также статические частоты P * i. В таблице границы разрядов обозначаются как x i, xi +1. Затем находятся теоретические вероятности попадания величины X в каждый из разрядов: P 1, P 2, …, Pk. Например, если теоретический закон нормальный, то с помощью формулы нетрудно определить теоретическую вероятность в разряде (xi , xi +1). , где mx и - соответственно математическое ожидание и СКО величины X. Поскольку они неизвестны, то при расчетах заменяются статическими значениями m * x – средним арифметическим значением и статическим СКО Sx (табл. 2.3) Таблица 2.3
В качестве меры расхождения между теоретическими вероятностями и статистическими частотами критерий хи-квадрат предусматривает использование величины где n и k – число измерений и разрядов статического ряда соответственно. К. Пирсон доказал, что при большом числе измерений n закон распределения величины практически не зависит от вида функции F (x), а зависит от числа разрядов k (n). При ограниченном увеличении числа n этот закон близок к распределению «хи-квадрат» с r степенями свободы (это распределение суммы квадратов r независимых случайных величин, каждая из которых распределена по нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице), с плотностью распределения U = при U > 0, где - гамма функция. Число степеней свободы распределения хи-квадрат r = k - s, где s -число независимых условий, которым должны удовлетворять статические вероятности . Число s определяется формой теоретического закона распределения. Для симметричных законов распределения, таких, например, как нормальный, их три. 1. Сумма статических вероятностей должна быть равной единице 2. Математическое ожидание и среднее арифметическое значение должны совпадать где - среднее значение величины X в i -м разряде. 3. Теоретическая и статическая дисперсии должны совпадать . Для симметричных (равномерный, Симпсона) и несимметричных законов число налагаемых независимых условий может возрасти (например, коэффициенты асимметрии или эксцессы теоретического и эмпирического законов распределения должны совпадать). Если в процессе использования критерия согласия хи-квадрат определена величина , то по числам r и с помощью таблицы (приложение IIB) находится вероятность p того, что величина, имеющая распределение с r степенями свободы, превзойдет данное значение . Вероятность p есть вероятность того, что за счет чисто случайных причин мера расхождения теоретического и эмпирического распределений должна быть не меньше, чем полученная по результатам измерений. Если вероятность p достаточно большая, то расхождение между теоретическим и эмпирическим законами распределения следует рассматривать как несущественное, а гипотезу о том, что величина X имеет теоретическое распределение с плотностью (x), считать правдоподобной. Если же вероятность p, наоборот, слишком мала, то гипотезу следует отклонить как неправдоподобную. Ответить на вопрос, какая вероятность p может считаться слишком малой, чтобы отвергнуть гипотезу о постулируемом теоретическом законе распределения, не просто. Все зависит от условий проведения измерений, их тщательности и, в значительной мере, от числа проведенных измерений. Если экспериментатор вполне уверен в качестве выполненной серии измерений, практически исключенных систематических погрешностей, то вероятность p, превышающая 0,2, может рассматриваться как не столь малая, при которой постулируемый теоретический закон следует исключить и рассмотрения. Тем более, если из физических соображений этот закон соответствует выдвинутой гипотезе. И, наоборот, если вероятность p слишком велика, например, больше 0,95, то следует с настороженностью подойти к принятию гипотезы. Действительно, расхождение между теоретическим и эмпирическим распределениями в этом случае столь мало, что такое «удачное» совпадение скорее вызвано не случайными причинами, а недостатками обработки результатов измерений. Поэтому правдоподобность проверяемой гипотезы можно поставить под сомнение, если только число измерений не составляет более 300…500. Рассмотрим пример. При проведении 500 опытов для нахождения абсолютной погрешности автоматического наведения радиотелескопа в заданную точку небесной сферы (в угловых секундах) получены результаты, сведенные в статистический ряд (табл. 2.4): Таблица 2.4
Требуется идентифицировать закон распределения погрешностей по данным статистического ряда одному из теоретических законов распределения. 1. Построим гистограмму как графическое представление статической плотности распределения. Вид гистограммы на рис. 2.11 свидетельствует о том, что возможной теоретической моделью данного распределения является нормальный закон, который и примем с целью идентификации. 2. Определим статистические оценки числовых параметров нормального распределения – математического ожидания m и дисперсии . Рис. 2.11 Гистограмма погрешности наведения радиотелескопа
Среднее арифметическое значение погрешности найдем по формуле , где - среднее арифметическое погрешности в i -м разряде; = (-7*0,01)+(-5*0,052)+(-3*0,148)+(-1*0,262)+1*0,274+3*0,172+5*0,06+ +7*0,022 = 0,208 угл. с. Статическую дисперсию определим с помощью формулы . Тогда = 7,784(угл. с)2. Затем =7,784-0,043 = 7,74 (угл. с.)2. Статическое СКО = 2,78 угл. с. 3. Найдем теоретические вероятности попадания случайной величины в каждый из разрядов, используя формулу и таблицу функции Лапласа (приложение 3A): p 2=0.0526; p 3=0.1493; p 4=0.2573; p 5=0.2668; p 6=0.1742; p 7=0.0681; p 8=0.0162 Вообще говоря, сумма теоретических вероятностей должна быть равна 1. В нашем случае = 0,99, так как табличные аргументы функции Лапласа обычно позволяют учесть только два разряда после запятой. 4. С помощью формулы определим меру расхождения 5. Находим число степеней свободы распределения хи-квадрат с учетом того, что достаточное число независимых условий для нормального закона равно тем: r = k - s = 8 – 3 = 5. 6. Входим в таблицу приложения 3В и в соответствии с числами = 3,78 и r = 5 определяем значение вероятности сходимости эмпирического и теоретического законов распределения p = 0,6, экстраполируя величину = 3,78 между «соседними» значениями таблицы 3,00 и 4,35. 7. Вероятность p = 0,6 следует считать вполне достаточной для того, чтобы сделать уверенный вывод о том, что гипотеза о соответствии эмпирического закона нормальному закону распределения не противоречит полученным экспериментальным данным. Уверенности такого заключения, конечно, способствует, тот факт, что информация о наблюдаемой погрешности наведения радиотелескопа достаточно самостоятельна (репрезентативна). Так, те же числовые характеристики, полученные всего по 50 измерениям, могли случайно дать столь хорошее совпадение распределений по критерию хи-квадрат или, наоборот, могли привести к необходимости признания экспериментальных данных противоречащими гипотезе о нормальном законе распределения излучаемой величины.
Дата добавления: 2015-04-30; Просмотров: 606; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |