КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Обработка результатов измерений. Характеристики - метрологические и не очень
Характеристики - метрологические и не очень
У метрологического оборудования и приборов есть общетехнические и метрологические характеристики. Общетехнические - вес, объем, надежность, потребляемая мощность, ремонтопригодность, патентная чистота, приятность для взора, стоимость и другие. Все то, что можно сказать о любом техническом объекте или о большинстве из них.
Метрологические характеристики: какая величина измеряется; диапазон (или диапазоны) измерений; цена деления; все и всяческие погрешности - систематическая, аддитивная, мультипликативная, случайная; условия измерения и чувствительность к влияниям; динамические характеристики - время установления показаний, "мертвое время", частота замеров, гистерезис; для преобразователей - функция преобразования и ее стабильность; для цифровой техники - характеристики входного и выходного кода (число разрядов, цена единицы).
Нет данных без обработки и нет обработки без предварительной информации. Когда мы измеряем тестером напряжение в сети, мы немедленно делаем свой вывод - "нормально" или "низковато для этого времени суток" или "почему так много, тестер барахлит, что ли". Обработка очевидна, причем довольно сложная. За счет чего она производится? За счет предварительной информации, что тоже очевидно.
Ситуации с многократными измерениями можно разделить на две группы. Первая - это когда мы многократно измеряем реально одну и ту же величину, например, вес одной и той же монетки. Полученный в этом случае разброс является свойством именно прибора. Вторая ситуация - когда мы изучаем разные "предъявления" одной и той же величины, но реально она может при разных предъявлениях оказаться и разной. Например, мы должны навести телескоп на звезду и проверяем, с какой ошибкой он наводится. В этом случае разброс результатов измерения складывается из разброса наведения ("предъявления") и разброса прибора. Можно, впрочем, с некоторой натяжкой считать, что за весами разных реальных монеток стоит одна (идеальная) величина - номинальный вес. Особенность этой второй ситуации в том, что идеальная величина (номинальный вес или координаты звезды) нам известны, и мы изучаем "погрешности предъявления". При этом погрешности прибора должны быть существенно меньше, а вопрос об уменьшении погрешности "предъявления" стоит - но не перед нами. А перед разработчиками телескопа или штампа для монеток и монетного сплава. В первом случае можно задать вопрос о возможности уменьшения погрешности измерения одним и тем же прибором, и ниже мы к этому вопросу вернемся.
Итак, важный вопрос практической метрологии - сколько измерений делать. Обычно в книгах по метрологии пишут, что измерения должны проводиться многократно и долго обсуждают, достаточно ли двадцати, или лучше тридцать, а когда нужно три сотни. Хотел бы я посмотреть... то есть совсем наоборот! - не хотел бы увидеть, как мои коллеги звонят в скорую психиатрическую помощь, ибо я на их глазах начал мерить напряжение в сети или ток анода больше двух раз. Да и два-то зачем? На практике количество измерений зависит от априорной информации, например в производстве при контроле процесса или партии изделий обычно делают одно измерение. Для совершенно нового объекта и если мы хотим детально изучить функцию распределения, количество измерений может доходить до тысячи, особенно если мы хотим отловить отступления функции распределения от нормальной и использовать эту информацию для улучшения измерений. Обычная метрологическая рекомендация - делать измерения около тридцати раз, при этом статистические оценки обретают устойчивость. Хотя сама "устойчивость" понимается полу-интуитивно.
Я видел только одну книгу по метрологии (и то это была не книга, а пособие по лабораторным работам), где была ясно сказана известная каждому практически работающему инженеру и физику вещь - большинство измерений делается один раз. Это легко понять, даже если вы в жизни не держали в руках тестера: подавляющее большинство измерений в современной технике - это автоматический контроль процессов, измерения онлайн. А они все однократны.
При наличии серии измерений (одной и той же величины - мы почему-то считаем, что она не изменяется) можно произвести обработку полученных данных и получить оценку параметров реального распределения, в частности, истинного (действительного) значения измеряемой величины. Выражаясь метрологично, желательно, чтобы оценка (то есть от способ ее получения) была "состоятельна", "несмещенна" и "эффективна".
Состоятельность оценки означает, что при увеличении числа опытов она приближается к истинному значению. Например, если распределение результатов измерений нормально и максимум совпадает с истинным значением, то среднее значение неограниченно приближается к истинному по мере увеличения количества измерений. Оценка не будет состоятельна, если распределение несимметрично, например близко к нормальному, но с ограничением с одной стороны (например, нулем - недвижимости по ценам). Впрочем, это распределение не только не нормально, но и даже ненормально.
В принципе возможно симметричное распределение, при котором средняя величина не приближается к истинному значению, хотя такое распределение не имеет ничего общего с нормальным и вряд-ли может встретиться на практике. Заметим, что при симметричном бимодальном распределении оценка средним состоятельна. При нормальном распределении состоятельна также и оценка дисперсии.
Несмещенность означает отсутствие систематических отклонений оценки от параметра при любом конечном, в том числе и малом, объеме выборки. Использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим ошибкам, поскольку реальная выборка всегда конечна. При нормальном распределении оценка истинного значения средним является несмещенным, а оценка дисперсии по обычной формуле (сумма квадратов отклонений от среднего, деленная на число измерений) нет: при одном измерении она дает очевидную глупость - ноль. Поэтому формула корректируется, деление на число измерений заменяется на деление на число измерений минус один.
Эффективность оценки означает, что если извлекать из генеральной совокупности разные серии наблюдений, то полученные из них оценки какого-то параметра будут иметь минимальную дисперсию по сравнению с другими методами оценки.
В обычной ситуации часто имеет место распределение, близкое к нормальному. Иногда рассматривают другие распределения - равномерное, арксинусное, треугольное и другие, которые разумно сочетают соответствие реальности и удобство вычислений. Отклонения от нормального распределения, хоть большие, хоть вовсе неунимодальность, воспринимаются физиком как "Пионерская зорька" - то есть как указание на действие какого-то механизма, который можно попытаться определить. В частности неунимодальность может быть следствием неустойчивости, а может быть результатом смешения двух распределений.
Функция распределения определяется тем точнее, чем большим количеством измерений мы располагаем. Но чем больше измерений - тем дороже процедура и вообще, длительные измерения это не очень хорошо - сам объект может измениться (хотя растет шанс это заметить!), да и потребность в результате обычно связана с временем получения оного. Поэтому "все прогрессивное человечество" день и ночь размышляет, как по небольшому количеству измерений определить функцию распределения. Существует несколько способов оценить, удовлетворяет ли полученный набор данных той или иной функции распределения, есть несколько так называемых "критериев согласия": хи-квадрат (Пирсона), Колмогорова, моментов. Само наличие нескольких критериев согласия говорит о гуманитарности всех таких оценок. Практическое же применение в значительной степени опирается на опыт, практику в конкретной области, "чутье".
Любой прибор имеет диапазон измерений, и на практику случаются (чаще в социологии) ситуации, когда диапазон охватывает только основную область измерений. В социологии крайние выборы на шкале бывают сформулированы не в виде диапазона, а в виде одностороннего ограничения. Например, "ваш доход за прошлый месяц - до 100, 101-300, 301-1000, 1001-3000, более 3001". В этом-то случае количества выбравших тот или иной ответ - это просто интегралы по соответствующим диапазонам, но вот более сложный случай. Пусть мы проводим экзамен и вот количества решивших то или иное количество задач: 0 задач - 10, 1, 2, 6 и 7 задачи - по 1, 3 и 5 задач - по 3, 4 задачи - 10, 8 задач - 0. Означает ли это, что у нас бимодальное распределение с медианами 0 и 5? Нет, это означает, что трудности задач были таковы, что именно эти количества респондентов рашали именно эти количества задач. Определение набора оптимальных по трудности задач, исходя из априорной (скорее всего - нормальной) функции распределения и конкретных требованиях по отбору (обычно - разбиение на группы, часто на две) - нерешенная задача. Скорее всего, решить ее в такой постановке и невозможно, ибо понятие трудности задачи не универсально: задача описывается не одним параметром.
В реальной ситуации могут встретиться и неунимодальное распределение, поскольку как в медицине, так и в технике случаются фиксированные "поломки", формирующие свою функцию распределения, скорее всего - нормальную, но с другим средним значением.
При проведении измерений иногда случаются грубые ошибки, вызванные неправильными действиями оператора, так называемые "промахи". Например, отсчет азимута с ошибкой 180о при топографической съемке в спелеологии, отсчет с "не той" шкалы в многопредельных приборах. При проведении практических измерений такие ошибки обычно замечаются сразу - на основе предшествующих измерений или исходной информации - и сразу же и отбрасываются. Цивилизованная же процедура исключения промахов такова: сначала вычисляется среднеквадратичное отклонение ц (в предположении, что распределение нормальное!), а потом отбрасываются все измерения, отклоняющиеся от среднего больше, чем на 3ц. Оснований для таких действий два: "промахи" относительно слабо влияют на среднее и дисперсию и, скажем при 20-и измерениях для нормального распределения выход результата за указанные границы происходит с вероятностью 0,01.
Когда после обработки результатов измерений мы указываем для искомой величины одно значение, это называется "точечная оценка". Часто этим нельзя ограничиться, а нужно еще указать и вероятность, с которой искомая величина находися в тех или иных пределах, так называемые "доверительную вероятность" и "доверительный интервал". Если наше распределение нормально, то при доверительной вероятности 0,8-0,9-0,95-0,99-0,999 доверительный интервал составляет 1,3-1,6-2,0-2,6-3,3 ц.
На практике часто искомая величина вычисляется по результатам измерения нескольких величин, то есть осуществляются косвенные измерения. В этом случае, согласно школьному курсу физики, если величины складываются или вычитаются, то абсолютные погрешности складываются, а если перемножаются или делятся, то складываются относительные погрешности. Если же производятся прямые многократные измерения одной и той же величины, то появляется возможность уменьшения относительной погрешности. А именно, относительная погрешность убывает пропорционально корню из количества измерений, то есть усреднение скажем 10 измерений уменьшает случайную погрешность в 3 раза. При наличии серий измерений, имеющих разную точность, измерения, имеющие меньшую дисперсию, следует учитывать с большими весами. Хотя на практике скорее попытаются увеличить количество измерений, выполненных с меньшей дисперсией.
Существенная часть измерений выполняет в цивилизации функцию контроля. Это означает, что результат обработки данных такого измерения должен быть бинарен: годен - или нет, свой - или чужой, любит - или не любит. В этом случае полная схема возможных ситуаций это четыре варианта: принятие годного, отклонение негодного, пропуск негодного - "пропуск атаки" и отклонение годного - "ложная тревога". Обычно в системе есть управляемый параметр, чувствительность, от которого и зависит ее поведение. При малой чувствительности нет ложных тревог, но есть пропуски атаки. При высокой чувствительности все наоборот, и пьяная ворона легко канает за МБР, а стая - даже за разделяющиеся головные части. Оптимальная чувствительность зависит от цены той и другой ошибки, реальной ситуации - частоты ложных тревог и от нашей гипотезы относительно частоты атак. Как мы видим, и здесь играет роль исходная гипотеза.
Дата добавления: 2015-04-30; Просмотров: 956; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |