Определенная здесь функция представляет собой полином (параболу) степени и называется кривой параболической регрессии.
Приведем типичную ситуацию, когда имеет место схема параболической регрессии. Предположим, что имеется теоретическая зависимость вида между переменными и , причем значения и получают из наблюдений. Задача состоит в определении по экспериментальным данным неизвестных параметров входящих в это уравнение. Каждое измерение при заданном дает уравнение, связывающее неизвестные параметры, и если бы измерения величины производились без погрешностей, то для определения параметров было бы достаточно измерений. Однако точные измерения на практике чаще всего невозможны, поэтому для заданных значений соответствующие значения известны с какими-то погрешностями, т. е. реально вместо точного значения имеем случайный результат , где — ошибка измерения. Если условия эксперимента обеспечивают отсутствие систематической ошибки (), равноточность () и некоррелированность () результатов измерений, то приходим к схеме регрессии вида (5.29).
Чтобы исключить влияние погрешностей измерений, нужна дополнительная информация. Для этого производят большое число измерений . Полученные экспериментальные данные обрабатывают по методу наименьших квадратов. В результате
находят не точные значения коэффициент , а определяют их о. п. к. . В данном случае этому метод можно дать следующую наглядную геометрическую интерпретацию (рис. 5.1).
Нанесем на плоскости наблюдавшиеся точки , . Тогда значения неизвестных коэффициентов подбирают так, чтобы соответствующий эмпирический график наилучшим образом проходил около наблюдавшихся точек. Если в качестве критерия оптимальности взять величину , то приходим к методу наименьших квадратов с решением .
Формально такой же вид имеет и классическая задача математического анализа приближения функций многочленами. В этом случае данные , , интерпретируют как пары соответствующих абсцисс и ординат графика изучаемой функции и задача состоит в подборе и нтерполяционного многочлена вида , который давал бы наилучшее приближение в среднем, т.е. минимизировал бы величину .
7. Ортогональные многочлены Чебышева. В описанной в примере 5.2 схеме предполагалось, что многочлены известны. В частном случае ; тогда , т. е. с коэффициенты многочлена (это имеет место в примере 5.1). В других случаях (что особенно характерно для задач интерполяции) многочлены можно выбрать достаточно произвольно; их следует взять такими, чтобы можно было упростить дальнейшие вычисления. Наиболее просто решается задача вычисления о. п. к. при диагональной матрице . В этом случае [см. (5.25)]
. (5.30)
Условием диагональности матрицы является ортогональность векторов :
(5.31)
Многочлены, удовлетворяющие условиям (5.31), называют ортогональными многочленами Чебышева.
Покажем, что при заданных , такие многочлены всегда можно построить. Без потери общности будем предполагать старший коэффициент равным единице, т.е. , … Из условия (5.31) при имеем
, т.е. . Таким образом, .
Выведем рекуррентную формулу, позволяющую вычислять следующий многочлен по двум предыдущим — этим и доказывается существование всех многочленов . Предположим, что для некоторого многочлены уже построены. Рассмотрим произвольный многочлен степени . Его можно однозначно выразить в виде линейной комбинации многочленов : . Действительно, из условия ортого- нальности (5.31) при имеем
,
т. е. эти равенства однозначно определяют коэффициенты . Отсюда, в частности, следует, что если — многочлен степени , то
. (5.32)
Рассмотрим теперь многочлен степени следующего вида:
(5.33)
(старший коэффициент здесь равен 1). Если . то в силу (5.32)
(так как степень многочлена равна ), т.е. при любых постоянных и многочлен (5.33) ортогонален всем многочленам . Выберем эти постоянные так, чтобы многочлен (5.33) был ортогонален также и . Для этого должны выполняться следующие условия:
Отсюда
(5.34)
При таком выборе постоянных и многочлен (5.33) ортогонален всем многочленам и, следовательно, является следующим многочленом системы Чебышева. Таким образом, приведен алгоритм построения системы ортогональных многочленов Чебышева. Первых два многочлена этой системы указаны выше; в частности, из (5.33) и (5.34) имеем общий третьего многочлена
, (5.35)
где .
Итак, если в схеме параболической регрессии (5.29) многочлены являются ортогональными многочленами Чебышева, то о. н. к. вычисляют по формулам (5.30), а соответствующее значение таково:
(5.36)
где .
Отметим следующее важное обстоятельство. Как видно из формулы (5.30), о. н. к. определяется только многочленом и не зависит от параметра схемы (5.29). Это позволяет упростить задачу построения интерполяционного многочлена более высокой степени, если требуется повысить точность интерполяции. Так, предположим, что для заданного построен интерполяционный многочлен , однако значение [см. соотношение (5.36)] еще велико, что означает недостаточную точность приближения исследуемой функции многочленом степени . Точность интерполяции можно повысить, приближая функцию многочленом степени вида
т.е. добавляя следующий, -й многочлен системы Чебышева. При нахождении такого оптимального многочлена оценки коэффициентов остаются теми же , необходимо вычислить только по формуле (5.30). Далее имеем
, (5.37)
и если точность приближения, достигнутая с помощью многочлена -й степени, недостаточна, то можно подбирать далее многочлен -й степени и т. д.
Пример 5.3. В «Основах химии» Д. И. Менделеев приводит следующие данные о количестве азотно-натриевой соли NaNOз, которое можно растворить в 100 г воды в зависимости температуры ;
66,7
71,0
76,3
80,6
85,7
92,9
99,4
113,6
125,1
Построим по этим данным приближенную эмпирическую формулу вида , описывающую зависимость между рассматриваемыми величинами. Здесь имеет место линейная зависимость, поэтому это схема простой регрессии, рассмотренная в примере 5.1. Используя формулы (5.27), получаем: , . Таким образом, искомая приближенная формула имеет вид
.
При этом сумма квадратов отклонений, вычисленная по формуле (5.28), равна 11,1.
Установим, как повышается точность приближения, если в качестве интерполяционного многочлена использовать квадратичную параболу. Запишем искомый многочлен в виде
,
где — многочлен Чебышева [здесь , , многочлен определен в (5.35)]. Результат (5.38) можно записать в виде , следовательно, , . Таким образом, достаточно вычислить по формуле (5.30) . В данном случае , поэтому значения в точках - таковы: 588,9; 340,9; 28,9; -176,1: -356,1; -484,1; -491,1; -176,1; 724,9. Отсюда , и по формуле (5.30) ; поправка в (5.37) .
Таким образом, учитывая многочлен второй степени, мы незначительно увеличиваем точность аппроксимации данных; в качестве удовлетворительной эмпирической зависимости можно принять формулу (5.38).
В заключение сделаем следующее общее замечание. В основе изложенного в этом параграфе классического метода наименьших квадратов лежит минимизация (по ) выражения . Альтернативным к этому методу оценивания параметров регрессии является метод, основанный на минимизации выражения , т.е. суммы абсолютных уклонений наблюдений от их математических ожиданий. Оценки параметров , получаемые этим методом, называются оценками найменьших модулей. В последнее время повысился интерес к этому методу, так как оценки наименьших модулей, как оказалось, обладают рядом интересных (с позиций приложений) свойств; в частности, они являются более устойчивыми по отношениюи к аномальным наблюдениям (в современной терминологии — более робастными).[*]
Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет
studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав!Последнее добавление