КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Регрессионный анализ и примеры его применения при управлении качеством
Пример Оценить влияние технологии чистовой обработки (три вида технологий) на точность изготовления детали. При каждом виде технологии проводится по четыре замера отклонения размера детали от номинала в мкм (см. табл. 2).
Таблица 2 Имеем n = 4, k = 3. Групповые средние общая средняя общая сумма квадратов факторная сумма квадратов остаточная сумма квадратов Результаты расчета сводим в табл. 3.
Таблица 3
Из статистической таблицы находим квантиль распределения Фишера
Так как выборочное значение статистики оказалось меньше критического (рис. 4), нулевая гипотеза принимается: в данном случае влияние технологии изготовления на точность детали несущественно. Рис. 4. Положение критической области при проведении дисперсионного анализа
Подобным образом в двухфакторном дисперсионном анализе оценивается влияние двух факторов А и В, а также их взаимодействия АВ на результативный признак X: проверяются три соответствующие нулевые гипотезы. В трехфакторном анализе по аналогии исследуется влияние на признак X трех факторов А, В и С, их парных взаимодействий АВ, ВС и AC, a также общего взаимодействия ABC.
В регрессионном анализе изучается связь между зависимой переменной Y и одной или несколькими независимыми переменными xj. Рассмотрим парную регрессию, когда независимая переменная одна. Предположим, что переменная х (как правило, неслучайная величина) принимает некоторые фиксированные значения х1, х2,..., хn. Соответствующие значения зависимой переменной Y имеют разброс вследствие погрешности измерений и различных неучтенных факторов: у1, у2,..., уn. Предположим, что связь между переменными линейная (рис. 5), тогда соответствующая регрессионная модель имеет вид:
Y=β0+β1x+ε где β0 и β1 — параметры линейной регрессии; ε — случайная ошибка наблюдений. Рис. 5. Парная линейная регрессия
Предполагается, что ее математическое ожидание равно нулю, а дисперсия постоянна: М[ε] = 0, D[ε] =σ2. Задача регрессионного анализа сводится к оценке параметров регрессии β0 и β1, проверке гипотезы о значимости модели и оценке ее адекватности: достаточно ли хорошо согласуется модель с результатами наблюдений? Для оценки параметров регрессии используется метод наименьших квадратов: в качестве оценок принимаются такие значения и , которые минимизируют сумму квадратов отклонений εi наблюдаемых значений yi от расчетных: Приравнивая нулю производные по β0 и β1, получим зависимости для оценивания параметров модели: где
Прогнозируемое по модели значение зависимой переменной
Разности между наблюдаемыми и прогнозируемыми значениями называются остатками, а соответствующая сумма квадратов — остаточной суммой квадратов: Пусть — общая сумма квадратов; сумма квадратов, обусловленная регрессией
Тогда остаточную сумму квадратов можно вычислить, используя основное тождество дисперсионного анализа Парная линейная регрессионная модель называется незначимой, если параметр β1=0. Для проверки нулевой гипотезы H0: β1=0 используется статистика которая при заданном уровне значимости α сравнивается с квантилью распределения Фишера F1-α (1, n-2) с числами степеней свободы 1 и (n-2). Если оказывается F> F1-α (1, n-2), то нулевая гипотеза отклоняется: регрессионная модель статистически значима. Кроме значимости, проверяется и адекватность модели. Приближенно адекватность можно проверить по диаграмме рассеяния с нанесенной на нее расчетной прямой (рис. 6).
Рис. 6. Значимость и адекватность парной линейной регрессии: а - модель незначима; б - модель значима и адекватна; в - модель значима, но неадекватна
Дата добавления: 2015-04-24; Просмотров: 2160; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |