КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Вибір форми функціональної залежності
Для визначення форми функціональної залежності будується кореляційне поле y(хj) для кожної із змінних, що досліджуються. Для цього на осях координат у і х наносяться пари експериментальна отриманих значень yi та хi (і = ) (див. рис.2.2). На кореляційному полі знаходяться xmin та хmах - мінімальні та максимальні значення незалежної змінної х (саме це і є область, для якої визначаються параметри статистичної моделі). По характеру розподілення точок кореляційного поля обираються форми функціональної залежності. Найбільш простим і наочним являється метод інтервального усереднення. Для цього весь інтервал (від xmin до хmах) розбивається на ряд ділянок (зазвичай не більше 7—10 ділянок) в кожному з яких знаходиться середнє значення змінної у: Рис 2.3 Інтервальне усереднення даних кореляційного поля
де nj- число значень уij, що потрапили в j-й інтервал хi (j = ; n =5...10). Отриманні значення співвідносять з серединою j -го інтервалу хj (2.3) і отримані точки з'єднують ламаною чи плавною кривою. По характеру отриманої кривої і визначають форму функціональної залежності у(х). Найбільш проста і найбільш часто вживана є лінійна модель виду:
(2.5)
що є зображеною на рис.2.4 Рис.2.4 Графічне тлумачення лінійної моделі
При цьому потрібно пам'ятати, що отримані точки у, не обов'язково повинні розташовуватися на цій залежності, але їх розсіювання відносно даної прямої повинне бути мінімальним. Серед нелінійних моделей часто використовують наступні моделі: 1) Див.рис.2.4а: (2.6) Рис. 2.4а
2)Див.рис.2.4б: (2.7) Рис. 2.4б 3)Див.рис.2.4в (2.8)
Рис.2.4в
Після вибору форми функціональної залежності проводять лінеаризацію нелінійної моделі (тобто її штучне зведення до лінійної форми) Наприклад:
і т.п. Часто зручним виявляється використання вихідної таблиці 2.1 експериментальних даних, кодовану по х (за х приймається номер рівномірного інтервалу). Таблиця 2.1
Розрахуємо різниці, приведені у даній таблиці. Потім оцінимо можливість застосування різних моделей:
у = а + bx. Ця модель незадовільна, оскільки відношення = Δy не є постійним. у = аbх
Ця модель приводиться до виду:
Ця модель також незадовільна, оскільки непостійне.
Ця парабола незадовільна, оскільки непостійне.
Оскільки відношення постійне (при Δ х = 1), то цю модель можна використовувати для апроксимації експериментальних даних. Поліноміальна модель V випадку, коли вищерозглянуті моделі не дозволяють знайти задовільну апроксимацію експериментальних даних, часто використовується поліноміальна апроксимація виду:
(2.9)
В залежності від значень аi (і = ) можливо підібрати досить гарну відповідність моделі і експериментальним даним. Лінеаризацію моделі даного типу проводять шляхом вводу нових змінних: х1=х; х2=х2; х3=х3;... х k=xk. Тоді поліноміальна модель прийме вид лінійної моделі з k-змінними:
(2.10)
Такого виду лінійні моделі носять назву моделей множини лінійної регресії. Далі, при вивченні моделей множинної лінійної регресії ми розглянемо алгоритм пошуку числових значень коефіцієнтів aі (i= ) що забезпечують мінімальне розсіювання експериментальних даних yi відносно значень у отриманих за допомогою моделі множинної лінійної регресії у(хі) і = . Завертаючи розгляд вибору форми функціональної залежно-відмітимо, що в практиці велика кількість моделей зводиться або лінійної парної регресії у=а0+bх, або до множинної лінійної регресії . Тому далі ми розглянемо саме ці моделі. 2.2.3. Визначення коефіцієнтів (параметрів) моделі Після вибору форми функціональної залежності рівняння регресії переходять до визначення коефіцієнтів (параметрів) моделі. Для визначення найбільше застосування знайшов метод найменших квадра (МНК). Тому розглянемо цей метод докладніше. 2.2.3.1 Метод найменших квадратів (МНК) Сутність методу полягає у виборі таких значень параметрів моделі коефіцієнтів), при яких сума квадратів відхилення експериментальних значень залежної змінної уі(хji) від відповідних розрахункових значень , де m - число незалежних факторів, що включені в модель (хj); N - число експериментальних значень кожного з цих фактор що беруть участь у побудові регресійної моделі. Іншими словами, метод найменших квадратів забезпечує вибір так параметрів моделі, у(хj); (j = ;), при яких забезпечується мінімум наступного функціоналу:
(2.11)
В цьому випадку дисперсія похибки моделі визначається величиною:
(2.12)
і служить статистичною оцінкою точності отриманої моделі. Особливістю регресійних моделей є те, що дослідник включає до розгляду лише найбільш значущі фактори. Фактори, що мають незначний вплив на величину функції відгуку (у) взагалі не розглядаються (тобто їхнім впливом зневажають). Тому загальну дисперсію коливань відгуку у відносно його середнього значення
(2.13)
розглядають як суму двох дисперсій: - факторної дисперсії D , що викликана впливом факторів, включених до моделі. Ця дисперсія зазвичай визначається за допомогою формули:
(2.14)
що оцінює розсіювання розрахункових значень відносно ; - залишкової дисперсії Dε, що оцінює розсіювання експериментальних даних відносно розрахункових даних моделі , яка характеризує, по суті, статистичну похибку моделі
(2.15) З у рахуванням сказаного можна записати:
(2.16) Відношення (2.17)
що характеризує долю дисперсії у, обумовлену впливом лише врахованих факторів, у загальній дисперсії , називається коефіцієнтом детермінації (для нелінійних моделей - індексом детермінації). Поділивши (2.16) на отримаємо вираз для KD у вигляді:
(2.18) Величина (2.19)
носить назву коефіцієнта кореляції (для нелінійних моделей – індекса кореляції). Ця величина характеризує щільність зв'язку між відгуком у і незалежними факторами, що включені до моделі. Практично приймається, що якщо R≥0,7, то така модель достатньо повно відображає вплив цих факторів (оскільки kd = R2≥0,49, що свідчить про те, що більше 49%змінності у обумовлено саме включеними у модель змінними xj. При R<0,7 можна стверджувати, що модель є неповною недостатньо характеризує вплив збурень хj (j=1..к), що мають місце, на відгук у. Це означає, що деякі важливі і значущі фактори не включені до моделі). Визначення тісноти зв'язку в регресійному аналізі можливо також із застосуванням так званого критерію Фішера, який визначається за допомогою формули [16]:
(2.20)
де n - кількість даних, що використовується при одержанні рівняння регресії; m - кількість статистичних характеристик даних експерименту, що застосовуються при визначенні рівняння регресії; а - характеристик рівня неістотності кореляційного зв'язку (зазвичай приймають а =0,05). Після розрахунку Fевоно порівнюється з критичним значенням наводиться в таблицях значень F-критерію в будь-якій літературі по статистиці (наприклад в [16]). Якщо , то вважається, що кореляційний зв'язок між змінними в рівнянні регресії є істотним.
Дата добавления: 2014-12-29; Просмотров: 659; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |