КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Эффективность. Оценка * (x1 xn) – несмещенная, если при любом объеме выборке n результат ее осреднения по всем возможны выборкам данного объема
Несмещенность Оценка * (x1…xn) – несмещенная, если при любом объеме выборке n результат ее осреднения по всем возможны выборкам данного объема, приводит к истинному значению оцениваемого параметра. M[ *] = Характеризует оценку до асимптотического св-ва, т.е. хорошие или плохие св-ва при конечном объеме выборки. Стат оценка * (x1…xn) – несмещенная, если ее мат ожидание = оцениваемому параметру при любом объеме выборки, т.е. M[ *] = Стат оценка * (x1…xn) –- эффективная, если при заданном объеме выборки оценка имеет min D (дисперсия – разброс вокруг среднего значения). D(Х)=М[Х-М(Х)]2 - мат ожидание кВ отклонения С.В. от ее мат ожидания. 3. Состоятельность (при большом n) Стат оценка * (x1…xn) – состоятельная, если при nà ∞, оценка à по вероятности к истинному знач .
* (x1…xn) --------à 3. Генеральная и выборочная средние. Оценка генеральной средней по выборочной. Генеральная средняя хг= Если хi – знач признака различны хг= Если знач признака х имеют соотв частоты Ni Р-м величину признака Х, как СВ, возможные знач х1….хn и вероятность р=1/N => M(X)= => M(X)=Xг
Выборочная средняя хв= хв= выборочная средняя – среднее взвешенное знач признака с весами = соотв частотам.\
Оценка генеральной средней хг по выборочной средней хв Из генеральной совокупности извлечена повторная выборка объема n: х1…xn – знач признака - различны. хг – неизв. Требуется оценить ее по данным выборки. В качестве оценки хг принимается хв =
1) убедимся, что хв – несмещенная оценка, те есть M[хв] = хг Хв – СВ; х1…xn – независ слу распределения СВ Х1….Хn, т.к. эти величины одинаково распределены à у них одинаковое мат ожидание, например М(Х)=α М(Хв)=М() = α Величины х1…хn имеют то же распределение, что и генеральная совокупность => у них одинаковые мат ожидания. М(Х)= Хг = α => М(Хв)= Хг => Хв – несмещенная оценка Хг (Чтд)
2) Хв- состоятельная оценка Хг Т.к. СВ х1….хn имеют огранич дисперсии, то по теореме Чебышева (при ↑n => среднее арифметическое р-мых величин (то есть Хв) стремится по вероятности в мат ожиданию (=α) каждой из величин (или к Хг, т.к. Хг=α)). => при ↑n Хв àстремиться по вероятностиà Хг
3) если СВ Х подчиняется НЗР, то => эффективная оценка
4. Генеральная и выборочные дисперсии. Оценка генеральной дисперсии по выборочной. Генеральная дисперсия – среднее арифметическое кв-тов отклонений знач признака генеральн совокупности от их среднего знач Хг. Если х1…..хн - знач признака различны, Dг = Если х1…хн имеют соотв частоты N1….Nk, Dг = Т.е. Генеральная дисперсия – среднее взвешенное квадратов отклонений с весами = соотв частотам.
Выборочная дисперсия – среднее арифметическое кв-тов отклонений знач признака генеральн совокупности от их среднего знач Хв. Если х1…..хn - знач признака различны, Dв = Если х1…хn имеют соотв частоты n1….nk, Dв = Т.е. Выборочная дисперсия – среднее взвешенное квадратов отклонений с весами = соотв частотам.
Оценка Dг по Dв Смещенной оценкой Dг служит Dв Dв = - это оценка смещенная, т.к. М(Dв)≠Dг. М(Dв) = Dг * (н-1)/н Несмещенная оценка Dг служит S2 (исправленная выборочная дисперсия). S2 = (n-1)/n * Dв =
S2 используется при n<30 Она несмещенная т.к. М(S2) = Dг 5. Метод макс правдоподобия. Опр неизвестных параметров нормального закона распределения. Для точечной оценки неизв параметров распредел. А. Непрерывные СВ Х – непрерывная СВ; н-число испытаний; х1….хн – знач Х в рез-те испытаний; f(х) – вид плотности распределения; - параметр, определяющий f(х) – неизвестен. Ф-ция правдоподобия Х – ф-ция аргумента : L(х1,х2,….,хн; )=f(x1; )…..f(xn; ), где х1…хн – фиксированные числа. В качестве точечной оценки параметра принимается такое его значение * = *(х1…хн), при котором ф-уия правдоподобия L достигнет max. Оценка * - оценка наибольшего правдоподобия. Метод поиска точки ф-ции ln L аргумента : 1) найти 1ую производную d ln L / d 2) приравнять производную к 0, найти критические точки (корень полученного уравнения) 3) найти 2ую производную d2 ln L / d 2 Если 2ая производная при = * отрицательна, то => * - т.max и => * - оценка наоб правдоподобия параметра Определение неизв параметров НЗР В рез-те испытаний Х принимает знач х1…хн. Определить Мх -? и σх -?
Решение. 1=Mx 2 = σx 1) L= => L = 2) ln L = -n*ln σx +ln 1/ ()n – 3) dln L / d Mx = ∑(x-n*Mx) / σx2 =0 из этого выражаем Mx Mx= ∑x/n = Хв ( ∑(x-n*Mx)= ∑x–n*Mx=0) dln L / d σx = -n/ σx + ∑(x-Mx)2/ σx3 = 0 из этого σx2 = 1/n *∑(x-Mx)2 = Dв 4) d2lnL / dMx2 = -n/ σx2 <0 => Mx – t. max => Мх* = Хв - несмещенная оценка σх* = Dв – смещенная оценка
6. Метод макс правдоподобия. Определение неизвестных параметров нормального закона Пуассона. Для точечной оценки неизв параметров распредел. В. Дискретные СВ Х – дискретная СВ; х1…хн – знач, которые принимает Х в рез-те н опытов; н – кол-во опытов; - неизв параметр опр з-н (вид з-на задан); р(хi; ) – вероятность того, что в рез-те испытаний величина Х примет знач хi (i=1,2,…н) L(х1,х2,….,хн; )=р(x1; )…..р(xn; ), где х1…хн – фиксированные числа. * - точечная оценка параметра . *= * (х1…хн) при знач которого L достигает max
Метод нахождения * 1) найти 1ую производную d ln L / d 2) приравнять производную к 0, найти критические точки (корень полученного уравнения) 3) найти 2ую производную d2 ln L / d 2 Если 2ая производная при = * отрицательна, то => * - т.max и => * - оценка наоб правдоподобия параметра Определение неизвестных параметров норм з-на Пуассона Pm(Х=хi)= , где м- число сделанных испытаний, х – число появления события в i-ом опыте (i=1,2…н); (1 опыт состоит из м испытаний). Требуется определить λ-?
Решение. 1=λ 1) L(х1,х2,….,хн; )= L(х1,х2,….,хн; λ)= р(x1; )…..р(xn; ) = => L = 2) ln L = (∑x)*ln L – n*λ – ln(x1!x2!...xn!) 3) dln L / d λ = ∑x / λ – n = 0 из этого выражаем λ λ= ∑x/n = Хв 4) d2lnL / dλ2 = -∑x / λ2 (при λ=Хв) <0 => λ=Хв – t. max => λ*=Хв –оценка параметра λ з-на Пуассона. 7. Метод моментов. Примеры оценки по методу моментов. Для точечной оценки параметров распределения. Суть: приравнивание опр кол-ва выборочных моментов р-мого распределения к соотв кол-ву теоритических моментов того же порядка. В качестве моментов р-мся нач и центральные моменты. Начальные моменты Теоретические Эмпирические Центральные моменты Теоретические Эмпирические
f(x;θ) – вид плотности распределения – задан. θ – неизвестный параметр, определяющий f(x;θ) нужно найти точечную оценку θ θ*=ψ(х1…хн) Приравниваем: υ1=М1 } (нач моменты) υ1=М(Х) } => М(Х) = Хв => М(Х) l = ∫ х l * f(x;θ) dx = φ (θ) = 1/n * ∑x l,где l =1,2…. – номер момента.
Примеры оценки по методу моментов Пр1. Показательный з-н распредел. По выборке х1…хн требуется найти оценку параметра λ-? Показательный з-н: f(x;λ)=λ*e-λ*x x>=0 Т.к. неизвестен всего лишь 1 параметр = > для его определения необходимо 1 ур-ие, т.е. l =1 x>=0 => ∫0∞ xλe-λ*x dx = 1/λ; 1/λ = 1/n * ∑x = Хв => λ = 1/Хв; λ* = 1/Хв = n/ ∑x Пр2. Норм з-н распределения. Найти по выборкуе х1…хн неизв параметры Mx-? σ-? По опр Мх – момент 1го порядка Мх = По опр Dх – момент второго порядка Dх = Мх* = Хв σх* = √Dв
8. Интервальное оценивание. Доверительные интервал и вероятность. Распределение Стъюдента. Интегральная оценка – оценка, определяется 2мя числами - концами интервала. Позволяет установить точность и надежность оценки. Точность оценки ∆: |θ* - θ| < ∆, ∆>0. Чем ↓∆, тем точнее оценка. Надежность оценка γ - вероятность, с которой осуществляется |θ* - θ| < ∆. Обычно надежность задается наперед (например: γ = 0,95; γ =0,99). γ = Р [θ* - ∆< θ < θ* + ∆] вероятность того, что интервал (θ*-∆; θ*+∆) заключает в себе (покрывает) неищв параметр θ равно γ. Доверительный интервал Iβ - интервал (θ*-∆; θ*+∆), покрывающий неизв параметр θ с заданной надежностью γ. Доверительный интервал это СВ, т.к. она опр по выборке х1…зн Доверительная надежность β – вероятность, с которой интервал накрывает θ. (надежность). Β = Р (|θ* - θ| < ∆) β=∫ f(θ*) dθ* Ширина β зависит от n (объема выборки) ∆à 0 при nà ∞; βà 1 при ∆ à ∞. интервальное оценивание используется при небольших n.
Распределение Стъюдента. СВ - Х распределена по НЗР, выборка х1…хн – СВ => их линейная комбинация тоже СВ Хв=1/n * ∑х М(Хв) = 1/n * ∑М(Х) = Мх D(Хв) = 1/n 2 D [∑M(X)] = 1/n2 * n * Dx = Dx/n
Сформулируем величину Если σ известно, то
9. Понятие о распределении Пирсона. (хи2) Р-м Хi = Х1….Хн - нормальные независимые СВ М(Хi) = 0 M(Х1)=М(Х2)= …. = М(Хн) = 0 D(Хi) =1 D(X1)=D(X2)= …. = D (X2) =1 Тогда хи2 = ∑Хi2 хи2 = Х12 +…+Хн2 с к=н степенями свободы. (есди ∑х =nX то к=n-1)
Распределение Пирсона – это плотность распределения СВ хи2 Зависит только от объема выборки n. n à ∞ тогода хи2 à к НЗР М(хи2)=n D(хи2)=2n S2 = n/(n-1) * ∑[(Хв-Xi)2/n] M[Хв-Xi] = Мх-Мх = 0 Хи2 = S2 (n-1) / σx2
10. Доверительный интервал для мат ожидания и дисперсии. Схема их определения. Приближенное построение доверительных интервалов. Х1…хн – выборка. Мх-? σ-? Неизвесты.
Средневыборочные значения: М* = Хв = ∑х/n; S2 = 1/(n-1) * ∑(х-Хв)2 постоить доверительный интервал для этих оценок. , т.е. необходимо найти такое ∆-?, чтобы Р(|Хв-m| < ∆) = β | Хв-m| < ∆ (жомножим это на √(n/S2)) получаем t= (√(n) / S) * | Хв-m|; |t| = ∆ * √(n/S2) =tβ тогда Р((|Хв-m| < ∆) = β => Р(|t| < tβ) = β; t – по з-ну Стъюдента, f(t) –известно.
Доверительный интервал для Dх. Схема определения.
Приближенное построение доверительного интервала. В основе лежит возможность применения предельных теорем теории вероятности. При достоточно больших n. на практике установлено, что при n>20 з-н распределения суммы величин можно считать практически нормальным.
11. Статистическая проверка статистических гипотез. Нулевая и конкурирующая гипотезы. Виды ошибок. Общая логическая схема решения задачи. Статистическая гипотеза – предположение о виде з-на распределении СВ или величины неизв параметра известного з-на распределения. Стат проверка стат гипорез – процедура обоснованного сопоставления с помощью того или иного критерия, высказанной гипотезой H0 с экспериментальными данными. H0 – выдвинутая гипотеза H1 – конкурирующая / альтернативная Н0 зипотеза
Цель стат проверки: установить факт: не противоречит ли Н0 экспериментальным данным. При проверки можно допустить 2 ошибки: Ошибку 1 рода - непринятие верной гипотезы (непринятие истины) Ошибку 2 рода – принятие неверной гипотезы (принятие лжи) α – вероятность совершить ош 1 рода (уровень значимости) β – вероятность совершить ош 2 рода 1-α ≠ β
Общая логическая схема решения задачи. 1. сформулировать Н0 и Н1 2. формирование критерия к= fn(х1…xn) - CВ, т.к. х1…зн - СВ Обязательное условие: з-н распределения СВ к= f(к) – плотность распределения критерия – должен быть хорошо изучен и затабулирован в предположительной справедливости Н0. Принцип постоения к: величиной критерия к определяется мера расхождения имеющихся выборочных данных с высказанной Н0. 3. Задание еличины уровня значимости α Α зависит от потерь, которые получ при отвергании правильной гипотезы. Чем ↑ потери, тем ↓ α. α чаще всего = 0,1 0,05, 0,025 0,005 4. из табл, где затабулирован f(k), с опр α находим точки. Эти точки разделяют область возможных знач критерия на 2 или 3 части. Они называются критические точки. (в зависимости от Н1) Критические области, ее образуют знач к, при которых отвергается Н0 где 1 – область малых знач, 2- правдоподобных Знач. 3 – область больших значений 5. в fn(х1…xn) подставляем выборочные зная СВ а) Кнабл в 2 область – принимается Н0 б) Кнабл в 1 или 3 область – отвергается Н0
12. Критические области. Мощность критерия. Построение статистического критерия. Принцип отношения правдоподобия. Критические точки – точки, которые находятся из табл по f(k) и α, разделяющие область на 2 или 3 части в зависимости от Н1. Критические области – совокупность знач к, при которых отвергается Н0. где 1 – область малых знач, 2- правдоподобных Знач. 3 – область больших значений Мощность критерия – вероятность того, что принимается Н1, если она верна, а Н0 отвергается. Мощность критерия = 1-β, где β – вероятность совершить ош 2 рода. Чем ↑(1-β), тем ↓β
Принцип отношения правдоподобия. Требуется опр какому з-ну расредел принадлежат числа а,b,c -? Пусть з-н распредел Х(x), Y(х) – нормальный. У них отличаются ток мат ожидания. Пусть Н0: f(x)=X(x) H1: f(x) = Y(x) Из рис => Н0 не противоречит экспериментальным данным, кажется правдоподобнее, чем Y(х).
К= чем ↓к, тем ↑ правдоподобие набл х1…хн в док-ве справедливости Н0. Представление о сраведливости правдоподобностей имеющихся наблюдений х1…хн в отношении проверяемой Н0 и альтернативн Н1 гипотез дает сопоставление соотв ф-ций правдоподобия. 13. Проверка гипотезы о = центров распред 2х норм генеральных совокупностей при известном s. Пусть 2 cлуч величины X и Y подчиняются НЗ они имеют 2 независимые выборки объемом n и m 1) Выдвигаем Но и Н1 Но: М(Х)=М(У) Н1: М(Х)≠М(У) 2) Задается критерий проверки Но при этом М(Х)=М(Х) М(У)=М(У)
Если Но - справедлива, то k распределена по НЗР и M(k)=0 и σ(k)=1 Плотность распределения -
3) Задаем сл вел-ной ур-ия значимости λ λ=P(|k|>kкр) P(0<k<+бескон.)=1/2 значит ½=р(0<k<kлз)+з(kкр<k<+бескон.)
½= Ф(kкр)+λ/2 или Ф(kкр)=(1-λ)/2 Кнабл=
Если выдвигается другая H1 1) Но: М(Х)=М(У) Н1: М(Х)>М(У) 2)k=
14. Проверка гипотезы о равенстве центров распределения двух нормальных генеральных совокупностей при неизвестном s. Пусть X и Y подчиняются НЗР. Будем считать что дисперсии этих СВ- неизвестны, но одинаковы. σх=σу=σ 1) Но: М(Х)=М(У) Н1: М(Х)≠М(У) Х=∑х/n У=∑у/m S2x=1/(n-1) S2y=1/(m-1) Т.к. σ2х= σ2у= σ2, то целесообразно взять взвешенные значение: S2=(S2x(n-1)+S2y(m-1))/(n+m-2) Если Но справедлива, то сл величина (Х-У) подчинена НЗР со след параметрами М(Х-У)=0 D(X-Y)= σ2(1/n+1/m) М(Х-У)=M(Y)-M(X) D(X-Y)= D(X)+D(Y)= D(X)/n+D(Y)/m=(D(X)=D(Y)= σ2)= σ2(1/n+1/m) S2x-y =S2(1/n+1/m)
2) к=t t=(X-Y)/(S2x-y)=(X-Y)/ n+m-2 – cтепень свободы 3) α – задано, по таблице Стьюдента находим tкр.При этом значение tкр будут зависеть от выбранной Н1 * Если Н1: М(Х)≠М(У) => tкр: P(|t|>tкр)=α Вычисляем tнабл tнабл=
* Если Н1: М(Х)>М(У) => правосторонняя критическая область * Если Н1: М(Х)<М(У) => левосторонняя критическая область 16. Сравнение 2х дисперсий норм генеральных совокупностей. Понятие о распред Фишера- Снедекора. Метод применяется для тестиров нов товаров, выбора ценовой политики. Люди – респонденты.2рекламы: Пусть генеральные совокупности X и Y распред по НЗР; сделаны выборки объемом n и m; Получ S2x и S2y S2x = S2y= M (S2x)=Dx M(S2y)=Dy Тогда 1) Ho: M (S2x)= M(S2y) или Н0: Dx=Dy 2) Критерий проверки F= S2б/S2м При справедливом Но величина F подчиняется распределению Фишера-Снедекора.это распределение имеет 2 степени свободы: k1:=n1-1 (n1-Vвыборки Sб2); k2:= n2-1 (n2-Vвыборки Sн2) Распределение Ф-С зависит только от k1и k2
Распределение Фишера-Снедекора. Если U и V – 2 независимые СВ, распределены по закону хи2 со ст.свободы k1 и k2, то вел-на F= (U/k1)/(v/k2) и плотность распределения f(x)=
f(x)=
Критические области стоятся изходя из Н1 * 1) Н0: Dx=Dy H1: Dx>Dy 2) P(F>Fкр)=α если Fнабл > Fкр => Н0 – отвергается * 1) Н0: Dx=Dy H1: Dx≠Dy à двусторонняя критическая область
17. Проверка гипотез о законе распределения. Критерий Пирсона. Критерий согласия - критерий проверки гипотез о предполагаемом з-не распределения(неизвестном) Критерий Пирсона. Суть подхода состоит в том, что сравниваются эмпирические(наблюдаемые) и теоретические (вычисл в предполож НР) предположения справедливости гипотезы Но. (f=f(x1,Q1..Qs)) Критерий Пирсона отвечает на вопрос случайно ли расхождение частот но не доказывает справедливость гипотезы. устанавливает ее согласие /несогласие при α
Шаги Для применения критерия Пирсона: 1) a)разбить область изменения случайной величины Х(СВ) на l интервалов: ∆1..∆ l (l ≥8) б) подсчитать количество попаданий СВ mi, i= 1..L в каждый ∆ mi≥7÷10 при этом в) предполагается что число неизвестных параметров S<=7 (обычно3) 2) на основе выбранных значений х1...хn строятся оценки неизвестных параметров Q*1..Q*s 3) вычитаем вероятность события, что Х попадет в ∆i
4) задается уравнения значимости α и по таблицам для заданного числа степеней свободы находятся критические точки () Такие, чтобы выполнялось условие
*Если = > то нет оснований отвергать Но *Если
*H0 отвергаем при большом/ малом различии экспер. и теор. Частот 18. Однофакторный дисперсионный анализ. Используется Для сравнения нескольких средних. Идея д.а. состоит в сравнении: *факторной дисперсии*, порождаемой воздействиями фактора и *остаточной дисперсии*, обусловленной случайными причинами. F-воздействующий фактор. n-число наблюдений значений признака хij n=pq p – число уровней признака; q – всего наблюдений i=1..q j=1...p
1) общая факторная и остаточная суммы квадратных отклонений. общая средняя- общая сумма квадратов отклонений- Sобщ = Sфакт= Sост= Sост= Sобщ- Sфакт, Sост- хар-ет воздействие СВ
2) общая факторная и остаточная дисперсии S2общ = Sобщ /(pq-1) S2факт= Sфакт/(q-1) S2ост= Sост/p(q-1) Если Но о равенстве средних верна, товсе эти дисперсии являются несмещенными оценками генеральных дисперсий.
19. Корреляционный анализ. Метод наименьших квадратов. 1. Две Случ Величины могут быть связаны: - или функциональной зависимостью(крайне редко) - или статистической зависимостью - или быть просто независимыми Статистическая зависимость - при которой изменение одной СВ влечет изменение распределения другой. X M(X) Кxy = Y M(Y) Кxy /σxy= Гxy
Дата добавления: 2015-04-24; Просмотров: 846; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |