Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Эффективность. Оценка * (x1 xn) – несмещенная, если при любом объеме выборке n результат ее осреднения по всем возможны выборкам данного объема




Несмещенность

Оценка * (x1…xn) – несмещенная, если при любом объеме выборке n результат ее осреднения по всем возможны выборкам данного объема, приводит к истинному значению оцениваемого параметра. M[ *] =

Характеризует оценку до асимптотического св-ва, т.е. хорошие или плохие св-ва при конечном объеме выборки.

Стат оценка * (x1…xn) – несмещенная, если ее мат ожидание = оцениваемому параметру при любом объеме выборки, т.е. M[ *] =

Стат оценка * (x1…xn) –- эффективная, если при заданном объеме выборки оценка имеет min D (дисперсия – разброс вокруг среднего значения). D(Х)=М[Х-М(Х)]2 - мат ожидание кВ отклонения С.В. от ее мат ожидания.

3. Состоятельность (при большом n)

Стат оценка * (x1…xn) – состоятельная, если при nà ∞, оценка à по вероятности к истинному знач .

 

* (x1…xn) --------à

3. Генеральная и выборочная средние. Оценка генеральной средней по выборочной.

Генеральная средняя

хг= Если хi – знач признака различны

хг= Если знач признака х имеют соотв частоты Ni

Р-м величину признака Х, как СВ, возможные знач х1….хn и вероятность р=1/N

=> M(X)=

=> M(X)=Xг

 

Выборочная средняя

хв=

хв=

выборочная средняя – среднее взвешенное знач признака с весами = соотв частотам.\

 

Оценка генеральной средней хг по выборочной средней хв

Из генеральной совокупности извлечена повторная выборка объема n: х1…xn – знач признака - различны.

хг – неизв. Требуется оценить ее по данным выборки.

В качестве оценки хг принимается хв =

 

1) убедимся, что хвнесмещенная оценка, те есть M[хв] = хг

Хв – СВ; х1…xn – независ слу распределения СВ Х1….Хn, т.к. эти величины одинаково распределены à у них одинаковое мат ожидание, например М(Х)=α

М(Хв)=М() = α

Величины х1…хn имеют то же распределение, что и генеральная совокупность => у них одинаковые мат ожидания.

М(Х)= Хг = α => М(Хв)= Хг => Хв – несмещенная оценка Хг (Чтд)

 

2) Хв- состоятельная оценка Хг

Т.к. СВ х1….хn имеют огранич дисперсии, то по теореме Чебышева (при ↑n => среднее арифметическое р-мых величин (то есть Хв) стремится по вероятности в мат ожиданию (=α) каждой из величин (или к Хг, т.к. Хг=α)).

=> при ↑n Хв àстремиться по вероятностиà Хг

 

3) если СВ Х подчиняется НЗР, то => эффективная оценка

 

 

4. Генеральная и выборочные дисперсии. Оценка генеральной дисперсии по выборочной.

Генеральная дисперсия – среднее арифметическое кв-тов отклонений знач признака генеральн совокупности от их среднего знач Хг.

Если х1…..хн - знач признака различны, Dг =

Если х1…хн имеют соотв частоты N1….Nk, Dг =

Т.е. Генеральная дисперсия – среднее взвешенное квадратов отклонений с весами = соотв частотам.

 

Выборочная дисперсия – среднее арифметическое кв-тов отклонений знач признака генеральн совокупности от их среднего знач Хв.

Если х1…..хn - знач признака различны, Dв =

Если х1…хn имеют соотв частоты n1….nk, Dв =

Т.е. Выборочная дисперсия – среднее взвешенное квадратов отклонений с весами = соотв частотам.

 

Оценка Dг по Dв

Смещенной оценкой Dг служит Dв

Dв = - это оценка смещенная, т.к. М(Dв)≠Dг. М(Dв) = Dг * (н-1)/н

Несмещенная оценка Dг служит S2 (исправленная выборочная дисперсия).

S2 = (n-1)/n * Dв =

 

S2 используется при n<30

Она несмещенная т.к. М(S2) = Dг

5. Метод макс правдоподобия. Опр неизвестных параметров нормального закона распределения.

Для точечной оценки неизв параметров распредел.

А. Непрерывные СВ

Х – непрерывная СВ; н-число испытаний; х1….хн – знач Х в рез-те испытаний;

f(х) – вид плотности распределения; - параметр, определяющий f(х) – неизвестен.

Ф-ция правдоподобия Х – ф-ция аргумента : L(х1,х2,….,хн; )=f(x1; )…..f(xn; ),

где х1…хн – фиксированные числа.

В качестве точечной оценки параметра принимается такое его значение * = *(х1…хн), при котором ф-уия правдоподобия L достигнет max.

Оценка * - оценка наибольшего правдоподобия.

Метод поиска точки ф-ции ln L аргумента :

1) найти 1ую производную d ln L / d

2) приравнять производную к 0, найти критические точки (корень полученного уравнения)

3) найти 2ую производную d2 ln L / d 2

Если 2ая производная при = * отрицательна, то => * - т.max

и => * - оценка наоб правдоподобия параметра

Определение неизв параметров НЗР

В рез-те испытаний Х принимает знач х1…хн. Определить Мх -? и σх -?

 

Решение.

1=Mx 2 = σx

1) L=

=> L =

2) ln L = -n*ln σx +ln 1/ ()n

3) dln L / d Mx = ∑(x-n*Mx) / σx2 =0 из этого выражаем Mx Mx= ∑x/n = Хв ( ∑(x-n*Mx)= ∑x–n*Mx=0)

dln L / d σx = -n/ σx + ∑(x-Mx)2/ σx3 = 0 из этого σx2 = 1/n *∑(x-Mx)2 = Dв

4) d2lnL / dMx2 = -n/ σx2 <0 => Mx – t. max

=> Мх* = Хв - несмещенная оценка

σх* = Dв – смещенная оценка

 

 

6. Метод макс правдоподобия. Определение неизвестных параметров нормального закона Пуассона.

Для точечной оценки неизв параметров распредел.

В. Дискретные СВ

Х – дискретная СВ; х1…хн – знач, которые принимает Х в рез-те н опытов; н – кол-во опытов;

- неизв параметр опр з-н (вид з-на задан); р(хi; ) – вероятность того, что в рез-те испытаний величина Х примет знач хi (i=1,2,…н)

L(х1,х2,….,хн; )=р(x1; )…..р(xn; ), где х1…хн – фиксированные числа.

* - точечная оценка параметра . *= * (х1…хн) при знач которого L достигает max

 

Метод нахождения *

1) найти 1ую производную d ln L / d

2) приравнять производную к 0, найти критические точки (корень полученного уравнения)

3) найти 2ую производную d2 ln L / d 2

Если 2ая производная при = * отрицательна, то => * - т.max

и => * - оценка наоб правдоподобия параметра

Определение неизвестных параметров норм з-на Пуассона

Pm(Х=хi)= , где м- число сделанных испытаний, х – число появления события в i-ом опыте (i=1,2…н); (1 опыт состоит из м испытаний). Требуется определить λ-?

 

Решение.

1=λ

1) L(х1,х2,….,хн; )= L(х1,х2,….,хн; λ)= р(x1; )…..р(xn; ) =

=> L =

2) ln L = (∑x)*ln L – n*λ – ln(x1!x2!...xn!)

3) dln L / d λ = ∑x / λ – n = 0 из этого выражаем λ λ= ∑x/n = Хв

4) d2lnL / dλ2 = -∑x / λ2 (при λ=Хв) <0 => λ=Хв – t. max => λ*=Хв –оценка параметра λ з-на Пуассона.

7. Метод моментов. Примеры оценки по методу моментов.

Для точечной оценки параметров распределения.

Суть: приравнивание опр кол-ва выборочных моментов р-мого распределения к соотв кол-ву теоритических моментов того же порядка. В качестве моментов р-мся нач и центральные моменты.

Начальные моменты

Теоретические

Эмпирические

Центральные моменты

Теоретические

Эмпирические

 

f(x;θ) – вид плотности распределения – задан. θ – неизвестный параметр, определяющий f(x;θ)

нужно найти точечную оценку θ θ*=ψ(х1…хн)

Приравниваем:

υ1=М1 } (нач моменты)

υ1=М(Х) } => М(Х) = Хв

=> М(Х) l = ∫ х l * f(x;θ) dx = φ (θ) = 1/n * ∑x l,где l =1,2…. – номер момента.

 

Примеры оценки по методу моментов

Пр1.

Показательный з-н распредел. По выборке х1…хн требуется найти оценку параметра λ-?

Показательный з-н: f(x;λ)=λ*e-λ*x x>=0

Т.к. неизвестен всего лишь 1 параметр = > для его определения необходимо 1 ур-ие, т.е. l =1

x>=0 => ∫0xλe-λ*x dx = 1/λ; 1/λ = 1/n * ∑x = Хв => λ = 1/Хв;

λ* = 1/Хв = n/ ∑x

Пр2.

Норм з-н распределения. Найти по выборкуе х1…хн неизв параметры Mx-? σ-?

По опр Мх – момент 1го порядка

Мх =

По опр Dх – момент второго порядка

Dх =

Мх* = Хв

σх* = √Dв

 

 

8. Интервальное оценивание. Доверительные интервал и вероятность. Распределение Стъюдента.

Интегральная оценка – оценка, определяется 2мя числами - концами интервала. Позволяет установить точность и надежность оценки.

Точность оценки ∆: |θ* - θ| < ∆, ∆>0. Чем ↓∆, тем точнее оценка.

Надежность оценка γ - вероятность, с которой осуществляется |θ* - θ| < ∆. Обычно надежность задается наперед (например: γ = 0,95; γ =0,99). γ = Р [θ* - ∆< θ < θ* + ∆] вероятность того, что интервал (θ*-∆; θ*+∆) заключает в себе (покрывает) неищв параметр θ равно γ.

Доверительный интервал Iβ - интервал (θ*-∆; θ*+∆), покрывающий неизв параметр θ с заданной надежностью γ. Доверительный интервал это СВ, т.к. она опр по выборке х1…зн

Доверительная надежность β – вероятность, с которой интервал накрывает θ. (надежность).

Β = Р (|θ* - θ| < ∆) β=∫ f(θ*) dθ*

Ширина β зависит от n (объема выборки) ∆à 0 при nà ∞; βà 1 при ∆ à ∞. интервальное оценивание используется при небольших n.

 

Распределение Стъюдента.

СВ - Х распределена по НЗР, выборка х1…хн – СВ => их линейная комбинация тоже СВ Хв=1/n * ∑х

М(Хв) = 1/n * ∑М(Х) = Мх

D(Хв) = 1/n 2 D [∑M(X)] = 1/n2 * n * Dx = Dx/n

 

Сформулируем величину

Если σ известно, то

 

 

9. Понятие о распределении Пирсона. (хи2)

Р-м Хi = Х1….Хн - нормальные независимые СВ

М(Хi) = 0 M(Х1)=М(Х2)= …. = М(Хн) = 0

D(Хi) =1 D(X1)=D(X2)= …. = D (X2) =1

Тогда хи2 = ∑Хi2 хи2 = Х12 +…+Хн2 с к=н степенями свободы. (есди ∑х =nX то к=n-1)

 

Распределение Пирсона – это плотность распределения СВ хи2

Зависит только от объема выборки n. n à ∞ тогода хи2 à к НЗР

М(хи2)=n

D(хи2)=2n

S2 = n/(n-1) * ∑[(Хв-Xi)2/n] M[Хв-Xi] = Мх-Мх = 0

Хи2 = S2 (n-1) / σx2

 

 

10. Доверительный интервал для мат ожидания и дисперсии. Схема их определения. Приближенное построение доверительных интервалов.

Х1…хн – выборка. Мх-? σ-? Неизвесты.

 

Средневыборочные значения:

М* = Хв = ∑х/n; S2 = 1/(n-1) * ∑(х-Хв)2 постоить доверительный интервал для этих оценок.

, т.е. необходимо найти такое ∆-?, чтобы Р(|Хв-m| < ∆) = β

| Хв-m| < ∆ (жомножим это на √(n/S2)) получаем t= (√(n) / S) * | Хв-m|; |t| = ∆ * √(n/S2) =tβ

тогда Р((|Хв-m| < ∆) = β => Р(|t| < tβ) = β; t – по з-ну Стъюдента, f(t) –известно.

 

 

Доверительный интервал для Dх. Схема определения.

 

Приближенное построение доверительного интервала.

В основе лежит возможность применения предельных теорем теории вероятности. При достоточно больших n. на практике установлено, что при n>20 з-н распределения суммы величин можно считать практически нормальным.

 

 

11. Статистическая проверка статистических гипотез. Нулевая и конкурирующая гипотезы. Виды ошибок. Общая логическая схема решения задачи.

Статистическая гипотеза – предположение о виде з-на распределении СВ или величины неизв параметра известного з-на распределения.

Стат проверка стат гипорез – процедура обоснованного сопоставления с помощью того или иного критерия, высказанной гипотезой H0 с экспериментальными данными.

H0 – выдвинутая гипотеза

H1 – конкурирующая / альтернативная Н0 зипотеза

 

Цель стат проверки: установить факт: не противоречит ли Н0 экспериментальным данным.

При проверки можно допустить 2 ошибки:

Ошибку 1 рода - непринятие верной гипотезы (непринятие истины)

Ошибку 2 рода – принятие неверной гипотезы (принятие лжи)

α – вероятность совершить ош 1 рода (уровень значимости)

β – вероятность совершить ош 2 рода 1-α ≠ β

 

Общая логическая схема решения задачи.

1. сформулировать Н0 и Н1

2. формирование критерия к= fn(х1…xn) - CВ, т.к. х1…зн - СВ

Обязательное условие: з-н распределения СВ к= f(к) – плотность распределения критерия – должен быть хорошо изучен и затабулирован в предположительной справедливости Н0.

Принцип постоения к: величиной критерия к определяется мера расхождения имеющихся выборочных данных с высказанной Н0.

3. Задание еличины уровня значимости α

Α зависит от потерь, которые получ при отвергании правильной гипотезы. Чем ↑ потери, тем ↓ α.

α чаще всего = 0,1 0,05, 0,025 0,005

4. из табл, где затабулирован f(k), с опр α находим точки. Эти точки разделяют область возможных знач критерия на 2 или 3 части. Они называются критические точки. (в зависимости от Н1)

Критические области, ее образуют знач к, при которых отвергается Н0 где

1 – область малых знач, 2- правдоподобных Знач. 3 – область больших значений

5. в fn(х1…xn) подставляем выборочные зная СВ

а) Кнабл в 2 область – принимается Н0

б) Кнабл в 1 или 3 область – отвергается Н0

 

 

12. Критические области. Мощность критерия. Построение статистического критерия. Принцип отношения правдоподобия.

Критические точки – точки, которые находятся из табл по f(k) и α, разделяющие область на 2 или 3 части в зависимости от Н1.

Критические области – совокупность знач к, при которых отвергается Н0. где

1 – область малых знач, 2- правдоподобных Знач. 3 – область больших значений

Мощность критерия – вероятность того, что принимается Н1, если она верна, а Н0 отвергается.

Мощность критерия = 1-β, где β – вероятность совершить ош 2 рода.

Чем ↑(1-β), тем ↓β

 

Принцип отношения правдоподобия.

Требуется опр какому з-ну расредел принадлежат числа а,b,c -?

Пусть з-н распредел Х(x), Y(х) – нормальный.

У них отличаются ток мат ожидания.

Пусть Н0: f(x)=X(x)

H1: f(x) = Y(x)

Из рис => Н0 не противоречит экспериментальным данным, кажется правдоподобнее, чем Y(х).

 

К= чем ↓к, тем ↑ правдоподобие набл х1…хн в док-ве справедливости Н0.

Представление о сраведливости правдоподобностей имеющихся наблюдений х1…хн в отношении проверяемой Н0 и альтернативн Н1 гипотез дает сопоставление соотв ф-ций правдоподобия.

13. Проверка гипотезы о = центров распред 2х норм генеральных совокупностей при известном s.

Пусть 2 cлуч величины X и Y подчиняются НЗ они имеют 2 независимые выборки объемом n и m

1) Выдвигаем Но и Н1

Но: М(Х)=М(У)

Н1: М(Х)≠М(У)

2) Задается критерий проверки Но

при этом М(Х)=М(Х)

М(У)=М(У)

 

Если Но - справедлива, то k распределена по НЗР и M(k)=0 и σ(k)=1

Плотность распределения -

 

3) Задаем сл вел-ной ур-ия значимости λ

λ=P(|k|>kкр)

P(0<k<+бескон.)=1/2

значит ½=р(0<k<kлз)+з(kкр<k<+бескон.)

 

½= Ф(kкр)+λ/2 или Ф(kкр)=(1-λ)/2

Кнабл=

 

Если выдвигается другая H1

1) Но: М(Х)=М(У)

Н1: М(Х)>М(У)

2)k=

 

14. Проверка гипотезы о равенстве центров распределения двух нормальных генеральных совокупностей при неизвестном s.

Пусть X и Y подчиняются НЗР. Будем считать что дисперсии этих СВ- неизвестны, но одинаковы. σх=σу=σ

1) Но: М(Х)=М(У)

Н1: М(Х)≠М(У)

Х=∑х/n У=∑у/m

S2x=1/(n-1) S2y=1/(m-1)

Т.к. σ2х= σ2у= σ2, то целесообразно взять взвешенные значение: S2=(S2x(n-1)+S2y(m-1))/(n+m-2)

Если Но справедлива, то сл величина (Х-У) подчинена НЗР со след параметрами

М(Х-У)=0 D(X-Y)= σ2(1/n+1/m)

М(Х-У)=M(Y)-M(X)

D(X-Y)= D(X)+D(Y)= D(X)/n+D(Y)/m=(D(X)=D(Y)= σ2)= σ2(1/n+1/m)

S2x-y =S2(1/n+1/m)

 

2) к=t t=(X-Y)/(S2x-y)=(X-Y)/

n+m-2 – cтепень свободы

3) α – задано, по таблице Стьюдента находим tкр.При этом значение tкр будут зависеть от выбранной Н1

* Если Н1: М(Х)≠М(У) => tкр: P(|t|>tкр)=α

Вычисляем tнабл

tнабл=

 

* Если Н1: М(Х)>М(У) => правосторонняя критическая область

* Если Н1: М(Х)<М(У) => левосторонняя критическая область

16. Сравнение 2х дисперсий норм генеральных совокупностей. Понятие о распред Фишера- Снедекора.

Метод применяется для тестиров нов товаров, выбора ценовой политики. Люди – респонденты.2рекламы:

Пусть генеральные совокупности X и Y распред по НЗР; сделаны выборки объемом n и m; Получ S2x и S2y

S2x =

S2y=

M (S2x)=Dx M(S2y)=Dy

Тогда

1) Ho: M (S2x)= M(S2y) или Н0: Dx=Dy

2) Критерий проверки F= S2б/S2м

При справедливом Но величина F подчиняется распределению Фишера-Снедекора.это распределение имеет 2 степени свободы: k1:=n1-1 (n1-Vвыборки Sб2); k2:= n2-1 (n2-Vвыборки Sн2)

Распределение Ф-С зависит только от k1и k2

 

Распределение Фишера-Снедекора.

Если U и V – 2 независимые СВ, распределены по закону хи2 со ст.свободы k1 и k2,

то вел-на F= (U/k1)/(v/k2) и плотность распределения f(x)=

 

f(x)=

 

 

Критические области стоятся изходя из Н1

* 1) Н0: Dx=Dy H1: Dx>Dy 2)

P(F>Fкр)=α если Fнабл > Fкр => Н0 – отвергается

* 1) Н0: Dx=Dy H1: Dx≠Dy à двусторонняя критическая область

 

 

17. Проверка гипотез о законе распределения. Критерий Пирсона.

Критерий согласия - критерий проверки гипотез о предполагаемом з-не распределения(неизвестном)

Критерий Пирсона.

Суть подхода состоит в том, что сравниваются эмпирические(наблюдаемые) и теоретические (вычисл в предполож НР) предположения справедливости гипотезы Но. (f=f(x1,Q1..Qs))

Критерий Пирсона отвечает на вопрос случайно ли расхождение частот но не доказывает справедливость гипотезы. устанавливает ее согласие /несогласие при α

 

Шаги Для применения критерия Пирсона:

1) a)разбить область изменения случайной величины Х(СВ) на l интервалов: ∆1..∆ l (l ≥8)

б) подсчитать количество попаданий СВ mi, i= 1..L в каждый ∆ mi≥7÷10 при этом

в) предполагается что число неизвестных параметров S<=7 (обычно3)

2) на основе выбранных значений х1...хn строятся оценки неизвестных параметров Q*1..Q*s

3) вычитаем вероятность события, что Х попадет в ∆i

 

4) задается уравнения значимости α и по таблицам для заданного числа степеней свободы находятся критические точки ()

Такие, чтобы выполнялось условие

 

 

*Если = > то нет оснований отвергать Но

*Если

 

 

*H0 отвергаем при большом/ малом различии экспер. и теор. Частот

18. Однофакторный дисперсионный анализ.

Используется Для сравнения нескольких средних.

Идея д.а. состоит в сравнении:

*факторной дисперсии*, порождаемой воздействиями фактора и

*остаточной дисперсии*, обусловленной случайными причинами.

F-воздействующий фактор.

n-число наблюдений значений признака хij

n=pq p – число уровней признака; q – всего наблюдений i=1..q j=1...p

 

1) общая факторная и остаточная суммы квадратных отклонений.

общая средняя-

общая сумма квадратов отклонений- Sобщ =

Sфакт=

Sост=

Sост= Sобщ- Sфакт, Sост- хар-ет воздействие СВ

 

2) общая факторная и остаточная дисперсии

S2общ = Sобщ /(pq-1)

S2факт= Sфакт/(q-1)

S2ост= Sост/p(q-1)

Если Но о равенстве средних верна, товсе эти дисперсии являются несмещенными оценками генеральных дисперсий.

 

19. Корреляционный анализ. Метод наименьших квадратов.

1. Две Случ Величины могут быть связаны:

- или функциональной зависимостью(крайне редко)

- или статистической зависимостью

- или быть просто независимыми

Статистическая зависимость - при которой изменение одной СВ влечет изменение распределения другой.

X M(X) Кxy =

Y M(Y) Кxy /σxy= Гxy

 




Поделиться с друзьями:


Дата добавления: 2015-04-24; Просмотров: 826; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.24 сек.