Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Лекция по теме 3: Статистические исследования




План лекции:

1. Основные понятия и методы теории вероятностей.

2. Основные понятия математической статистики.

3. Средние величины и показатели вариации признака.

Основные понятия и методы теории вероятностей

Рассмотрим дискретные случайные величины и законы распределения.

Определение.Величина, принимающая свои значения в зависимости от исходов некоторого испытания, причем для каждого элементарного исхода имеющая одно единственное значение, называется случайной.

Дискретная случайная величина.

Определение.Величина, принимающая отдельные, изолированные возможные значения с определенными вероятностями называется дискретной случайной величиной.

Числовые характеристики дискретной случайной величины: математическое ожидание, дисперсия, среднее квадратическое отклонение. Введем данные понятия.

Математическое ожидание.

Определение.Математическим ожиданием дискретной случайной величины называется сумма произведений всех возможных ее значений на соответствующие им вероятности:

Свойства математического ожидания.

1. Математическое ожидание постоянной величины равно самой постоянной: , где .

2. Математическое ожидание алгебраической суммы нескольких случайных величин равно алгебраической сумме математических ожиданий этих величин:

Следствие.Если , то

3. Математическое ожидание произведения нескольких взаимно независимых случайных величин равно произведению математических ожиданий этих величин:

Следствие. Постоянный множитель можно выносить за знак математического ожидания:

где .

4. Математическое ожидание числа появлений события в независимых испытаниях (математическое ожидание биноминального распределения) равно произведению числа испытаний на вероятность появления события в каждом испытании:

5. Дисперсия.

Определение.Дисперсией дискретной случайной величины называется математическое ожидание квадрата отклонения этой величины от ее математического ожидания:

.

Для вычисления дисперсии также можно использовать следующую формулу:

,

т.е. дисперсия случайной величины равна разности между математическим ожиданием квадрата этой величины и квадратом её математического ожидания.

Свойства дисперсии.

1. Дисперсия постоянной величины равна нулю: , .

2. Постоянный множитель можно выносить за знак дисперсии, предварительно возведя его в квадрат:

,

3. Дисперсия суммы нескольких взаимно независимых случайных величин равна сумме дисперсий этих величин:

4. Если , то

Замечание 2. Для вычисления дисперсии биноминального распределения можно воспользоваться следующей формулой:

, где – число испытаний; – вероятность осуществления события в одном испытании; – вероятность осуществления противоположного события событию в одном испытании.

Среднее квадратическое отклонение.

Определение.Средним квадратическим отклонением случайной величины называется квадратный корень из дисперсии: .

Замечание 3.На основании данного определения для обозначения дисперсии часто используется символ .

Основные понятия математической статистики

При решении многих практических задач, связанных со статистическими моделями, необходимые вероятностные характеристики случайных величин неизвестны и должны определяться по экспериментальным данным. Такое статистическое описание результатов экспериментов, построение и проверка различных математических моделей, использующих понятие вероятности, составляют основное содержание математической статистики.

Методы математической статистики расширяют возможности научного предсказания и целесообразного принятия решений в условиях неопределенности, когда принципиально не может быть известен полный комплекс условий проведения эксперимента.

Основополагающими понятиями статистической теории являются понятия генеральной совокупности и выборки.

Определение.Совокупность, состоящая из всех объектов, которые могут быть к ней отнесены, называется генеральной.

Определение.Число всех объектов, составляющих генеральную совокупность, называется ее объёмом и обозначается .

Определение.Конечный набор объектов, случайным образом отобранный из генеральной совокупности, называется выборочной совокупностью, или выборкой.

Определение.Число объектов выборки называется ее объёмом и обозначается .

Определение.Выборка называется репрезентативной (представительной), если она достаточно полно характеризует генеральную совокупность. При отсутствии какой-либо дополнительной информации о специфических особенностях изучаемого явления наилучшим средством получения репрезентативной выборки является случайный выбор ее элементов.

Статистические оценки и их свойства.

Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных – результатов наблюдений.

Первая задача математической статистикисостоит в том, чтобы указать способы сбора и группировки статистических сведений,полученных в результате наблюдений или в результате специально поставленных экспериментов.

Вторая задача – разработать методы анализа статистических данных в зависимости от целей исследования.Сюда относятся:

1) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости случайной величины от одной или нескольких случайных величин и др.;

2) проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которого известен.

Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование эксперимента),в ходе исследования (последовательный анализ)и решает многие другие задачи. Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.

Смысл статистических методовзаключается в том, чтобы по выборкеограниченного объема , т.е. по некоторой части генеральной совокупности высказать обоснованное суждение о свойствах генеральной совокупности в целом.

Использование выборочного метода при изучении генеральной совокупности неизбежно приводит к ошибкам ошибкам репрезентативности,имеющим следующие особенности:

1. Возможную величину ошибок репрезентативности определяют из анализа выборочных данных и учитывают их при оценке генеральных параметров.

2. Ошибки репрезентативности можно свести к достаточно малой величине (путем увеличения объема выборочных данных).

Определение.Вероятности,признанные достаточными для уверенного суждения о генеральных параметрах на основании выборочных показателей, называют доверительными ( или ).

С понятием доверительной вероятности связано понятие уровня значимости.

Определение.Вероятность, которой решено пренебрегать в данном исследовании, называется уровнем значимости : (или ).

Обычно (в статистике) рекомендуется пользоваться уровнем значимости при предварительных исследованиях и при окончательных выводах.

В качестве доверительных используются вероятности:

, т.е. на 20 испытаний допускается одна ошибка;

, т.е. на 100испытаний допускается одна ошибка;

, т.е. на 1000 испытаний допускается одна ошибка.

Средние величины и показатели вариации признака

Оценка параметров генеральной совокупности (генеральные параметры). Существуют точечные и интервальные оценки генеральных параметров.

Точечной называют оценку, которая определяется одним числом. К таким оценкам относятся, например,

выборочная средняя

или для сгруппированного вариационного ряда

,

– выборочная дисперсия

или для сгруппированного вариационного ряда

– выборочное среднее квадратическое отклонение

и др. Здесь везде – число попаданий в интервал .

Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны быть:

– несмещенными;

– эффективными;

– состоятельными.

Определение.Оценка называется несмещенной, если математическое ожидание ее выборочного распределения совпадает со значением генерального параметра.

Определение.Точечная оценка называется эффективной, если она имеет наименьшую дисперсию выборочного распределения по сравнению с другими аналогичными оценками, т.е. обнаруживает наименьшую случайную вариацию.

Определение.Точечная оценка называется состоятельной, если при увеличении объема выборочной совокупности n она стремиться к величине генерального параметра.

Для выборки из нормальной генеральной совокупности эта оценка является также и эффективной.

При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальнойназывают оценку, которая определяется двумя числами – концами интервала – доверительного интервала.

Интервальные оценки позволяют установить точность и надежность оценок.

Для оценки генерального параметра с помощью доверительного интервала необходимы три величины:

– значение выборочного показателя;

– критерий надежности , или показатель безошибочных прогнозов, значение которого определяется заранее, при планировании исследования, исходя из представления о большей или меньшей ответственности возможных результатов работы;

– ошибка репрезентативности или показатель точности выборочного параметра определяется на основе выборочных данных по формулам математической статистики.

Например, доверительный интервал для генеральной средней находится по формуле: при уровне значимости .

Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом отдельном случае.

Средняя величина — это абстрактная, обобщающая характеристика признака изучаемой совокупности, но она не показывает строения совокупности, которое весьма существенно для ее познания. Средняя величина не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены ли они вблизи или значительно отклоняются от нее. В некоторых случаях отдельные значения признака близко примыкают к средней арифметической и мало от нее отличаются. В таких случаях средняя хорошо представляет всю совокупность. В других, наоборот, отдельные значения совокупности далеко отстают от средней, и средняя плохо представляет всю совокупность.

Колеблемость отдельных значений характеризуют показатели вариации. Термин «вариация» произошел от латинского variatio – «изменение, колеблемость, различие». Однако не всякие различия принято называть вариацией. Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Различают вариацию признака: случайную и систематическую.

Анализ систематической вариации позволяет оценить степень зависимости изменений в изучаемом признаке от определяющих ее факторов. Например, изучая силу и характер вариации в выделяемой совокупности, можно оценить, насколько однородной является данная совокупность в количественном, а иногда и качественном отношении, а, следовательно, насколько характерной является исчисленная средняя величина. Степень близости данных отдельных единиц к средней измеряется рядом абсолютных, средних и относительных показателей.

Для характеристики совокупностей и исчисленных величин важно знать, какая вариация изучаемого признака скрывается за средним.

К примерам вариаций относятся следующие показатели:

1. размах вариаций,

2. среднее линейное отклонение,

3. среднее квадратическое отклонение,

4. дисперсия,

5. коэффициент вариаций.

1. Размах вариаций является ее простейшим показателем. Он определяется как разность между максимальным и минимальным значением признака. Недостаток этого показателя заключается в том, что он зависит только от двух крайних значений признака и не характеризует колеблемость внутри совокупности.

.

2. Среднее линейное отклонение является средней величиной абсолютных значений отклонений от средней арифметической. Отклонения берутся по модулю, т.к. в противном случае, из-за математических свойств средней величины, они всегда были бы равны нулю.

3. Среднее квадратическое отклонение определяется как корень из дисперсии.

4. Дисперсия (средний квадрат отклонений) имеет наибольшее применение в статистике как показатель меры колеблемости.

Дисперсия является именованным показателем. Она измеряется в единицах соответствующих квадрату единиц измерения изучаемого признака.

5. Коэффициент вариаций определяется как отношение среднего квадратического отклонения к средней величине признака, выраженное в процентах.

Он характеризует количественную однородность статистической совокупности. Если данный коэффициент < 50%, то это говорит об однородности статистической совокупности. Если же совокупность не однородна, то любые статистические исследования можно проводить только внутри выделенных однородных групп.

Дисперсия – средний квадрат отклонений индивидуальных значений признака от их средней величины.

Вопросы для самоконтроля:

1. Необходимые понятия математической статистики.

2. Перечислите основные понятия, которыми оперирует статистика.

3. Что такое дисперсия и как она рассчитывается?

4. Как определить относительные показатели вариации?

5. Какой относительный показатель вариации чаще всего используется?

6. Что характеризует общая дисперсия?

7. Необходимые понятия теории вероятностей.

8. Определите основную функцию средней величины.

9. Перечислите основные виды средних величин.




Поделиться с друзьями:


Дата добавления: 2014-12-10; Просмотров: 842; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.011 сек.