Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Определение числовых характеристик случайных переменных по результатам выборочного наблюдения




Статистический ряд распределения дает представление о виде распределения показателя в диапазоне полученных наблюдений и является основой для оценки его соответствия с тем или иным теоретическим законом распределения. Графической иллюстрацией статистического ряда распределения является гистограмма и кумулятивная линия.

По таким числовым характеристикам, как среднее арифметическое, среднее квадратичное отклонение, средняя квадратичная ошибка среднего значения определяют доверительные интервалы, и оценивается значимость различий показателей в различных условиях.

Для определения методов статистического анализа БД необходимо знать характер распределения и числовые характеристики всех переменных, входящих в матрицу наблюдений. Наилучшие результаты многомерного статистического анализа данных получают тогда, когда распределение входных контролируемых факторов и выходных параметров нормальное или близкое к нему.

Основными задачами статистического описания переменных являются:

· определение числовых характеристик переменных и оценка их точности и надежности;

· определение статистических рядов распределения переменных и оценка их соответствия теоретическим законам распределения;

· оценка значимости различия показателей в зависимых и несвязанных выборках.

Оценка значимости различия показателей в независимых и связанных выборках – одна из основных задач, решаемых исследователями при сравнении методов профилактики, лечения заболеваний и т.д.

Зако́н больши́х чи́сел в теории вероятностей утверждает, что эмпирическое среднее (среднее арифметическое) достаточно большой конечной выборки из фиксированного распределения близко к теоретическому среднему (математическому ожиданию) этого распределения. В зависимости от вида сходимости, различают слабый закон больших чисел, когда имеет место сходимость по вероятности, и усиленный закон больших чисел, когда имеет место сходимость почти всюду («последовательность функций схо́дится почти́ всю́ду к предельной функции, если множество точек, для которых сходимость отсутствует, пренебрежимо мало»).

Всегда найдётся такое количество испытаний, при котором с любой заданной наперёд вероятностью частота появления некоторого события будет сколь угодно мало отличаться от его вероятности.

Общий смысл закона больших чисел — совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая.

На этом свойстве основаны методы оценки вероятности на основе анализа конечной выборки. Наглядным примером является прогноз результатов выборов на основе опроса выборки избирателей.

Числовые характеристики переменных подразделяются на три вида:

· характеристики положения;

· характеристики рассеяния:

· характеристики вида распределения.

К характеристикам положения относятся:

- среднее арифметическое значение;

- медиана;

- мода;

- среднее геометрическое значение;

- среднее гармоническое значение.

Среднее арифметическое характеристика центра дискретного ряда рассчитывается по формуле:

,

В интервальном вариационном ряду среднее арифметическое определяется по другой формуле:

,

где - середина соответствующего интервала вариант значений признака, -частота повторений данной варианты, j – номер варианты.

Уравнение для среднего геометрического имеет вид:

Средним гармоническим нескольких положительных чисел называется число обратное среднему арифметическому их обратных. Среднее гармоническое является средним степени -1. В статистике среднее гармоническе применяется в случае, когда наблюдения, для которых требуется получить среднее арифметическое, заданы обратными значениями.

Среднее гармоническое всегда меньше среднего геометрического, которое всегда меньше среднего арифметического.

Уравнение для среднего гармонического имеет следующий вид:

или:

Медиана соответствует варианте, стоящей в середине ранжированного ряда. Её положение в ряду определяется номером

,

где N – число единиц совокупности. Для определения величины медианы интервального вариационного ряда используется формула:

,

где -нижняя граница медианного интервала, h - величина интервала, - накопленная частота интервала, предшествующего медианному, - частота медианного интервала.

Мода – наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Как и функция Медиана, функция Мода является мерой взаимного расположения значений.

Её величину определяют по формуле:

,

где -нижняя граница модального интервала, - частота, соответствующая модальному интервалу, - предмодальная частота, - послемодальная частота.

В наборе значений мода — это наиболее часто встречающееся значение; медиана — это значение в середине массива; среднее — это среднее арифметическое значение. Ни одна из этих величин не характеризует в полной мере то, в какой степени центрированы данные.

Среднее линейное отклонение вычисляется по следующим формулам:

для сгруппированных данных

,

где K – число групп совокупности, наибольшее значение варианты;

для не сгруппированных данных

.

К характеристикам рассеяния значений переменной относятся:

- минимальное и максимальное значение; Хмин и Хмах

- размах вариационного ряда – Р= Хмах-Хмин;

- дисперсия – σ2

- среднее квадратичное (стандартное) отклонение S;

- 25% (ЛК)и 75% (УК) квартили и межквартильный размах МР= УК-ЛК;

- средняя квадратичная ошибка среднего значения Мх

- 95% доверительный интервал истинного среднего значения.




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 713; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.