Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Теоретические сведения. Статистическая обработка данных




Статистическая обработка данных

 

 

 

Описательная статистика применяется для систематизации и описания данных наблюдения. Задачи, которые решает описательная статистика – это, прежде всего, задачи соединения и обобщения данных. Цель здесь состоит не только в том, чтобы извлечь и представить в самом сжатом виде существенную информацию об изделии или процессе, придав ей форму некоторой системы данных [3].

Описание данных обычно является начальным этапом в анализе количественных данных и часто – первым шагом к использованию других статистических процедур [3].

В качестве данных для описательной статистики может быть любая информация, которая отражает содержание наблюдений: опросы общественного мнения, показатели экономической и финансовой деятельности, характеристики производственных процессов и т.д. Характеристики выборочных данных могут служить основанием для выводов относительно характеристик всей совокупности данных. И какова бы ни была генеральная совокупность наблюдений, из которой черпаются данные, описательная статистика предлагает наиболее целесообразные способы, с помощью которых можно не только быстро выделить основное содержание полученной информации, но и провести дальнейший ее анализ с минимальной трудоемкостью [3].

На этапе описательной статистики определяются следующие основные характеристики выборки:

  1. Минимум и максимум. Максимум – самое большое значение из анализируемого набора данных, минимум – самое маленькое (может быть и отрицательным числом). Это крайние значения в совокупности данных, обозначающие границы их вариации [5].
  2. Размах выборки - обозначается буквой R. Это самый простой показатель, который можно получить для выборки - разность между максимальной и минимальной величинами данного конкретного вариационного ряда, т.е.

 

[5].

 

  1. Среднее арифметическое выборки характеризует средний уровень значений изучаемой случайной величины в наблюдавшихся случаях и вычисляется путем деления суммы отдельных величин исследуемого признака на общее число наблюдений:

 

,

 

где - выборочное среднее, - объем выборки, - i-й элемент выборки [5].

  1. Медиана представляет собой срединное значение упорядоченного массива чисел. Если массив не содержит повторяющихся чисел, то половина его элементов окажется меньше, а половина — больше медианы. Если выборка содержит экстремальные значения, для оценки среднего значения лучше использовать не среднее арифметическое, а медиану. Чтобы вычислить медиану выборки, ее сначала необходимо упорядочить.

 

элемент упорядоченного массива [5].

 

Эта формула неоднозначна. Ее результат зависит от четности или нечетности числа :

если выборка содержит нечетное количество элементов, медиана равна (n+1)/2-му элементу;

если выборка содержит четное количество элементов, медиана лежит между двумя средними элементами выборки и равна среднему арифметическому, вычисленному по этим двум элементам [5].

  1. Мода. Термин был впервые введен Пирсоном в 1894 г. Мода — это число, которое чаще других встречается в выборке (наиболее модное). Мода хорошо описывает, например, типичную реакцию водителей на сигнал светофора о прекращении движения. Классический пример использования моды — выбор размера выпускаемой партии обуви или цвета обоев. Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»). Мультимодальность распределения дает важную информацию о природе исследуемой переменной. Например, в социологических опросах, если переменная представляет собой предпочтение или отношение к чему-то, то мультимодальность может означать, что существуют несколько определенно различных мнений. Мультимодальность также служит индикатором того, что выборка не является однородной и наблюдения, возможно, порождены двумя или более «наложенными» распределениями. В отличие от среднего арифметического, выбросы на моду не влияют. Для непрерывно распределенных случайных величин, например, для показателей среднегодовой доходности взаимных фондов, мода иногда вообще не существует (или не имеет смысла). Поскольку эти показатели могут принимать самые разные значения, повторяющиеся величины встречаются крайне редко [5].
  2. Дисперсия и стандартное отклонение. Эти показатели позволяют оценить степень колебания данных вокруг среднего значения. Выборочная дисперсия является приближением среднего арифметического, вычисленного на основе квадратов разностей между каждым элементом выборки и выборочным средним. Для выборки выборочная дисперсия, обозначаемая символом , задается следующей формулой:

 

[5].

В общем случае выборочная дисперсия — это сумма квадратов разностей между элементами выборки и выборочным средним, деленная на величину, равную объему выборки минус один:

 

[5].

 

Наиболее практичной и широко распространенной оценкой разброса данных является стандартное выборочное отклонение. Этот показатель обозначается символом и равен квадратному корню из выборочной дисперсии:

 

[5].

 

Ни выборочная дисперсия, ни стандартное выборочное отклонение не могут быть отрицательными. Единственная ситуация, в которой показатели и могут быть нулевыми, — если все элементы выборки равны между собой [5].

  1. Асимметрия распределения - качественное свойство кривой распределения, указывающее на отличие от симметричного распределения. Асимметрия распределения положительна (отрицательна), если коэффициент асимметрии положителен (отрицателен). При положительной (отрицательной) асимметрии распределения более "длинная" часть кривой плотности распределения лежит правее (левее) моды [6].

 

,

 

где - общее количество выборки, - стандартное выборочное отклонение.

  1. Эксцесс – характеризует остроконечность или сглаженность функции распределения:

[4].

 

Различают относительную и кумулятивную частоты. В общем случае, частота – это количество значений случайной величины в выборке [4].

Относительная частота:

 

.

 

где - частота отдельных значений в выборке [4].

Кумулятивная частота:

 

[4].

 

В первом приближении совпадает с вероятностью [4].

Относительная кумулятивная частота:

 

[4].

 

Причем

[4].

 

Как правило, оперируют не с отдельными значениями, а с интервалами (подгруппами) по правилу:

 

[4].




Поделиться с друзьями:


Дата добавления: 2015-08-31; Просмотров: 455; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.