Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Описательные статистики




 

Так как значения переменных не постоянны, то возникает необходимость описания их изменчивости.

Пример: Имеются следующие результаты измерения контролируемого параметра (Таблица 3).

Таблица 3 - Результаты измерений

X X X X X X X X X X
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       
                                       

 

Создадим в системе Statistica электронную таблицу с исходными данными (Рисунок 34).

 

 

Вычислим основные описательные статистики. Для этого в файле данных выделим переменную «Рез-т измер.» и щелкнем на ней правой кнопкой мыши. В появившемся списке опций (Рисунок 35) выберем «Statistics of Block Date»®«Block Columns»®«All» (Статистические вычисления блока данных ®Колонки блока®Все).

Рисунок 34 - Фрагмент исходных данных

Рисунок 35 - Выбор описательных статистик

В итоге появится электронная таблица с описательные статистики выбранного блока данных (Рисунок 36). В нашем случае это статистические характеристики результатов измерений.

Рисунок 36 - Описательные статистики результатов измерений

Согласно полученным результатам:

1) - выборочное среднее;

2) - медиана выборки. Значение, которое разбивает выборку на две равные части. Половина наблюдений лежит ниже медианы, и половина наблюдений лежит выше медианы (если наблюдения отсортированы по возрастанию).

3) - среднеквадратическое отклонение;

4) - количество наблюдений (объем выборки);

5) - сумма всех результатов наблюдений;

6) - минимальное наблюдение в выборке;

7) - максимальное наблюдение в выборке;

8) - значение, ниже которого располагается 25% выборочных данных (так как у нас объем выборки равен 200 то это число будет соответствовать наблюдению номер 50, если наблюдения отсортировать по возрастанию);

9) - значение, ниже которого располагается 75% выборочных данных (так как у нас объем выборки равен 200 то это число будет соответствовать наблюдению номер 150 если наблюдения отсортировать по возрастанию).

Для дальнейшей работы необходимо вернуться к электронной таблице с исходными данными.

Для работы с описательными статистиками необходимо в меню «Statistics» (Рисунок 22) запустить модуль «Basic Statistics/Tables» (основные статистики и таблицы).

В появившемся окне выбора процедур модуля «Basic Statistics/Tables» (Рисунок 37) выбрать процедуру «Descriptive statistics» (описательные статистики).

Рисунок 37 - Окно выбора процедур модуля "Basic Statistics/Tables"

В результате появится диалоговое окно процедуры «Descriptive statistics» (Рисунок 38).

Нажав кнопку «Variables», выберем исследуемую переменную (в нашем случае это переменная «Рез-т измер.»).

На закладке «Advanced» диалогового окна (Рисунок 38) можно отметить необходимые статистики. После выбора всех интересующих описательных статистик нажать кнопку .

Рисунок 38 - Окно «Descriptive statistics»

В результате системы выдаст электронную таблицу с результатами (Рисунок 39).

Рисунок 39 - Результаты вычисления описательных статистик

На практике, на первом этапе обработки данных часто возникает необходимость в их группировке. Группировка позволяет представить первичные данные в компактном виде, выявить закономерности варьирования изучаемого признака. Количество классов можно приблизительно наметить, пользуясь следующими рекомендациями: при количестве наблюдений 25…40 – 5…6 классов, при количестве наблюдений 40…60 – 6…8 классов, 60…100 – 7…10, 100…200 наблюдений – 10…12, более 200 наблюдений – 12…15 классов.

Для возврата к окну «Descriptive statistics» нажать кнопку . Для построения гистограмм и таблиц частот используется закладка «Normality» окна «Descriptive statistics» (Рисунок 40).

Число классов (интервалов) группировки данных устанавливается при помощи счетчика переключателя «Number of intervals» (число интервалов). Если активировать переключатель Integer intervals ( целые интервалы ), то система вычислит частоту появления результатов наблюдений. Установим число интервалов равное 12. Если установить флажок напротив опции «Normal expected frequency» то система вычислит частоты попадания в интервалы, предсказанные нормальным распределением. Для получения результатов группировки нажать кнопку .

Рисунок 40 - Закладка "Normality" диалогового окна «Descriptive statistics»

В итоге системы выдаст электронную таблицу с результатами группировки (Рисунок 41).

Рисунок 41 - Результаты группировки

В этой таблице:

1) Count – количество значений, попавших в данный интервал;

2) Cumulative Count – количество значений с накоплением;

3) Percent of Valid – процент попавших в интервал значений;

4) Сomul % of Valid – процент попавших в интервал значений с накоплением;

5) % of all Cases – процент значений попавших в интервал от общего количества;

6) Cumulative % of All - процент значений попавших в интервал от общего количества с накоплением;

7) Expected Count – ожидаемое количество значений, попавших в интервал;

8) Cumulative Expected - ожидаемое количество значений, попавших в интервал с накоплением;

9) Percent Expected – ожидаемый процент попавших в интервал значений.

10) Cumulative % Expected - ожидаемый процент попавших в интервал значений с накоплением.

Представим распределение результатов измерений на гистограмме. Для этого вернемся к окну «Descriptive Statistics» нажав кнопку .

На гистограмму при необходимости можно наложить плотность нормального распределения, проверить близость распределения к нормальному виду при помощи критериев Колмогорова-Смирнова, Лилиефорса; вычислить статистику Шапиро-Уилкса. Для этого в группе опций Distribution необходимо установить флажок напротив соответствующих статистик. Значения статистик показываются непосредственно на гистограммах.

Установив необходимые параметры (Рисунок 40) нажать кнопку для построения гистограммы.

Результат построения гистограммы представлен на Рисунок 42. Из гистограммы видно, что распределение результатов измерений достаточно близко к нормальному.

Рисунок 42 – Гистограмма распределения результатов измерений

О близости распределения к нормальному можно также судить по графику на нормальной вероятностной бумаге. Для построения такого графика необходимо перейти на закладку «Prob.&Scatterplots» окна «Descriptive statistics» и нажать кнопку .

В результате получим следующий график, представленный на Рисунок 43.

Чем ближе распределение к нормальному виду, тем лучше значения ложатся на прямую линию. Этот метод оценки является фактически глазомерным. В сомнительных случаях проверку на нормальность можно продолжить с использованием специальных статистических критериев (Колмогорова-Смирнова, Омега-квадрат (w2)).

Рисунок 43 - График на нормальной вероятностной бумаге

 




Поделиться с друзьями:


Дата добавления: 2014-11-29; Просмотров: 829; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.03 сек.