Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Составление рядов распределения и их графические представления




Предмет математической статистики

Предметом математической статистики является анализ результатов массовых, повторяющихся измерений. Результаты таких измерений всегда более или менее отличаются друг от друга. Даже если измеряется тот же самый объект в неизменных условиях, нельзя получить одинаковые данные. Из-за многочисленности причин, не поддающихся контролю и варьирующих от одного измерения к другому, результаты измерений всегда претерпевают случайное рассеивание. Аналогичное рассеивание бывает при однотипных измерениях в группе однородных объектов (например, измерения высоты прыжка у группы школьников одного класса). Хотя результат каждого отдельного измерения при случайном рассеивании заранее предсказать нельзя, это не означает, что мы имеем дело с полным хаосом. Массовые изменения однородных объектов, обладающих качественной общностью, обнаруживают определенные закономерности. Математическая статистика создает методы выявления этих закономерностей. Выделяют три основных этапа статистических исследований.

1. Статистическое наблюдение. Представляет собой планомерный, научно обоснованный сбор данных, характеризующих изучаемый объект. Оно должно удовлетворять следующим требованиям:

а) объекты наблюдения (испытуемые) должны быть одинаковыми (однородными) с точки зрения их свойств (квалификация, специализация, возраст, стаж работы и др.);

б) число объектов наблюдения должно быть достаточным, чтобы можно было выявить закономерности и обобщить их свойства.

2. Статистические сводка и группировка. Они являются важной подготовительной частью к статистическому анализу данных. Этот этап предусматривает:

а) систематизацию (группировку) данных;

б) оформление определенных статистических таблиц.

3. Анализ статистического материала. Это завершающий этап статистического подхода. Его проводят с использованием соответствующих математико-статистических методов.

 

В процессе наблюдения или измерения какого-либо показателя получают ряд чисел. Численные результаты подразделяют на дискретные и непрерывные. К дискретным относят число подтягиваний на перекладине, число попыток и т.д., то есть результаты, выражаемые целым числом; к непрерывным – время прохождения дистанции, время реакции, скорость движения и т.п., то есть результаты, которые могут выражаться дробным числом, в частности, бесконечной дробью.

Генеральной совокупностью называется совокупность всех объектов, характеристики которых требуется определить. Выборочной совокупностью, или просто выборкой, называется часть объектов, определённым образом выбранных из общей генеральной совокупности.

Способы отбора:

- случайный;

- по определённой схеме;

- смешанный (сочетание первого и второго способов).

Например, длина тела студентов какого-либо вуза Республики Беларусь – выборочная совокупность, а длина тела студентов всех вузов – генеральная; в то же время длина тела студентов Беларуси – выборка по отношению к генеральной совокупности – всем студентам земного шара.

Генеральную совокупность мысленно можно представить так: это все объекты наблюдения (например, спортсмены), которые обладают теми же свойствами, что и объекты выборки. В самом общем случае под генеральной совокупностью понимают совокупность всех мыслимых значений наблюдений, которые могли бы быть сделанными при данном комплексе условий.

Один из центральных вопросов статистики: как обобщить результаты, полученные на выборке, на всей генеральной совокупности?

Предположим, что исследователь проводил эксперименты на группе тяжелоатлетов III разряда и нашел, что один из методов тренировки лучше, чем другие. Можно ли распространить его данные на всех тяжелоатлетов III разряда, или же сделанные им выводы справедливы только для той группы спортсменов, в которой проводился эксперимент? Если исследованием охвачена вся генеральная совокупность, оно называется сплошным. Например, если кому-либо удалось обследовать всех сильнейших спортсменов мира в каком-либо виде спорта, значит. проведено сплошное исследование. Все остальные исследования называются выборочными. Одной из основных характеристик выборки является ее объемn, который определяется числом объектов наблюдения, например, спортсменов в данном исследовании. Как проводится упорядочение и анализ выборки? Предположим, что у баскетболистов БГУФК измерили силу левой кисти. Результат измерений в килограммах (n = 100) представлен в таблице 2.1.

Таблица 2.1 – Пример выборочных результатов (n = 100)

№ п/п             ...    
x, кг             ...    
x, кг (ранжиров.)             ...    

 

В этой таблице числа записаны в той последовательности, в какой проходили измерения, т.е. случайным образом. Такие данные представляют неупорядоченную выборку. Третья строка – выборка упорядоченная, точнее – ранжированная. Ранжированием называют расстановку результатов измерений в порядке возрастания или убывания.

Выборки большого объема разбивают на интервалы. В простейшем случае их может быть два. Например, когда необходимо отобрать худших или лучших спортсменов. Однако, для получения достаточно точных результатов число интервалов (его обозначают буквой k) должно быть больше. В зависимости от объёма выборки количество интервалов устанавливают, придерживаясь формулы американского статистика Стерджесса:

На основании формулы Стерждесса требуемое число интервалов для разного объёма сведено в таблицу 2.2.

Таблица 2.2 – Рекомендуемое число интервалов для выборки разного объема

Объем выборки (n) 10 – 20 30 – 50 60 – 90 100 – 200 300 – 400
Число интервалов (k)   5 – 6      

Тогда величина, или шаг интервала, определяется:

(2.1)

где – максимальный результат измерений в выборке, – минимальный результат. В рассматриваемом примере (табл. 2.1) для n = 100 принимаем k = 8. Шаг интервала

кг.

На основе значений k и h заполняют таблицу 2.3.

Таблица 2.3 – Вариационный ряд измерений

     
№ интервала Граница интервала Частота
  36 – 41  
  41 – 46  
  46 – 51  
  51 – 56  
  56 – 61  
  61 – 66  
  66 – 71  
  71 – 76  

 

В столбец 1 записываем порядковые номера интервалов.

Столбец 2 получают следующим образом: выбирают значение x (нижнюю границу 1-го интервала) равную (из табл. 2.1) – 36+5 = 41; получают верхнюю границу 1-го интервала (она же является нижней границей 2-го интервала); далее 41+5= 46 и т.д.

Столбец 3 определяет частоту, или «встречаемость», значений выборки в каждом интервале. Она определяется числом результатов измерений, попавших в данный интервал. Под частостью понимают отношение частоты к общему числу элементов выборки (к ее объему). Сумма частот всех интервалов всегда равна объему выборок, а сумма частостей всех интервалов равна единице.

Из этой таблицы можно определить, как часто каждое значение результатов измерений встречается в каждой выборке. Распределение, представленное в столбцах 2 и 3, в статистике называют вариационным рядом.

Анализ вариационных рядов упрощается при графическом представлении. Рассмотрим основные графики вариационного ряда.

1. Полигон распределения (рис. 2.1). График строится в прямоугольной системе координат. Величины измеряемого показателя откладываются на оси абсцисс, частоты (частости) – на оси ординат.

Рисунок 2.1 – Полигон распределения (на оси абсцисс – середины интервалов,
на оси ординат – частоты)

2. Гистограмма распределения (рис. 2.2). График строится аналогично полигону распределения, однако на оси абсцисс откладываются не точки (середины интервалов), а отрезки, отображающие интервал, а на оси ординат – частоты.

36 41 46 51 56 61 66 71 76

 

Рисунок 2.2 – Гистограмма (на оси абсцисс – интервалы, на оси ординат – частоты)




Поделиться с друзьями:


Дата добавления: 2015-04-30; Просмотров: 410; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.054 сек.