Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Предмет математической статистики. Основные понятия математической статистики




Что такое статистика? «Статистика знает все» - такими словами начинается вторая часть знаменитого романа Ильи Ильфа и Евгения Петрова «Двенадцать стульев». «Статистика – это бюджет вещей» - говорил Бонапарт. «Имеется три вида лжи: ложь, наглая ложь и статистика» - таково мнение английского писателя и государственного деятеля XIX в. Дгураэлли.

По существу статистика зародилась очень давно. Известно, что еще в древних государствах вели учет населения, способного платить налоги. С развитием естественных наук и усложнением жизни общества потребовались научные методы обработки и анализа самых разных сведений.

Вообще статистика – область науки, имеющая дело со сбором, анализом и интерпретацией данных.

Существует несколько десятков различных статистик: экономическая (разрабатывает методы прогнозирования роста или спада производства продукции, изменения цен, спроса и предложения на товары), демографическая (изучает численность населения, его возрастной, социальный, профессиональный состав, перемещение населения в пределах страны), медицинская, финансовая, страховая, биологическая и т.д.

Математическая статистика - раздел математики, изучающий методы сбора, систематизации и обработки статистических данных для получения научных и практических выводов.

При этом под статистическими данными понимают совокупность чисел, являющихся количественной характеристикой изучаемых объектов.

Например, для изучения спроса на продукцию предприятие ведет каждодневный учет поступивших заказов на каждый вид изделия. Полученная совокупность чисел и представляет собой статистические данные.

Теоретической основой математической статистики служит теория вероятностей. В чем же их отличие? Теория вероятностей устанавливает привила нахождения вероятностей сложных событий или числовых характеристик случайных величин по заданным исходным вероятностям или законам распределения. Например, вероятность того, что лампочка в течение года не выйдет из строя – 0,3. Какова вероятность того, что в партии из 100 лампочек в течение года будут работать не менее 90?

А как было получено значение 0,3 - вероятности того, что лампочка не выйдет из строя в течение года? Для нахождения этой вероятности были применены методы математической статистики: исследовали, например, 100 лампочек в течение года, и если из строя вышли 30, то вероятность выхода из строя одной лампочки была оценена как 30/100 = 0,3.

Среди основных задач математический статистики могут быть отмечены следующие:

1. Оценка неизвестной вероятности случайного события (пример с лампочками).

2. Оценка по полученным статистическим данным неизвестного закона распределения случайной величины и ее числовых характеристик (М(Х), D(Х), σ(Х)).

Полученные результаты исследований применяются в практике при принятии решений планирования и организации производства (ассортимента и количества выпускаемой продукции), оптимальном контроле качества продукции, определении страховых взносов и выплат и т.д.

Изучение математической статистики начнем с методов сбора данных. Пусть требуется исследовать некоторую совокупность объектов для изучения какого-либо признака (например, изучение качества лампочек). Практически любой изучаемый признак допускает количественную оценку (срок службы лампочек, продолжительность жизни народонаселения, ежемесячный доход), именно на этой оценке основаны главные понятия математической статистики: генеральная и выборочная совокупность.

Генеральной совокупностью называется множество числовых значений изучаемого признака всех объектов исследуемой совокупности.

Полное исследование генеральной совокупности практически невозможно, поэтому обычно рассматривают только некоторые её объекты, т.е. делают выборку, с помощью которой оценивают генеральную совокупность.

Так, одна американская компания специализировалась на продаже женской одежды, высылаемой почтой. Каждый сезон женщинам рассылался новый каталог. Мода динамична, естественно, что каждый сезон появляются новые стили, и эксперты часто ошибались в своих прогнозах относительно того, что будут заказывать клиентки. В итоге часть продукции залеживалась на складах, фирма терпела большие убытки. И тогда менеджерами компании был найден выход: издание предсезонных каталогов, в которых были представлены различные стили и модели. Эти каталоги рассылались потенциальным покупательницам и гарантировали скидки. На основе анализа сделанных заказов составлялся основной каталог. Результаты превзошли самые смелые ожидания. Прибыль компании стала колоссальной! В чем же дело? Просто менеджеры профессионально подошли к решению проблемы. Конечно, невозможно предугадать заказы всех потенциальных покупательниц (генеральной совокупности), но по данным заказов предварительных каталогов (выборки) можно сделать вполне обоснованные выводы о свойствах генеральной совокупности в целом.

Для того, чтобы по произведенной выборке можно было судить обо всех свойствах изучаемой генеральной совокупности, выборка должна быть репрезентативной – достаточно полно отражать изучаемые признаки генеральной совокупности.

Рассмотрим еще один пример. Фиаско выборочного метода – опрос, проведенный в 1936 году журналом «Liberary Digest». Редакция журнала разослала американцам 10 млн. бюллетеней с просьбой выбрать того, за кого они будут голосовать на выборах: за республиканца Лэндона или за демократа Рузвельта. В редакцию пришло более двух млн. бюллетеней, обработав которые, журнал опубликовал прогноз о безоговорочной победе Лэндона. Однако в ноябре на выборах около 60% голосов набрал Рузвельт и стал президентом США. Почему так произошло? Бюллетени были разосланы подписчикам журнала, владельцам автомашин, телефонов, т.е. достаточно состоятельным людям, за Рузвельта же в основном голосовали менее обеспеченные слои общества. Все дело в том, что исследуемая выборка не была репрезентативна. Для осуществления репрезентативности все объекты генеральной совокупности должны иметь одинаковые шансы попасть в выборку.

Итак, полученный статистический материал наблюдений представляет собой первичные данные о величине, подлежащей статистической обработке.

Изучение статистических данных начинается с их группировки – расположения данных в порядке возрастания.

Рассмотрим пример 30.1 обработки статистических данных. Данные о количестве баллов, полученных на вступительном экзамене по математике среди случайным образом выбранных десяти человек, были следующие:

4,5; 7,0; 9,0; 6,5; 9,0; 6,0; 7,0; 7,0; 8,0; 7,5.

Выполним группировку статистических данных, т.е. расположим их в порядке возрастания: 4,5; 6,0; 6,5; 7,0; 7,0; 7,0; 7,5; 8,0; 9,0; 9,0.

Видим, что некоторые числовые значения повторяются несколько раз.

Значения рассматриваемого признака называются вариантами и обозначаются х 1, х 2, … xn.

В нашем примере встречаются варианты х 1 = 4,5; х 2 = 6,0; х 3 = 6,5; х 4 = 7,0; х 5 = 7,5; х 6 = 8,0; х 7 = 9,0.

Число встречающихся значений вариант называют частотами и обозначают т 1, т 2, … тn.

Обычно статистические данные оформляются в виде таблицы, первая строка которой содержит в порядке возрастания элементы x i, вторая – их частоты m i. Такая таблица называется вариационным рядом. Если все значения вариант перечислены в верхней строке, то такой ряд называют дискретным.

В нашем примере дискретный вариационный ряд будет следующий:

x i 4,5 6,0 6,5 7,0 7,5 8,0 9,0
m i                

Сумма частот в нижней строке равна объему выборки п.

Аналогом вероятности появления той или иной варианты служат относительные частотыfi - отношение частоты к объему выборки, т.е.. Очевидно, что

Помимо вариационного, составляют статистический ряд - таблицу, первая строка которой содержит в порядке возрастания элементы x i, а вторая – их относительные частоты f i .

В нашем примере статистический ряд будет следующий:

x i 4,5 6,0 6,5 7,0 7,5 8,0 9,0
fi 1/10 1/10 1/10 3/10 1/10 1/10 2/10  

Статистический ряд напоминает закон распределения дискретной случайной величины.

Геометрической интерпретацией дискретного вариационного и статистического ряда служит полигон частот (относительных частот).

Полигоном частот (относительных частот) выборки называется ломаная с вершинами в точках (x i, m i) ((x i, f i )).

В нашем примере полигон частот и относительных частот выглядят следующим образом:

 
 

 

 

       

 

 

     
                 
                 
                 
                 
                 
                 

 

В случае, когда количество вариант достаточно большое и перечислять их нецелесообразно, используют интервальный вариационный или статистический ряд. При этом значения вариант объединяют в промежутки для удобства одинаковой ширины d.

Составим интервальный вариационный ряд для примера 30.1. Сначала зададим ширину интервала d. Она выбирается произвольно или задается в условии задачи. Пусть ширина интервала равна 2 баллам. Тогда в вариационном ряду вместо значений вариант будем писать диапазон значений вариант, начиная с наименьшего возможного количества баллов (4), заканчивая наибольшим (10): 4,0 – 6,0; 6,0 – 8,0; 8,0 – 10,0. Осталось определиться с тем, в какие интервалы включать крайние баллы: 6,0 и 8,0. Договоримся значение левой границы каждого интервала считать принадлежащим данному интервалу, а правой – нет (за исключением двух крайних значений 4,0 и 10,0– их всегда берем включительно). Для вариант, попавших в один интервал, соответствующие частоты складываются. Тогда интервальный вариационный ряд в нашем примере будет иметь вид:

x i [4,0 – 6,0) [6,0 – 8,0) [8,0 -10,0]
m i        

Сумма частот по прежнему должна быть равна объему выборки.

Интервальный статистический ряд будет отличаться только тем, что в нижней строке должны стоять относительные частоты для вариант из каждого промежутка, а сумма всех относительных частот равна 1:

x i [4,0 – 6,0) [6,0 – 8,0) [8,0 -10,0]
fi 1/10 6/10 3/10  

Геометрической интерпретацией интервального вариационного и статистического ряда служит гистограмма частот (относительных частот).

Гистограммой частот (относительных частот) выборки называется ступенчатая фигура, состоящая из прямоугольников, построенных на интервалах длиной d, высота которых равна отношению m i/ d (fi / d) (плотность частоты (относительной частоты) на данном интервале).

Гистограмма в примере 30.1 будет состоять из трех прямоугольников, построенных на интервалах длиной d = 2 с высотами

высота гистограмма частот гистограмма относительных частот
h1 ½ = 0,5 1/20
h2 6/2 = 3 6/10:2 = 3/10
h3 3/2 = 1,5 3/10:2 = 3/20

В нашем примере гистограммы частот и относительных частот выглядят следующим образом:

fi
3/10
3/20
1/20
тi
 
1,5
0,5

0 4 6 8 10 x 0 4 6 8 10 x

Контрольные вопросы:

1. Какая дисциплина получила название «математическая статистика»?

2. Перечислите основные задачи математической статистики.

3. Каковы основные понятия математической статистики? Дайте им определения.

4. В чём заключается сущность выборочного метода? Какому условию должна удовлетворять выборка.

5. Что называют вариационным рядом? Дайте определения понятиям «варианта», «частота», «объём выборки».

6. Что называют статистическим рядом? Дайте определение понятию «относительная частота». Аналогом какого понятия из теории вероятностей является статистический ряд?

7. Проанализируйте, чем дискретный вариационный ряд отличается от интервального.

8. Что является геометрической интерпретацией дискретного и интервального вариационного ряда?

9. Решите задачу: Имеются данные о количестве школьников, обучающихся в 25 группах на подготовительных курсах ЯГК:

         
         
         
         
         

Составьте вариационный ряд количества учащихся в группах и постройте полигон частот.

 




Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 2367; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.032 сек.