Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

СТАТИСТИКА 2 страница




Коэффициенты вариации рассчитываются как отношение среднего отклонения к средней величине. Поскольку среднее отклонение может определяться линейным и квадратическим способами, то соответствующими могут быть и коэффициенты вариации.

Среднее линейное отклонение определяется по формулам (29) и (30):

–простое; (29) – взвешенное. (30)

Среднее квадратическое отклонение определяется как корень квадратный из дисперсии, то есть по формуле (31):

. (31)

Дисперсия определяется по формулам (32) или (33):

–простая; (32) –взвешенная. (33)

В нашей задаче, применяя формулу (30), определим ее числитель и внесем в расчетную таблицу. В итоге получим среднее линейное отклонение: Л = 54,937/25 = 2,198 (года). Разделив это значение на средний возраст, получим линейный коэффициент вариации: = 2,198/21,967 = 0,100. По значению этого коэффициента для рассмотренной группы студентов делаем вывод о типичности среднего возраста, т.к. расчетное значение коэффициента вариации не превышает критериального (0,100 < 0,333).

Применяя формулу (33), получим в итоге дисперсию: Д = 164,018/25 = 6,561. Извлечем из этого числа корень и получим в результате среднее квадратическое отклонение: = = 2,561 (года).Разделив это значение на средний возраст, получим квадратический коэффициент вариации: = 2,561/21,967 = 0,117. По значению этого коэффициента для рассмотренной группы студентов можно сделать вывод о типичности среднего возраста, т.к. расчетное значение коэффициента вариации не превышает критериального (0,117 < 0,333).

В качестве показателей асимметрии используются: коэффициент асимметрии – нормированный момент третьего порядка (34) и коэффициент асимметрии Пирсона (35):

,(34) .(35)

Если значение коэффициента асимметрии положительно, то в ряду преобладают варианты, которые больше средней (правосторонняя скошенность), если отрицательно – левосторонняя скошенность. Если коэффициент асимметрии равен 0, то вариационный ряд симметричен.

В нашей задаче = =383,636/25 = 15,345; =2,5613= 16,797; =15,345/16,797 = 0,914 > 0, значит, распределение студентов по росту с правосторонней асимметрией. Это подтверждает и значение коэффициента асимметрии Пирсона: As = (21,967-20)/2,561 = 0,768.

Для характеристики крутизны распределения используется центральный момент 4-го порядка:

= .(36)

Для образования безразмерной характеристики определяется нормированный момент 4-го порядка , который и характеризует крутизну (заостренность) графика распределения. При измерении асимметрии эталоном служит нормальное (симметричное) распределение, для которого =3. Поэтому для оценки крутизны данного распределения в сравнении с нормальным вычисляется эксцесс распределения (37):

.(37)

Для приближенного определения эксцесса может быть использована формула Линдберга (38):

,(38)

где – доля количества вариант, лежащих в интервале, равном половине (в ту и другую сторону от средней величины).

В нашей задаче числитель центрального момента 4-го порядка рассчитан в последнем столбце расчетной таблицы. В итоге по формуле (37) имеем: Ex = (2780,498/25)/2,5614–3 = 111,220/43,017–3 = -0,415. Так как Ex<0, то распределение низковершинное. Это подтверждает и приблизительный расчет по формуле (38): в интервале 21,967 0,5*2,561, то есть от 20,687 до 23,248 находится примерно 21,4% студентов. Таким образом, Ex = 0,214 – 0,3829 = –0,169.

Самостоятельные задания по теме

По имеющимся в следующей таблице данным по группе из 20 студентов заочного отделения необходимо:

1) построить интервальный ряд распределения признака и его график;

2) рассчитать модальное, медианное и среднее значение, установить его типичность с помощью коэффициентов вариации;

 

№ п/п Вариант
                   
Рост, см Вес, кг Доход, у.е./мес. Численн. Тет-радь, листов Воз-раст, лет Соот-ношение «рост/вес» Стаж работы, мес. Кол-во друзей, чел. Время К-ной час.
              3,533     8,5
              2,623     6,2
              2,875     6,8
              3,375     12,0
              3,000     7,5
              2,828     10,0
              3,255     7,2
              2,726     4,2
              2,429     3,5
              2,361     9,5
              2,342     7,8
              2,672     8,0
              2,356     6,0
              2,559     4,8
              2,173     8,6
              2,095     10,0
              2,342     4,5
              2,011     12,5
              2,691     10,5
              2,021     6,5

Тема 3. Выборочное наблюдение

Методические указания по теме

Задача 1. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц:

Доход, у.е. до 300 300-500 500-700 700-1000 более 1000
Число рабочих          

С вероятностью 0,950 определить:

1) среднемесячный размер дохода работников данного предприятия;

2) долю рабочих предприятия, имеющих месячный доход более 700 у.е.;

3) необходимую численность выборки при определении среднемесячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е.;

4) необходимую численность выборки при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.

Решение. Выборочный метод (выборка) используется, когда применение сплошного наблюдения физически невозможно из-за огромного массива данных или экономической нецелесообразности. Учитывая, что на основе выборочного обследования нельзя точно оценить изучаемый параметр (например, среднее значение – или долю какого-то признака – р) генеральной совокупности, необходимо найти пределы, в которых он находится. Для этого необходимо определить изучаемый параметр по данным выборки (выборочную среднюю – и/или выборочную долю – w) и его дисперсию (Дв). Для этого построим вспомогательную таблицу 3.

Таблица 3. Вспомогательные расчеты для решения задачи

Xi fi Х И X И fi И - )2 И - )2fi
до 300          
300 - 500          
500 - 700          
700 - 1000          
более 1000          
Итого          

По формуле (18) получим средний доход в выборке: = 57100/100 = 571 (у.е.). Применив формулу (33) и рассчитав ее числитель в последнем столбце таблицы, получим дисперсию среднего выборочного дохода: Дв = 4285900/100 = 42859.

Затем необходимо определить предельную ошибку выборки по формуле (39)[1]:

=t , (39)

где tкоэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки; средняя ошибка выборки, определяемая для повторной выборки по формуле (40), а для бесповторной – по формуле (41):

= , (40) = , (41)

где n – численность выборки; N – численность генеральной совокупности.

В нашей задаче выборка бесповторная, значит, применяя формулу (41), получим среднюю ошибку выборки при определении среднего возраста в генеральной совокупности: = = 19,640 (у.е.).

Для определения средней ошибки выборки при определении доли рабочих с доходами более 700 у.е. в генеральной совокупности необходимо определить дисперсию этой доли. Дисперсия доли альтернативного признака w (признак, который может принимать только два взаимоисключающих значения – например, больше или меньше определенного значения) определяется по формуле (42):

.(42)

В нашей задаче долю альтернативного признака (рабочие с доходами более 700 у.е.) найдем как отношение числа таких рабочих к общему числу рабочих в выборке: w = 20/100 = 0,2 или 20%. Теперь определим дисперсию этой доли по формуле (42): =0,2*(1-0,2) = 0,16. Теперь можно рассчитать среднюю ошибку выборки по формуле (41): = = 0,038 или 3,8%.

Значения вероятности и коэффициента доверия t имеются в математических таблицах нормального закона распределения вероятностей (если в выборке более 30 единиц), из которых в статистике широко применяются сочетания, приведенные в таблице 4:

Таблица 4. Значения интеграла вероятностей Лапласа

0,683 0,866 0,950 0,954 0,988 0,997
t   1,5 1,96   2,5  

В нашей задаче = 0,950, значит t = 1,96 (то есть предельная ошибка выборки в 1,96 раза больше средней). Предельная ошибка выборки по формуле (39) будет равна: = 1,96*19,64 = 38,494 (у.е.) при определении среднего дохода; = 1,96*0,038 = 0,075 или 7,5% при определении доли рабочих с доходами более 700 у.е.

После расчета предельной ошибки находят доверительный интервал обобщающей характеристики генеральной совокупности по формуле (43) – для средней величины и по формуле (44) – для доли альтернативного признака:

( - ) ( + )(43) (w - ) p (w + )(44)

В нашей задаче по формуле (43): 571-38,494 571+38,494 или 532,506 у.е. 609,494 у.е., то есть средний доход всех рабочих предприятия с вероятностью 95% будет лежать в пределах от 532,5 до 609,5 у.е.

Аналогично определяем доверительный интервал для доли по формуле (44): 0,2-0,075 p 0,2+0,075 или 0,125 p 0,275, то есть доля рабочих с доходами более 700 у.е. на всем предприятии с вероятностью 95% будет лежать в пределах от 12,5% до 27,5%.

При разработке программы выборочного наблюдения очень часто задается конкретное значение предельной ошибки () и уровень вероятности (). Неизвестной остается минимальная численность выборки (n), обеспечивающая заданную точность. Ее можно получить, если подставить формулу (40) или (41) в формулу (39) и выразить из них n. В результате получатся формулы для вычисления необходимой численности повторной (45) и бесповторной (46) выборок.

nповт = ;(45) nб/повт= . (46)

В нашей задаче выборка бесповторная, значит, воспользуемся формулой (46), в которую подставим уже рассчитанные дисперсии среднего выборочного дохода рабочих (Дв = 42859) и доли рабочих с доходами более 700 у.е. (Дв = 0,16):

nб/повт = = 62 (чел.), nб/повт= = 197 (чел.).

Таким образом, необходимо включить в выборку не менее 62 рабочих при определении среднего месячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е., и не менее 197 рабочих при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.

Самостоятельные задания по теме

Для изучения вкладов населения в коммерческом банке города была проведена 5%-я случайная выборка лицевых счетов, в результате которой получено следующее распределение клиентов по размеру вкладов:

Размер вклада, у.е. Число вкладчиков, чел.
Вариант
                   
до 5000                    
5 000 – 15 000                    
15 000 – 30 000                    
30 000 – 50 000                    
свыше 50 000                    

С вероятностью 0,954 определить:

1) средний размер вклада во всем банке;

2) долю вкладчиков во всем банке с размером вклада свыше 15000 у.е.;

3) необходимую численность выборки при определении среднего размера вклада, чтобы не ошибиться более чем на 500 у.е.;

4) необходимую численность выборки при определении доли вкладчиков во всем банке с размером вклада свыше 30 000 у.е., чтобы не ошибиться более чем на 10%.


Тема 4. Ряды динамики

Методические указания по теме

Задача 1. Смертность от болезней системы кровообращения в России за период гг. характеризуется следующим рядом динамики.

Год                    
Умершие, тыс. чел. 1163,5 1113,7 1100,3 1094,1 1187,8 1231,4 1253,1 1308,1 1330,5 1287,7

Вычислить: абсолютные, относительные, средние изменения и их темпы базисным и цепным способами. Проверить ряд на наличие в нем линейного тренда, на основе которого рассчитать интервальный прогноз на год с вероятностью 95%.

Решение. Любое изменение уровней ряда динамики определяется базисным (сравнение с первым уровнем) и цепным (сравнение с предыдущим уровнем) способами. Оно может быть абсолютным (разность уровней ряда) и относительным (соотношение уровней).

Базисное абсолютное изменение представляет собой разность конкретного и первого уровней ряда (47), а цепное абсолютное изменение представляет собой разность конкретного и предыдущего уровней ряда (48).

(47) (48)

По знаку абсолютного изменения делается вывод о характере развития явления: при > 0 — рост, при < 0 — спад, при = 0 — стабильность.

В нашей задаче эти изменения определены в 3-м и 4-м столбцах таблицы 5. Для проверки правильности расчетов применяется правило, согласно которому сумма цепных абсолютных изменений равняется последнему базисному. В нашей задаче это правило выполняется: = 124,2 и = 124,2.

Базисное относительное изменение представляет собой соотношение конкретного и первого уровней ряда (49), а цепное относительное изменение представляет собой соотношение конкретного и предыдущего уровней ряда (50).

(49) (50)

Относительные изменения уровней — это по существу индексы динамики, критериальным значением которых служит 1. Если они больше ее, имеет место рост явления, меньше ее — спад, а при равенстве единице наблюдается стабильность явления.

В нашей задаче эти изменения определены в 5-м и 6-м столбцах таблицы 5.

Вычитая единицу из относительных изменений, получают темп изменения уровней, критериальным значением которого служит 0. При положительном темпе изменения имеет место рост явления, при отрицательном — спад, а при нулевом темпе изменения наблюдается стабильность явления. В нашей задаче темпы изменения определены в 7-м и 9-м столбцах таблицы 5, а в 8-м и 10-м сделан вывод о характере развития изучаемого явления. Для проверки правильности расчетов применяется правило, согласно которому произведение цепных относительных изменений равняется последнему базисному. В нашей задаче это правило выполняется: =1,107 и =1,107.

Таблица 5. Вспомогательные расчеты для решения задачи

Обобщенной характеристикой ряда динамики является средний уровень ряда . Способ расчета зависит от того, моментный ряд или интервальный (см. рис.3):

 

 

 

 


Рис.3. Методы расчета среднего уровня ряда динамики.

В нашей задаче ряд динамики интервальный, значит, применяем формулу средней арифметической простой (17): = 12070,2 / 10 = 1207,02 (тыс. чел.). То есть за период 1995-2004 в России в среднем за год от болезней системы кровообращения умирало 1207,02 тыс. чел.

Кроме среднего уровня в рядах динамики рассчитываются и другие средние показатели – среднее изменение уровней ряда (базисным и цепным способами), средний темп изменения.

Базисное среднее абсолютное изменение – это частное от деления последнего базисного абсолютного изменения на количество изменений уровней (51). Цепное среднее абсолютное изменение уровней ряда – это частное от деления суммы всех цепных абсолютных изменений наколичество изменений (52).

Б = (51) Ц = (52)

По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост, спад или стабильность. Из правила контроля базисных и цепных абсолютных изменений следует, что базисное и цепное среднее изменение должны быть равными. В нашей задаче = 124,2/9 = 13,8, то есть ежегодно в среднем смертность от болезней системы кровообращения растет на 13,8 тыс. чел.

Наряду со средним абсолютным изменением рассчитывается и среднее относительное. Базисное среднее относительное изменение определяется по формуле (53), а цепное среднее относительное изменение – по формуле (54):

Б= = (53) Ц= (54)




Поделиться с друзьями:


Дата добавления: 2014-12-24; Просмотров: 1084; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.059 сек.