Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Анализ вариации урожайности овощей 1 страница




 

2.1. Построение вариационного ряда распределения районов

по урожайности овощей

 

Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения. Атрибутивными называют ряды распределения, построенные по качественным признакам. Вариационными называют ряды распределения построенные по количественному признаку. В зависимости от характера вариации признака различают дискретные (характеризует распределение единиц совокупности по дискретному признаку) и интервальные вариационные ряды (характеризует распределение единиц по интервальному признаку).

Исходные данные по урожайности овощей в хозяйствах всех категорий представлены в приложении 1.

Для определения оптимального числа групп используется формула Стерджесса:

, (1)

где n - число групп; N - число единиц совокупности.

По формуле 1 было рассчитано число групп по урожайности зерновых культур для рассматриваемой совокупности районов Самарской области:

Рассматриваемую совокупность районов разделим на 4 группы, так как при делении на 5 групп, в одну из них не входит ни одного района.

Величина равного интервала определяется по формуле:

, (2)

где , т.е. размах вариации;

- максимальное и минимальное значение признака совокупности.

Проведем группировку районов Самарской области по урожайности овощей в хозяйствах всех категорий.

Структура районов Самарской области по урожайности овощей представлена в следующей таблице.

Таблица 2

Структура районов Самарской области по урожайности овощей

№ группы Группы районов по урожайности овощей, ц/га Число районов, fi Накопленная частота, Si Накопленная частность, %
в абсолютном выражении в % к итогу
  104,1-122,85   6,67   6,67
  122,85-141,6   6,67   13,34
  141,6-160,35   73,33   86,67
  160,35-179,1   13,33   100,0
Итого -     - -

 

Любой вариационный ряд состоит из двух элементов: вариантов (это отдельные значения признака, которые он принимает в вариационном ряду) и частот (это численности отдельных вариантов или каждой группы вариационного ряда). Частностями называют частоты, выраженные в долях или процентах к итогу. Соответственно сумма всех частностей равна 1 или 100%.

Анализ интервального ряда распределения районов показал, что распределение районов Самарской области по урожайности овощей в 2010 г. не является равномерным: преобладают районы, в которых урожайность составляет от 141,6 до 160,35 ц/га (это 11 районов, на долю которых приходится 73,33%).

Мода (Мо) – это наиболее часто встречающееся значение признака у единиц исследуемой совокупности. Для интервального ряда нахождение конкретного значения моды определяется формулой:

, (4)

где - нижняя граница модального интервала;

- величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному;

- частота интервала, следующего за модальным.

По данным таблицы 1 модальным интервалом построенного ряда является интервал 141,6 – 160,85 ц/га, так как его частота максимальна (f3 =11).

Расчет моды следующий:

ц/га

Более точно моду можно определить графическим методом по гистограмме ряда (рис. 1).

Мо

Рис. 2. Гистограмма распределения районов Самарской области по урожайности овощей

 

Для совокупности районов Самарской области наиболее распространенный уровень урожайности овощей характеризуется средней величиной 151,468 ц/га.

Медиана (Ме) – это серединное значение вариационного ряда. Условием для ее нахождения является то, что исходный ряд должен быть ранжированным.

Графическим путем медиану можно определить по кумулятивной кривой, которая строится по накопленным частотам (рис.2).

Ме

Рис 3. Кумулята распределения районов Самарской области по урожайности овощей

 

Конкретное значение медианы для интервального ряда рассчитывается по формуле:

, (5)

где - нижняя граница медианного интервала;

- величина медианного интервала;

∑fi -сумма всех частот;

- частота медианного интервала;

- накопленная частота интервала, предшествующая медианному.

Расчет значения медианы по формуле (5):

ц/га

В районах Самарской области половина районов имеют среднюю урожайность овощей не более 150,975 ц/га, а другая половина – не менее 150,975 ц/га.

Распределение считается симметричным если средняя величина равна медиане и моде.

Расчет средней арифметической взвешенной осуществляется по формуле:

= ц/га (3)

Для характеристики вариационных рядов применяются особые показатели (мода и медиана), которые можно назвать структурными средними.

Если > > , то это свидетельствует о наличии правосторонней ассиметрии и на графике правая ветвь относительно максимальной ординаты вытянута больше, чем левая.

Если < < , то ассиметрия левосторонняя, т. е. большая часть единиц совокупности имеет значение признака меньше модального.

Так как 149,725 < 150,975 < 151,468, ассиметрия урожайности овощей в хозяйствах всех категорий в районах Самарской области левосторонняя.

 

 

2.2. Расчет показателей вариации урожайности овощей в районах Самарской области

 

Для оценки степени вариации используются следующие показатели: размах вариации (R), среднее линейное отклонение (), среднее квадратическое отклонение (σ), дисперсию (σ2), а также относительные показатели (коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации).

Для расчета вышеуказанных показателей построим вспомогательную таблицу 3.

 

Таблица 3

Расчетная таблица для нахождения показателей ряда распределения урожайности овощей в районах Самарской области

Группы районов по урожайности овощей, ц/га Середина интервала, xi Число районов, fi xi•fi xi - |xi - |• fi (xi - )2 (xi - )2•fi
104,1-122,85 113,475   113,475 -36,25 36,25 1314,063 1314,063
122,85-141,6 132,225   132,225 -17,5 17,5 306,25 306,25
141,6-160,35 150,975   1660,73 1,25 13,75 1,5625 17,1875
160,35-179,1 169,725   339,45 20,00 40,00 400,00 800,00
Итого -   2245,88 -32,5 109,5 1056,25 2437,5

 

Среднее линейное отклонение даёт обобщённую характеристику степени колеблемости признака в совокупности относительно среднего уровня признака. Его можно рассчитать по формуле средней арифметической, как простой, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения:

Простое среднее линейное отклонение:

(ц/га) (6)

Взвешенное среднее линейное отклонение:

= (ц/га) (7)

Среднее квадратическое отклонение является обобщающей характеристикой размеров вариации признака совокупности. Это - мера вариации, показатель надёжности средней. Чем меньше значение среднего квадратического отклонения, тем лучше средняя величина представляет собой рассматриваемую совокупность. Среднее квадратическое отклонение рассчитывается по формуле:

- простая: = (8)

- взвешенная: = (9)

Расчет дисперсии: σ2=12,752=152,5 (10)

Дисперсия и среднее квадратическое отклонение являются мерами надежности средней величины, то есть чем меньше значения этих показателей, тем лучше средняя величина отражает изучаемую совокупность.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Чаще всего они выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Различают следующие относительные показатели вариации.

Коэффициент осцилляции:

= (11)

Данный показатель отражает относительную колеблемость крайних значений признака вокруг средней величины.

Линейный коэффициент вариации:

= % (12)

Он отражает долю усреднённого значения абсолютных отклонений от средней величины.

Коэффициент вариации:

= (13)

Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического.

Вывод: Разность между наибольшим и наименьшим значением урожайности овощей в хозяйствах всех категорий рассматриваемой совокупности районов Самарской области равна 18,75 ц/га. Индивидуальное значение урожайности овощей отдельных районов отклоняется от средней урожайности в области на 7,3 ц/га. Анализ полученных показателей и говорит о том, что средний уровень урожайности в области составляет 149,725 ц/га, отклонение от среднего уровня в ту или иную сторону составляет в среднем 101,85%.

Значение V=101,85%, что превышает 33%, следовательно, вариация урожайности овощей в исследуемой совокупности районов значительна и совокупность по данному признаку качественно неоднородна.

 

 

2.3. Расчет ошибок выборки. Типологическая группировка районов Самарской области по природно-климатическим зонам

 

Ошибка выборки – это разность между величиной параметра генеральной совокупности и величиной того же параметра выборочной совокупности.

Выделяют три вида ошибок выборки: средняя, предельная, относительная.

Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка выборочной средней определяется по формуле:

, (14)

где - общая дисперсия выборочных значений признаков,

N – число единиц в генеральной совокупности,

n – число единиц в выборочной совокупности.

Предельная ошибка выборки , определяет границ, в пределах которого будет находится генеральная средняя:

(15)

, (16)

где - выборочная средняя; - генеральная средняя.

По условию выборочная совокупность насчитывает 15 районов, выборка 55,6% механическая, генеральная совокупность включает 27 наименования. Выборочная средняя ,дисперсия определены. Значения необходимых параметров представлены в таблице 4.

Таблица 4

Значения характеристик

P t n N
0,954       149,725 152,5

 

Рассчитаем среднюю ошибку выборки: ц/га

Рассчитаем предельную ошибку выборки: ц/га

Определим доверительный интервал для генеральной средней: . Тогда (ц/га).

Таким образом, на основании проведенного выборочного обследования хозяйств всех категорий Самарской области с вероятностью 0,954 можно утверждать, что для генеральной совокупности хозяйств средняя урожайность овощей находится в пределах от 145,725 до 153,977 ц/га.

Типологическая группировка - это разделение исследуемой совокупности на социально-экономические типы, явления, классы на однородные группы единиц в соответствии с изучаемыми признаками, при этом группировочный признак должен быть атрибутивным.

Типологические группировки широко применяются в экономических, социальных и других исследованиях. Необходимость проведения типологической группировки обусловлена, прежде всего, потребностью теоретического обобщения первичной статистической информации и получения на этой основе обобщающих статистических показателей. Именно в выделении социально-экономических типов явлений, позволяющих проследить зарождение, развитие и отмирание их, состоит основная задача типологических группировок.

Для проведения типологической группировки районов по типу природно- климатических зон воспользуемся формулой средней арифметической простой (исходные данные представлены в приложении №1):

(18)

Типологическая группировка районов Самарской области по природно-климатическим зонам представлена в следующей таблице.

Таблица 5

Типологическая группировка районов по природно-климатическим зонам

Группа по типу природно-климатических зон Количество районов Средняя урожайность овощей (в хозяйствах всех категорий) в 2010 г., ц/га
Северная   145,1
Центральная   150,1
Южная   142,6

 

Результаты проведенной группировки показали, что наибольшая урожайность овощей в хозяйствах всех категорий наблюдалась в центральной зоне Самарской области и составила 150,1 ц/га, что превысило на 5,0 ц/га и 7,5 ц/га урожайность овощей в северной и южной зонах области. Наименьшая урожайность овощей в хозяйствах всех категорий наблюдалась в южной зоне Самарской области и составила 142,6 ц/га.

 

 

3. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ СВЯЗИ СЕБЕСТОИМОСТИ И ПРОИЗВОДСТВА ОВОЩЕЙ

 

Корреляционно-регрессионный анализ учитывает межфакторные связи и дает более полное измерение роли каждого фактора: прямое, непосредственное его влияние на результативный признак; косвенное влияние фактора через его влияние на другие факторы, влияние всех факторов на результативный признак.

Для определения степени тесноты парной линейной зависимости служит линейный коэффициент корреляции. Он рассчитывается по формуле:

, (19)

где - отклонение вариантов значений признака фактора от средней величины;

- отклонение вариантов значений результативного признака, вызванная влиянием признака-фактора.

Для расчета коэффициента корреляции составим вспомогательную таблицу (приложение №). В качестве факторного признака примем производство зерна (валовой сбор), а в качестве результативного признака - себестоимость 1 центнера зерна.

Коэффициент парной линейной корреляции измеряется в пределах от -1 (обратная связь) до +1 (прямая связь). Для оценки силы связи в теории корреляции применяется шкала английского статистика Чеддока:

- слабая — от 0,1 до 0,3;

- умеренная — от 0,3 до 0,5;

- заметная — от 0,5 до 0,7;

- высокая — от 0,7 до 0,9;

- весьма высокая (сильная) — от 0,9 до 1,0.

Для определения степени влияния факторного признака на результативный используется коэффициент детерминации, который рассчитывается как квадрат коэффициента корреляции. По расчетам данной курсовой работы r2=(-0,18)2=0,032.

Коэффициент парной линейной корреляции показал, что связь между производством зерна и его себестоимостью обратная и достаточно слабая, что говорит о том, что с увеличением производства зерна себестоимость будет иметь тенденцию к снижению. 3,2% вариации себестоимости обусловлено влиянием вариации производства зерна, остальные 96,8% обусловлены влиянием других факторов.

Регрессионный анализ заключается в определении аналитического выражения связи, в которой изменения одной величины обусловлено изменением одной или нескольких независимых величин.

Регрессия может быть однофакторной (парной) и многофакторной (множественной).

По форме зависимости различают:

· Линейную регрессию, которая выражается уравнением прямой (линейной функцией) вида: ; (20)

· Нелинейную регрессию, которая выражается уравнением вида:

парабола - ; (21)

гипербола- . (22)

Для установления формы выражения связи строится регрессионная модель. Уравнение регрессии имеет вид:

(23)

где, а – свободный член уравнения;

b – коэффициент регрессии

Затем определяют численные значения параметров уравнения связи.

= . (24)

(25)

Следовательно, .

Тогда .

Для сравнения роли различных факторов в формировании моделируемого показателя определяется коэффициент эластичности или -коэффициент.

Коэффициент эластичности: = 0,32*51,9/298,44=0,06 (26)

При увеличении производства зерна, себестоимость 1ц зерна снизится среднем на 6,0%.

-коэффициент: (27)

При увеличении производства зерна среднеквадратического отклонения, себестоимость зерна снизится в среднем на 0,18 части своего среднего квадратического отклонения.

Далее необходимо провести оценку адекватности модели с помощью F-критерия Фишера, который рассчитывается по формуле:

, (28)

где n - число данных,

m -число факторных признаков.

Затем полученное значение F-критерия Фишера сравнивают с табличным значением. Если , то построенная регрессионная модель статистически значима. В противном случае построенная регрессионная модель статистически не значима.

С помощью программы Exsel был проведен дисперсионный анализ, результаты которого представлены в таблице 6.

Построенная регрессионная модель статистически не значима, так как расчетный критерий Фишера меньше чем табличный.

 

Таблица 6

Дисперсионный анализ

Дисперсия Степень свободы Сумма квадратов отклонения Дисперсия, рассчитанная на одну степень свободы Критерий Фишера, табличный Критерия Фишера, расчетный
Факторная   820889,5 820889,5 4,21 4,03
Остаточная   92397,03 1776,866 - -
Общая   913286,5 - - -

 

Далее необходимо провести оценку значимости коэффициента корреляции с помощью t-критерия Стьюдента:

(29)

Полученное значение t-критерия Стьюдента сравнивают с табличным значением, если , то коэффициент регрессии статистически значим. Таким образом, с вероятностью 0,95 можно утверждать, что коэффициент корреляции статистически незначим.

Также проводится оценка значимости параметров уравнения:

; = , (30, 31)

Следовательно, .

, = , (32, 33)

Следовательно, .

Параметры уравнения статистически незначимы.

Затем необходимо рассчитать среднюю ошибку аппроксимации:

(34)

Ошибка аппроксимации не превышает 15%, поэтому построенная ранее модель зависимости себестоимости 1 ц зерна от его производства может служить для анализа и прогноза.

 

4. АНАЛИЗ ДИНАМИКИ ПРОИЗВОДСТВА ОВОЩЕЙ В РАЙОНАХ САМАРСКОЙ ОБЛАСТИ

 

Процесс развития, движения социально-экономических явлений во времени в статистике принято называть динамикой. Для отображения динамики строят ряды динамики, которые представляют собой ряды изменяющихся во времени значений статистического показателя, расположенных в хронологическом порядке.

Для изучения интенсивности изменения уровней ряда во времени исчисляются следующие показатели динамики: абсолютный прирост, коэффициент роста, темп роста, темп прироста, абсолютное значение одного процента прироста.




Поделиться с друзьями:


Дата добавления: 2015-08-31; Просмотров: 1795; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.094 сек.