Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Получение количественной информации и группировка данных

Лекция № 2

1. Статистические совокупности и количественные признаки.

2. Способы отбора объектов в выборку.

3. Способы получения количественной информации в географических исследованиях.

4. Сущность и виды группировок.

5. Графическая форма распределения величин.

 

1 Статистические совокупности и количественные признаки. Прежде чем приступить к математико-статистическим расчетам, географ должен иметь в своем распоряжении достаточный объем коли­чественной информации, характеризующей объекты, процессы и явле­ния на определенной территории или в определенном пункте.

Математическая статистика рассматривает множества единиц од­ного и того же вида, называемые статистическими совокупностями. В географических исследованиях ими могут быть ландшафты, геогра­фические зоны, единицы административно-территориального деления, населенные пункты, промышленные предприятия и др.

Отдельные единицы, входящие в состав статистической совокуп­ности, называются ее элементами. Число всех элементов называют объемом совокупности.

Явления географической среды изучаются не только в простран­стве, но и во времени, отсюда элементами статистической совокупности могут быть как территориальные единицы (ландшафты, административ­ные районы, хозяйства), так и временные (года, сезоны, месяцы, дни и т.д.).

Элементы статистической совокупности отличаются друг от друга (варьируют) по количественным признакам, выраженным в числах. Одни и те же элементы статистической совокупности могут иметь не один, а множество количественных признаков, отражающих в цифровой форме те или иные свойства рассматриваемых явлений и показывающих различия между отдельными элементами статистической совокупности.

Так, внутренняя разнородность географических ландшафтов мо­жет выражаться через различия в глубинах залегания кристаллического фундамента, абсолютной высоты земной поверхности, через вариацию климатических показателей (температуры, давления, влажности и т.д.). Административные районы различаются не только по природным усло­виям, но и по ряду экономических показателей - урожайности зерновых, плотности скота, посевным площадям, затратам средств на ту или иную отрасль хозяйства и т.п. Города изучаемой территории могут отличаться по количеству населения, валовой продукции промышленности, по гео­графическому положению (широте и долготе, удаленности от моря, аб­солютной высоте) и другим показателям. К наиболее типичным для гео­графии количественным признакам правомерно отнести показатели местоположения и размеров географических объектов - их географиче­ской широты, долготы, высоты, протяженности, площади.

При изучении динамики явлений в качестве количественных пока­зателей временных единиц часто используют данные об урожайности по годам, климатические характеристики (например, суммы температур за вегетационный период, гидротермический коэффициент, количество осадков), скорости роста оврагов и др.

Последовательное перечисление количественных признаков элементов, отличающихся местоположением, называют пространст­венными рядами. Количественные признаки по годам, месяцам, дням, часам образуют ряды временные.

Таким образом, элементами статистической совокупности являются объекты, подлежащие изучению. Характерной чертой матема­тической статистики является то, что она изучает статистические сово­купности объектов, но не их отдельные элементы.

Процесс получения количественных показателей объектов и явле­ний часто называют статистическими наблюдениями.

Статистические совокупности подразделяются на генеральную и выборочную.

Генеральная совокупность (М) – это вся имеющаяся статистиче­ская совокупность, объединенная какой-либо качественной общностью. В географических исследованиях наиболее распространена территори­альная общность объектов и явлений, заключающаяся в их принадлеж­ности к какому-то географическом) району. Так, например, все насе­ленные пункты России (или только города), все регионы страны (облас­ти, края, районы) являются генеральными совокупностями. Объем генеральной совокупности в географических исследованиях может быть различным – от нескольких единиц до бесконечности. Если изучаемая территория невелика, то количество элементов часто оказывается не­большим. Например, число хозяйств в административном районе значительно меньше, чем в республике, или, тем более, в России. При изу­чении пространственных закономерностей климатических, морфометрических и ряда других явлений наблюдается изменение количествен­ных показателей от места к месту, т.е. любая точка местности имеет определенное числовое значение (среднегодовую или среднемесячную температуру, абсолютную высоту над уровнем моря и другие характери­стики). Каждая точка в этом случае представляет собой элемент стати­стической совокупности, а так как таких точек неограниченное количе­ство, то генеральная совокупность будет бесконечной.

Довольно часто вся генеральная совокупность не изучается из-за недоступности многих объектов для наблюдений или же ввиду трудоем­кости обработки слишком большого количества данных. Например, вряд ли можно найти количественные характеристики всех оврагов ка­кой-либо зоны; обработать же данные о всех городах России (их около 2 тысяч) хотя и можно, но довольно трудно. При большом объеме стати­стического материала обычно используют выборочную совокупность (m), когда по определенной правильно выбранной генеральной совокуп­ности, взятой на основе отбора, судят об этой совокупности в целом. По-видимому, о всех городах России можно судить достаточно правильно, если для исследований будет взята только часть их. Достаточно боль­шой объем выборки и надлежащая организация наблюдений приводят к тому, что результаты выборочного изучения будут близки к результа­там, получаемым при изучении генеральной совокупности.

Основное качество выборочной совокупности, заключающееся в способности заменить всю генеральную совокупность, называется ре­презентативностью выборки.

2 Способы отбора объектов в выборку. Отбор объектов в выборку должен удовлетворять следующему обязательному правилу - каждая единица генеральной совокупности имеет одинаковую возможность быть отобранной. Такое требование исключает субъективизм, предвзятость в исследованиях. Например, для пра­вильной объективной оценки урожайности зерновых в области не следу­ет использовать данные только лучших хозяйств. Изучение лишь крупных оврагов может создать неправильное представление об овраж­ной эрозии на исследуемой территории.

Наиболее часто встречаются следующие виды отбора:

2.1. Случайный повторный отбор, при котором объекты отбира­ются из генеральной совокупности и после изучения возвращаются в нее, так что любой объект может попасть в выборку повторно. Предпо­ложим, на изучаемой территории имеется 2000 хозяйств (М = 2000). Исследователь решил изучать эти хозяйства, выбрав из имеющейся ге­неральной совокупности лишь 30 (n = 30). Каждому хозяйству при­сваивается номер, который записывается в отдельную карточку. Все 2000 карточек тщательно перетасовывают. Выбирают наугад одну кар­точку и записывают номер хозяйства. Затем эту карточку возвращают в колоду, производят повторное перемешивание, после чего берут еще карточку. Таким образом, выбирают все 30 хозяйств, количественные признаки которых надлежит изучать.

2.2. Случайный бесповторный отбор, при котором элементы ста­тистической совокупности отбираются как и в предыдущем случае, с той лишь разницей, что выбранная карточка в колоду не возвращается, так что каждый отобранный объект не может попасть в выборку по­вторно. Это более распространенный способ выборки по сравнению с первым.

2.3. Механический отбор заключается в том, что единицы, подлежащие изучению, берутся через определенный, заранее установ­ленный интервал. Например, из всех оврагов изучаемой территории мо­жет быть выбран каждый пятый или десятый.

2.4. Серийный отбор (или гнездовой) производится путем деле­ния генеральной совокупности на части (серии), после чего внутри ото­бранных серий (гнезд) производится сплошное наблюдение. Так, чтобы не изучать всю территорию, ее разбивают на равные площадки и по од­ному из вышеописанных способов выбирают для последующего сплош­ного обследования несколько площадок. Участки, типичные для изучае­мого географического района, часто называют «ключами».

На практике различные способы отбора могут применяться в соче­тании друг с другом. Географ-исследователь должен уметь выбрать наи­более подходящий способ в зависимости от конкретных условий.

Следует учесть, что часть никогда не может абсолютно точно оха­рактеризовать целое, поэтому характеристики генеральной совокупно­сти будут отличаться от характеристик, полученных по выборочным данным. Точность во многом зависит от объема выборки (n), однако большое количество наблюдений соответственно увеличивает объем измерительных и вычислительных работ.

 

3 Способы получения количественной информации. Географы могут получать количественные характеристики пред­метов и явлений самыми различными способами. По месту рабочего цикла эти способы подразделяются на полевой, камеральный и лабора­торный.

3.1. Полевой способ обеспечивает исследователя конкретными и свежими данными. Он подразделяется на экспедиционный, стационар­ный и дистанционный.

Объектом экспедиционных исследований являются главным обра­зом те явления, которые заметно изменяются в пространстве и медленно во времени. К ним можно отнести рельеф земной поверхности, геоло­гию, строение почвы, растительность и животный мир.

Гидротермические явления сильно изменяются во времени (по дням, месяцам, годам) и поэтому требуют стационарных наблюдений на метеостанциях, гидропостах и т.д. Физико-географические стационары очень нужны для изучения взаимодействия природных явлений друг с другом и влияния на них антропогенных воздействий.

Современные экспедиции и стационары используют различную измерительную технику: геодезические приборы, анероиды, горные компасы, буры, калориметры, лоты, вертушки, термометры, барометры и т.д. Все они дают в руки исследователя весьма ценный по разнообра­зию и объему количественный материал.

Прогресс человечества немыслим без получения новой информа­ции, которая в большинстве своем заключается в измерениях. Недаром великий русский ученый Д.И. Менделеев назвал измерения воздухом науки.

Возникли проблемы повышения остроты восприятия измеритель­ных приборов, быстроты и дешевизны измерений.

К полевому способу следует отнести дистанционные измерения -измерения «на расстоянии», без непосредственного контакта с самим объектом. Для этого используют различные воспринимающие устройст­ва, способные представить данные о форме, размере, температуре и дру­гих физических и химических свойствах изучаемых объектов. Чаще применяют следующие приборы: гравиметры, магнитометры, аудиомет­ры; приборы, использующие электромагнитные волны. Электромагнит­ные приборы подразделяются на два класса: 1) пассивные, измеряющие падающую и отраженную энергию источника (радиометры и др.); 2) ак­тивные, требующие искусственного облучения объектов исследования волнами особых длин (действующих по принципу радаров). Объекты исследуются облучением электромагнитных волн различных спектров. Инфракрасную тепловую радиацию можно воспринимать в двух окнах спектра днем и ночью, через дымку и туман.

В пределах длинноволнового электромагнитного спектра имеется несколько окон, свободных от атмосферных помех, где возбуждаемая радиация может быть обнаружена высокочувствительными приборами, применяемыми в радиоастрономии (изучаются процессы, происходящие в ледовом, снежном или почвенном покрове, получают данные о влаж­ности почв, плотности посевов, температуре поверхностных вод, тол­щине льда).

Радарные установки воспринимают размеры и очертания объек­тов, их плотность, влажность и другие данные (днем, ночью, в непогоду).

Сфера приложения приборов дистанционного восприятия - изуче­ние энергетических и водньк ресурсов, их морфологии, климата, расти­тельности, почвенного покрова, расселения людей, транспорта, процес­сов урбанизации и т.д.

Важно уметь интерпретировать громадную информацию, полу­чаемую с помощью этих приборов.

3.2. Камеральный способ получения данных предусматривает ис­пользование в кабинетных условиях картографических, аэро- и косми­ческих снимков, литературных, фондовых и архивных материалов,

Следует особо остановиться на роли географических карт в по­лучении количественной информации. Ценность карты заключается в ее способности дать количественную характеристику предметов и явлений, распространенных на больших территориях. Изучением и разработкой методов измерений по картам занимается картометрия - один из важ­нейших разделов картографической науки. По топографическим картам можно получить достаточно точные данные о расстояниях, длинах, площадях, объемах форм земной поверхности, абсолютных и относи­тельных высотах, крутизне склонов. В последнее время в круг своих интересов картометрия стала включать получение количественных ха­рактеристик и не топографического свойства. Поток ценной и разнооб­разной количественной информации значительно возрастает с использо­ванием тематических карт, где объекты и явления изображаются значками, точечным способом, линиями движения, изолиниями, карто­граммами, картодиаграммами и другими способами. Например, по раз­меру значков можно определить количество жителей в населенных пунктах, объем капитальных вложений в строительство, по картам изо­линий - климатические показатели в любом месте, картограмма дает возможность найти количественные показатели валового сбора зерна, картодиаграмма - численность врачей и число коек по отдельным адми­нистративным единицам.

Замечательными источниками разнообразных сведений о Земле являются аэро- и космические снимки. По аэросъемочным материалам с помощью современной фотограмметрической техники географ-исследователь может получить объективные количественные данные о рельефе, растительности, почве. Сопоставление аэроснимков разных лет позволяет определить динамику явлений (например, изменение площа­дей, занятых лесами; рост оврагов).

В экономико-географических исследованиях незаменимым источн­иком получения количественной информации является система государ­ственной отчетности предприятий, акционерных обществ, районов, об­ластей, республик. Эта система охватывает все области хозяйственной и культурной жизни государства.

3.3. Лабораторный способ получения количественных показа­телей весьма перспективен в географии. Воспроизведение природных процессов (например, инфильтрации, смыва и т.д.) в лабораторных ус­ловиях позволяет изолировать изучаемые показатели от второстепенных и случайных процессов, благодаря чему они познаются несравненно глубже. Например, на скорость роста оврагов влияют морфометрические характеристики водосборов, грунт, растительность и ряд других известных и неизвестных факторов, которые в природе сложно взаимосвязаны. Чтобы изучить зависимость овражной эрозии только от угла наклона площади водосбора, в лабораторных условиях на макете (лотке) можно искусственно повышать угол наклона с сохранением остальных факторов на одном количественном уровне. В полевых условиях было бы весьма трудно, а, вернее, невозможно найти овраги с равными усло­виями роста, кроме углов наклона площадей водосбора.

4 Сущность и вид группировок. Математико-статистическая обработка данных часто начинается с группировки, под которой понимают расчленение статистической сово­купности на группы, однородные по какому-либо признаку. Для этого среди всей массы элементов статистической совокупности нужно выде­лить однородные группы, типы и только затем давать им обобщенные характеристики. Так, например, изучая динамику овражной эрозии, можно подразделить овраги по расположению в рельефе на донные, вершинные, склоновые. Затем уже ведется исследование по этим груп­пам. Населенные пункты можно рассматривать не все сразу, а в отдель­ности - городские и сельские.

4.1. Разновидности группировок. В географии важную роль играет группировка по территориаль­ному признаку. Например, те же овраги подразделяются (группируются) по принадлежности к физико-географи-ческим районам, природным зо­нам и т.д. Экономические итоговые сведения обычно даются по сетке административного деления.

Группировка по временному признаку предполагает расчленение временных рядов на интервалы: часы, дни, недели, месяцы, года, деся­тилетия.

Перед математико-статистическими расчетами часто используется группировка по количественному признаку. Разберем пример такой группировки. В таблице 1 даны длины (L) 25 оврагов в метрах.

Таблица 1 – Длины оврагов

 

n/n L(м) n/n L(м) n/n L(м) n/n L(м) n/n L(м)
                   
                   
                   
                   
                   

 

Находим по таблице 1 наибольшее и наименьшее значения изу­чаемого признака (Хmах и Хmin). Оказалось, что самая большая длина ов­рага – 59 м, самая малая – 17м. Этими двумя числами определяется промежуток вариации признака. Делим промежуток на равные интерва­лы, например, на 5. Подсчитываем число оврагов в каждом интервале. Эти числа называются частотами (см. табл. 2).

 

Таблица 2 Интервальный ряд распределения

 

Интервалы длин оврагов Частоты
10-20  
20-30  
30-40  
40-50  
50-60  

 

Таблица, в которой перечислены интервалы признака и указаны частоты, называется интервальным рядом распределения.

Число интервалов группировки зависит от объема совокупности. Их не должно быть чрезмерно много, так как в каждом интервале тогда окажется слишком мало наблюдений для того, чтобы закономерность проявлялась отчетливо; с другой стороны, и слишком малое число ин­тервалов нежелательно, так как теряются существенные особенности распределения. При числе наблюдений от 100 до 500 рекомендуют де­лить промежуток на 8-16 интервалов.

Можно рекомендовать вычисления длин интервалов (d) по Форму­ле Стерджесса,

 

На практике лучше руководствоваться таблицей 3.

 

Таблица 3 Зависимость числа интервалов группировки (m) от объема совокупности (n)

 

n m n m
25-40 5-6 100-200 8-12
40-60 6-8 200 - 500 10-15
60-100 7-10    

 

Промежуток вариации признака иногда может делиться не на рав­ные интервалы, особенно тогда, когда в некоторых промежутках малое количество наблюдений.

Группировка количественной информации облегчает дальнейший процесс математико-статистической обработки данных.

5 Графическая форма распределения величин. Наряду с табличной формой отображения распределения величин по группам в математической статистике используется более наглядная графическая форма (гистограмма, полигон распределения и кривая рас­пределения).

Рассмотрим технику построения гистограммы. Строятся оси ко­ординат, По оси абсцисс откладываются границы интервалов, по оси ординат - соответствующие частоты. Высоты столбиков, опирающихся на масштаб интервалов, ограничиваются значениями частот. Получен­ная фигура называется гистограммой распределения. На рисунке 5.1 с помощью гистограммы показано распределение длин оврагов по дан­ным таблицы 3.

Если из середины каждого интервала восстановим ординату до пе­ресечения с частотой и вершины перпендикуляров соединим прямыми линиями, то получим полигон распределения (см. ломаную линию на рисунке 5.2).

Рисунок 5.1 – Гистограмма распределения оврагов

 

Более точное представление о закономерности распределения ста­тистического материала дает третий способ изображения интервальных рядов в виде плавной кривой, называемой кривой распределения. По­строение кривых требует сложных математических расчетов. В географических исследованиях они часто проводятся на глаз плавной кривой по точкам вершин перпендикуляров.

 

 

Рисунок 5.2 – Полигон и кривая распределения

 

Таким образом, кривая распределения является сглаженным поли­гоном (см. пунктирную кривую линию на рисунке 5.2), а полигон — сглаженной гистограммой.

Анализ графиков распределения (изучение их максимумов и ми­нимумов, пологих и крутых участков) представляет большой интерес для исследователя.

Из рассмотрения гис­тограммы, полигона распределе­ния и кривой распределения (рис. 5.1 и 5.2) можно заключить, что в изучаемом районе преобладают овраги длиной от 30 до 40 м. Коротких (до 20 м) и длинных (свыше 50 м) оврагов значитель­но меньше.

В экспериментальных ис­следованиях широко распростра­нен сравнительный анализ кри­вых распределения. Географ час­то сравнивает кривые, характери­зующие одни и те же явления на

разных территориях. Например, сопоставляя кривые распределения длин оврагов в нескольких физико-географических районах, можно об­наружить, в каком районе овраги длиннее, в каком короче, сравнить максимальные и минимальные значения длин, найти различия в частоте оврагов одной и той же протяженности. Если кривые окажутся сходны­ми, можно предполагать наличие примерно одинаковых условий овраж­ной эрозии.

Выделим следующие виды распределений в конечном промежутке (а, б). 5.1.
Нормальное
(«колоколообразное») (рис. 5.3).

 

Рисунок 5.3 – Нормальное распреде­ление

 

Средние значения количественных признаков встре­чаются чаще, чем малые и боль­шие. Такие распределения харак­терны для количественных показа­телей климата (температуры, осад­ков) по временным интервалам и для биологических особей (разме­ры зерен, рост человека, длина его ступни).

Кроме симметричных кривых распределения, существуют и асимметричные. В географических исследованиях более типичны пока­зательное и равномерное распределения.

Показательное (рис. 5.4). Наибольшая частота соответствует наи­меньшему значению признака. С ростом х частота убывает. Примеры: распределение длин оврагов, людности населенных пунктов и др.

 

Рисунок 5.4 – Показательное распределение

 

Равномерное (рис. 5.5). Частота во всех интервалах примерно одинаковая. Следовательно, кривая здесь становится близкой к прямой.

 

 

Рисунок 5.5 – Равномерное распределение

ВОПРОСЫ И ЗАДАНИЯ

 

Дайте определение следующих терминов и понятий:

1. Статистическая совокупность;

2. Элементы и объем статистической совокупности;

3. Количественные признаки;

4. Пространственные и временные ряды;

5. Статистические наблюдения;

6. Генеральная и выборочная совокупности;

7. Репрезентативность выборки;

8. Случайный повторный отбор;

9. Случайный бесповторный отбор;

10. Механический отбор;

11. Серийный отбор;

12. Полевой способ получения количественной информации;

13. Дистанционные измерения;

14. Камеральный способ получения количественной информации;

15. Лабораторный способ получения количественной информации;

16. Группировка данных по территориальному признаку;

17. Группировка данных по временному признаку;

18. Группировка данных по количественному признаку;

19. Интервальный ряд распределения;

20. Гистограмма;

21. Полигон распределения:

22. Кривая распределения;

23. Нормальное распределение;

24. Показательное распределение;

25. Равномерное распределение;

<== предыдущая лекция | следующая лекция ==>
Общие понятия и принципы системного анализа | Вычисление основных статистических показателей
Поделиться с друзьями:


Дата добавления: 2014-01-03; Просмотров: 877; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.085 сек.