Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Ход работы. Метод корреляционного исследования

Введение

Метод корреляционного исследования. Построение гистограмм.

 

Группа: Мт-200902

Студент: Вахрушева К.А.

Преподаватель,

профессор д.т.н: Бараз В.Р.

 

 

Екатеринбург

Анализ корреляционный — метод статистической оценки, формы знака и тесноты связи, исследуемых признаков или факторов, применим в ряде особых случаев, когда экспериментальный подход затруднителен или невозможен, например по этическим соображениям. Позволяет получать информацию, основанную на более разнообразных выборках и более близкую к реальности в отличии от лабораторных экспериментов, но корреляционный анализ не позволяет решить проблему, связанную с возможной интерпретацией зависимости, существующей между переменными (трудно решить, какая из них причина, а какая следствие). Недостатки анализа связаны с тем, что он позволяет лишь констатировать наличие связи, но не может доказать причинно следственный тип этой связи.

Гистограмма — способ графического представления распределения числовых данных. Диапазон возможных значений переменных делится на отрезки, задающие разбиение выборки на классы или группы. Каждой группе на гистограмме соответствует прямоугольник, длина которого равна диапазону значения в заданной группе, а площадь пропорциональна числу наблюдений в этой группе. Для построения гистограммы, по данным вариационного ряда с равными интервалами (как и для построения полигона) на оси абсцисс откладывают значения аргумента, а по оси ординат - значения частот или относительных частот. В результате получают ступенчатую фигуру, в виде сдвинутых к друг другу прямоугольников, площади которых пропорциональны частотам. Если построена гистограмма интервального распределения, то полигон того же распределения можно получить, если соединить прямолинейными отрезками середины верхних оснований прямоугольников.

 

 

Из задания ввели в лист Excel таблицу: показатели финансовой деятельности предприятия компании за 1-й квартал текущего года (рис. 1). Как видно, показано только начало этой глубокой таблицы.

 

Объем реализации (млн. руб) Балансовая прибыль (млн. руб.)
  886,1 119,2
  878,9 117,4
  858,9  
  835,5 245,9
  819,1  
    96,1
     
  800,5 220,5
  800,4 29,4
     
  780,7 63,8
  773,5 196,7
  752,8 232,4
  747,8 128,4
  721,4 28,5
  717,2 84,5
    111,4
    268,5
  708,7 501,8
  701,8  

Рис. 1. показатели финансовой деятельности предприятия компании за 1-й квартал текущего года

Задание 1. Методом случайного бесповторного отбора сформировать выборку объемом 50 единиц с указанием их финансовых показателей.

Для того, чтобы сформировать выборку объемом 50 единиц для начала воспользуемся функцией СЛЧИС. Для этого в строчку D2 вводим формулу =СЛЧИС(). Затем дважды щелкаем по маркеру заполнения в правом нижнем углу ячейки D2 (маленький черный крестик) и протягиваем его до ячейки D96. Весь столбец D в диапазоне D2:D96 оказывается заполненным случайными числами (рис.2) Как видно, на рисунке представлено только начало таблицы.

Рис.2. Случайные числа

 

Далее нам необходимо отсортировать числа от максимального к минимальному значению. Для этого выделяем диапазон A2:D96 и обращаемся к команде «Сортировка от А до Я» и выбираем «сортировка от максимального к минимальному». Результат показан (на рис.3 первые 20).

 

Рис.3. Сортировка от максимального к минимальному

Затем мы выбрали первые 50 значений для столбцов: № п/п, Объем реализации, Балансовая прибыль — для дальнейших расчетов. Результат показан на рис.4.

Объем реализации (млн. руб) Балансовая прибыль(млн. руб.)
  352,8 65,5
  355,3 45,2
  362,8 9,1
  369,4 92,5
  369,8 146,5
  373,7 105,3
  389,5 122,3
  404,3 70,3
    29,4
  433,8 62,6
  437,2 74,2
  452,9  
  459,5 40,9
  474,4 99,3
  491,8 133,8
  492,2 122,1
  497,2 244,4
  497,2 46,4
  500,8 54,6
  510,1  
  511,6 59,7
     
  556,6 37,8
  585,6 90,8
  589,3 41,9
  596,5 20,9
  646,2 106,9
  669,7 132,7
  672,4 220,6
  680,2 163,6
  680,2 109,7
  682,1  
  701,8  
  708,7 501,8
    268,5
  747,8 128,4
  773,5 196,7
     
     
  819,1  
  835,5 245,9
  878,9 117,4
  503,5 47,1
  475,2 72,4
  752,8 232,4
  481,7 62,4
  527,6 43,3
  403,6 63,5
  555,7 246,7

 

Рис.4. Выборка объемом 50 единиц методом случайного бесповторного отбора

Задание 2.

1. Вычислить коэффициент корреляции

Существуют различные аналитические приемы определения коэффициента r, но мы воспользуемся функцией программы Excel “=КОРРЕЛ”.

Зная коэффициент корреляции, можно дать качественно-количественную оценку тесноты связи. Используя, например, специальные табличные соотношения (например шкала Чеддока). Ее представление может иметь следующий вид (рис.5.)

Величина КПК Характеристика силы связи
До 0,3 Практически отсутствует
0,3-0,5 слабое
0,5-0,7 заметное
0,7-0,9 сильное
0,9-0,99 Очень сильное

Рис.5. Шкала Чеддока

Для расчета коэффициента корреляции курсором мыши встаем любую свободную ячейку и вводим функцию «=КОРРЕЛ(G2:G51;H2:H51)».

Результат представлен на рис.6.

Коэффициен парной корреляции, r 0,357

Рис.6. Коэффициент парной корреляции, r

2. Адекватность полученного значения

Для вероятности 95% табличное значение «Критические значения корреляции для уровня значимости α и степени свободы f» будет равно 0.273.

Из этого следует, что соотношение выполняется, следовательно, с вероятностью 95% корреляционная связь присутствует, но по шкале Чеддока является слабой.

3. Рассчитать коэффициент детерминации, .

Для оценки степени тесноты связи помимо коэффициента корреляции используют коэффициент детерминации (причинности) , он устанавливает ту часть изменчивости y, которая зависит от поведения переменной x. Этот коэффициент показывает: какая часть общей изменчивости y вызвана x.

Для вычисления коэффициента детерминации надо возвести коэффициент корреляции в квадрат. Для этого встаем в любую свободную ячейку и вводим «=J5*J5». Результат на рис.7.

 

Коэффициент детерминации, R^2 0,127

Рис.7. Коэффициент детерминации

Из коэффициента детерминации, полученного нами, можно сделать вывод о том, что связь присутствует на 2%, а на остальные 98% зависит от других факторов.

4. Инструмент «Описательная статистика»

В процессе выполнения своей работы мы воспользовались инструментом «Описательная статистика». С помощью данной функции можно легко найти такие значения: Среднее, Стандартная ошибка, Стандартное отклонение и другие. Для этого воспользуемся функцией Анализ данных, в появившемся окне выбираем пункт Описательная статистика, нажимаем кнопку Ок, затем указываем входной интервал, отмечаем галочкой пункт Итоговая статистика, также не забываем указать Выходной интервал, то есть любую свободную клеточку и нажимаем Ок.

Результат показан на рис.8.

Столбец 1   Столбец 2  
       
Среднее   Среднее  
Стандартная ошибка   Стандартная ошибка  
Медиана   Медиана  
Мода   Мода  
Стандартное отклонение   Стандартное отклонение  
Дисперсия выборки   Дисперсия выборки  
Эксцесс -1 Эксцесс  
Асимметричность   Асимметричность  
Интервал   Интервал  
Минимум   Минимум  
Максимум   Максимум  
Сумма   Сумма  
Счет   Счет  
Наибольший(1)   Наибольший(1)  
Наименьший(1)   Наименьший(1)  
Уровень надежности(95,0%)   Уровень надежности(95,0%)  

Рис.8. Описательная статистика

Задание 3.

1. Построение гистограммы

Одним из способов графического изображения результатов статистического распределения какой-либо величины x по количественному признаку, является представление их в виде гистограмм или столбчатых диаграмм.

Гистограмма распределения позволяет оценить сколько раз измеренные значения x, укладываются в заданные дискретные промежутки, охватывающие весь диапазон изменения этой величины. Гистограмма графически строится в виде столбцов, образующих совокупность смежных прямоугольников, построенных на прямой линии.

Сначала нам нужно задать разряды, на которые исследуемый массив следует разделить. В нашем случае удобно задаться шагом равным 50, так как измеренные величины располагаются между 300 и 900 (рис.9.)

 

Разряды
 
 
 
 
 
 
 
 
 
 
 
 
 

Рис.9. Разряды

В главном меню отыщем опцию Сервис, а далее Анализ данных/Гистограмма. В появившемся диалоговом окне заполним входные данные, укажем входной интервал, отмечая диапазон ячеек, где располагается наш массив. Частоту мы вычисляем с помощью функции «=СЧЕТЕСЛИ», она подсчитывает количество не пустых ячеек, удовлетворяющих условию. Следующая позиция: Интервал карманов (это те разряды, на которые нужно бует разделить рассматриваемый массив) (рис.10.). Теперь заполним Параметры вывода. Укажем Выходной интервал, здесь достаточно дать ссылку на левую верхнюю ячейку. Отметим флажком Вывод графика, после чего нажмем на кнопку ОК (рис.11.).


 

 

разряды карман частота
     
     
     
     
     
     
     
     
     
     
     
     
     

Рис.10.

Рис.11. Гистограмма: Объем реализованной продукции

 

2. Построить полигон распределения

И, наконец, последнее. Эти же результаты, которые мы изобразили гистограммой, можно представить и в другой форме — в виде кривой частоты или полигона распределения. В этом случае график будет представлять собой ломанную линию, построенную на основание расчета среднеинтервальных значений, рассматриваемого массива. Делается это так:

1) поместить курсор в поле диаграммы, чтобы высветилась надпись «Область построения диаграммы»

2) щелкнем правой клавишей — появится контекстное меню, в нем выберем опцию Тип диаграммы, а затем на вкладке Стандартные, в категории Тип укажем График, после чего ОК.

На рис.12 можно будет полюбоваться нашим новым компьютерным произведением.

 

Рис.12. Полигон распределения: объем реализованной продукции

 

Заключение

Подробное исследование приемов корреляционного анализа статистических совокупностей позволяет узнать, как рассчитывается коэффициент корреляции и коэффициент детерминации, и как проверить адекватность полученных значений. Исходя из этих коэффициентов, можно сделать вывод, что между балансовой прибылью и объемом реализации слабая связь, их взаимодействие на 98% зависит от иных факторов.

Также мы научились строить гистограмму и полигон распределения. Из них четко видно, что наибольшая частота - 17 проявляется в промежутке от 350 до 400.

<== предыдущая лекция | следующая лекция ==>
 | Реферат. Список использованных источников
Поделиться с друзьями:


Дата добавления: 2014-12-24; Просмотров: 495; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.043 сек.