Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Факторный анализ (метод главных компонент)




Переменные, значения которых представляют собой статистические данные или результаты социологических исследований, опросов потребителей и экспертов, нередко носят условный характер и не отражают сущность реальных факторов, влияющих на исследуемый процесс (потребительский выбор или величину спроса). К тому же нередко наблюдается линейная зависимость (мультиколлинеарность) между ними. Число независимых (реальных), часто первоначально скрытых, факторов, может быть существенно меньше, чем число исходных показателей. Возникает задача – сократить число переменных до нескольких, наиболее существенных факторов, позволяющих объяснить изменения результативного показателя. Чаще всего для этой цели используется метод главных компонент.

 

Суть вычислений по методу главных компонент заключается в следующем:

Строится матрица, элементами которой являются отклонение результатов наблюдений над n переменными от соответствующих средних

 

Определяется матрица дисперсий и ковариаций объясняющих переменных:

Матрица Sxx имеет размерность n x n.

Главные компоненты zj (j=0,…,n) являются линейными комбинациями объясняющих переменных xj* (j=0,…, n) и могут быть записаны в общем виде как

.

Они удовлетворять упомянутому выше требованию: каждый раз выделенная главная компонента должна воспроизводить максимум дисперсий. На неизвестные векторы коэффициентов aj накладываются дополнительные ограничения:

(т.е. они должны быть нормированы) и

(т.е. они должны быть некоррелированы).

Дисперсия главной компоненты zj

должна принимать наибольшее значение при перечисленных соблюдении условий. Для решения проблемы максимизации функции, связанной дополнительными ограничениями, пользуются методом множителей Лагранжа. В конечно итоге задача сводится к определению собственных значений матрицы Sxx и соответствующих собственных векторов aj.

Собственные значения матрицы Sxx определяются из уравнений, которые в общем виде записываются как

,

где - множители Лагранжа; I – единичная матрица.

Подставляя последовательно собственные значения, начиная с наибольшего, в уравнение

получим собственные векторы матрицы Sxx, соответствующие этим собственным значениям. Собственные векторы затем используются для построения искомых векторов коэффициента в формуле

Так как собственные векторы известны, по формуле можно определить главные компоненты. При этом обычно довольствуются меньшим, чем n, числом главных компонент, но достаточным, чтобы воспроизвести большую часть дисперсий. По мере выделения главных компонент прекращают в тот момент, когда собственные значения соответствующие каждый раз наибольшим дисперсиям, становятся пренебрежимо малыми. Количество выделенных главных компонент r в общем случае значительно меньше числа объясняющих переменных m. По r главным компонентам строится матрица Z. С помощью главных компонент оцениваются параметры регрессии

И вычисляются значения регрессии

При всех своих преимуществах (уменьшение высокой мультиколлинеарности объясняющих переменных) метод главных компонент обладает и недостатками.

Во-первых, главным компонентам, как правило, трудно подобрать экономические аналоги. Поэтому вызывает затруднения экономическая интерпретация оценок параметров регрессии, полученных по приведенным формулам. Во-вторых, оценки параметров регрессии получают не по исходным объясняющим переменным, а по главным компонентам. В итоге можно сказать, что метод главных компонент применяется в основном для оценки значений регрессии и для определения прогнозных значений зависимой переменной, что также является целью регрессионного анализа.

Заключение.

Таким образом, на лекциях за 3й семестр студенты получили возможность ознакомиться с основными положениями теории статистики, с методами сбора и обработки статистической информации, различными видами статистических показателей, а также методами оценки характера распределения, методами оценки степени тесноты статистических взаимосвязей, методами анализа динамики и построения уравнений тренда и уравнений регрессии.

В следующем семестре изучается прикладная социально-экономическая статистика и статистика финансов – новая для нашей страны область статистики.


[1] От англ. слова represent – представлять.

[2] Это свойство используется для расчета средней арифметической в том случае, если не известны частоты отдельных значений признака, а известны только их удельные веса (доли) в общей численности статистической совокупности.

[3] Эту тему я обычно не читаю ни вечерникам ни заочникам, так как она имеет относительно узкое практическое применение.

[4] В настоящее время в г.Москве положение значительно улучшилось, рождаемость превышает смертность.

[5] Эту тему для вечерников я сочла нужным убрать, так как по-моему все эти формулы изучаются еще в математической статистике.

[6] Альтернативный признак – признак, у которого только два значения (условно измеряемые нулем и единицей). Например, пол человека может быть женским (0) или мужским (1). Обычно с помощью понятия «альтернативный признак» измеряется наличие (1) или отсутствие (0) какого-либо качественного признака (например, наличие высшего образования у человека). Любой вопрос в анкете (статистическом формуляре), на который можно дать только два варианта ответа «да» или «нет», также относится к альтернативным признакам опрашиваемых (например, «Жилая площадь Вашей квартиры менее 30 м или нет?»).

[7] Слово «корреляция» происходит от английского слова «correlation» (т.е. отношение или соотношение).

[8] Различные виды и способы построения уравнений регрессии рассматриваются на следующей лекции.

[9] Более подробный перечень таких показателей изучается в курсе эконометрики.

[10] Более подробно расчет корреляционного отношения расчет рассматривается на следующей лекции.

[11] Слово regression по-английски означает «связь». Подробнее построение уравнений регрессии рассматривается на следующей лекции

1 Более подробно эти виды функций и методы расчета их параметров обычно изучают в курсе эконометрики.

[12] Более подробно эти методы изучаются в дисциплине «Эконометрика»




Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 1180; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.012 сек.