Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Инструментарий Microsoft Excel 2000 для решения множественной регрессионной задачи




В русифицированной версии EXCEL 97 для корреляционно-регрессионного анализа используются средства специального статистического модуля. Microsoft заказывала разработку этого модуля фирме, специализирующейся на программном обеспечении математико-статистических задач. Модуль включает в себя два вида средств математико-статистического анализа: функции и инструменты. Мы отдаем предпочтение сложным инструментам, обеспечивающим более высокий уровень автоматизации расчетов, комплексности, графического моделирования и организации результатов. Однако некоторые пользователи в определенных случаях вполне обоснованно могут предпочесть функции.

Множественный корреляционно-регрессионный анализ в основном ориентирован на средства дополнительного пакета Анализ данных. Активизация команды Сервис Анализ данных открывает окно Инструменты анализа, предоставляющее 19 статистических инструментальных средств. Среди них - Корреляция и Регрессия, непосредственно и эффективно поддерживающие простой и множественный корреляционно-регрессионный анализ

Эти сложные инструменты доступны в том случае, если они предварительно загружены через команду Сервис / Надстройки. В открывшемся окне дополнений следует пометить флажок слева от позиции пакет анализа, и затем щелкнуть по кнопке ОК. После повторного обращения к команде Сервис, позиция Анализ данных появится в конце меню. Если же команда Анализ данных и в этом случае отсутствует в меню Сервис, то необходимо запустить программу установки Microsoft Excel. После установки пакета анализа его необходимо активизировать с помощью команды Надстройки.

С помощью инструмента Корреляция, можно получить корреляционную матрицу парных коэффициентов за один прием. Для этого, после выбора Сервис/Анализ данных/Корреляция, следует определить в качестве входного все поле имеющихся исходных данных, корреляционные связи которых изучают. Затем следует уточнить с помощью флажков, по столбцам или по строкам размещены переменные. Если поле содержит заголовочную строку (или столбец), то в диалоге активизируют графический флажок Метки (Labels). После выбора графической кнопки выполнения (ОК), корреляционная матрица автоматически выводится на новый лист той же электронной таблицы, начиная с клетки А1. Если матрицу желают вывести на какой-либо конкретный лист и начиная с клетки, определяемой пользователем, то делают соответствующие установки в окне «Выходной интервал» диалогового окна инструмента Корреляция.

Вид корреляционной матрицы, полученной в результате определения входного поля представлен в таблице:

  А B C D E
    Х1 Х2 Х3 Х4
  X1        
  Х2 k12      
  Х3 k13 k21    
  Х4 k14 k22 k34  

 

Можно осуществить преобразование корреляционной матрицы копированием в нее формулы для диагностики связей по модулю коэффициента корреляции.

Вспомогательная диагностирующая формула.

=ЕСЛИ(АВS(В3)<0,1;"Нет связи";ЕСЛИ(АВS(В3)<0,3;"Слабая";

ЕСЛИ(АВS(В3)<0,5;"Умеренная";ЕСЛИ(АВS(В3)<0,7;"Заметная";

ЕСЛИ(АВS(В3)<0,9;"Сильная";ЕСЛИ(АВS(В3)<=0,99;

"Весьма сильная";"Полная"))))))

Эта формула (для одной клетки) преобразует числовые значения коэффициентов корреляции, полученные в корреляционной матрице, в их текстовые смысловые эквиваленты. Преобразование осуществляется по модулю коэффициента корреляции. При ручном копировании формулы следует соблюдать следуют требования:

1. Матрица должна быть автоматически записана на новый рабочий лист по умолчанию, т е. начиная с клетки А1.

2. Матрица должна быть скопирована на тот же лист, ниже оригинала на одну-две строки, без смешения столбцов. Оригинал матрицы перемещать нельзя. Оригинал и копия существуют одновременно.

3. Открыть рабочую книгу, в известной клетке которой содержится оригинал диагностирующей формулы одним пробелом перед знаком равенства. Занести формулу в буфер для копирования.

4. Перейти в окно той книги и на тот ее лист, где создана и скопирована оригинальная корреляционная матрица.

5. Установить курсор в ту клетку матрицы-копии, куда скопировано значение клетки ВЗ из оригинала матрицы. Выполнить вставку из буфера (щелкнуть по пиктограмм вставки)

6. В режиме редактирования убрать пробел перед знаком равенства в формуле, нажать Еntеr. Выбрать клетку формулы и скопировать ее ("протянуть") по вертикали до последней строки матрицы, а затем каждую клетку - по горизонтали, не копируя на диагональные клетки с единицами. Можно копировать иначе.

Числовая и текстовая матрицы содержат информацию для принятия решений of отборе факторов и планирования дальнейших вычислений (см. приведенные выше матрицы 1 и 3). Числовую корреляционную матрицу следует форматировать до 2-3. десятичных знаков, т. к. для принятия решений не требуется большего количества знаков.

Работая непосредственно с Мicrosoft Excel 2000, вы можете получать информацию о параметрах этого окна из стандартной справки.

Входной интервал Y — здесь требуется задать состоящий из одного столбца диапазон анализируемых зависимых данных.

В нашей задаче это столбец значений Y. Такая установка одинакова для всех четырех уравнений, запланированных нами к исследованию.

Входной интервал Х - здесь требуется определить диапазон подлежащих анализу / смежных рядов независимых данных (не более 16 независимых). Программа разместит независимые переменные заданного диапазона слева направо.

Метки - здесь требуется установка флажка, если первая строка или первый столбец входного интервала содержит заголовки. Если заголовков нет, то флажок надо снять.

Рекомендуется всегда включать метки во входной интервал, и поэтому не забывать щелкать по флажку "метки". Если мы забудем включить этот флажок при наличии меток, то вместо расчета получим прерывание и сообщение "Входной интервал содержит нечисловые данные".

Уровень надежности - по умолчанию применяется уровень 95%. Установите флажок, если хотите включить в выходной диапазон дополнительный уровень, а в поле (рядом) введите уровень надежности, который будет использован дополнительно к применяемому.

Мы решаем задачу на уровне, предложенном по умолчанию. Однако итоговое уравнение можно повторно просчитать на уровне 99%, чтобы по значению F выяснить, не будет ли оно значимым и на более надежном уровне.

Константа - ноль — этот флажок необходимо пометить только в том случае, если вы хотите получить уравнение без свободного члена а0, чтобы линия регрессии прошла через начало координат.

Выходной диапазон - здесь требуется определить левую верхнюю ячейку выходного диапазона. Необходимо минимум семь столбцов для итогового диапазона, который будет включать в себя: результаты дисперсионного анализа, коэффициенты регрессии, стандартную погрешность вычисления Y, среднеквадратичные отклонения, число наблюдений, стандартные погрешности для коэффициентов.

Целесообразно воспользоваться этой возможностью, если задача небольшая, например, однофакторная, и вы хотите видеть на одном рабочем листе и данные, и корреляционную матрицу, и регрессию. В случае же сложной задачи, как в нашем примере, такое уплотнение материалов может создать еще большие сложности в пользовании ими. Поэтому при решении задачи 9, где требуется получить четыре результата исследования уравнений, лучше воспользоваться возможностью размещения каждого из четырех результатов на новом рабочем листе.

Новый лист — здесь требуется установить переключатель для открытия нового листа е книге под результаты анализа, начиная с ячейки А1. Можно ввести имя нового листа в поле напротив переключателя.

Новая книга - этот переключатель необходимо активизировать только в случае, если необходимо открыть новую книгу и вставить на ее первом листе результаты анализа, начиная с ячейки А1.

Остатки - установкой этого флажка заказывается включение остатков в выходной диапазон.

Советуем активизировать этот и все описанные ниже флажки диалогового окна для получения максимума информации в ходе сложного исследования. Конечно, в этом случае мы заняли позицию "перестраховщиков" и тех статистиков, которые любят видеть все, чтобы "чего-то не упустить". Выполняя серьезное маркетинговое исследование, и готовя к распечатке обстоятельный отчет по нему, вы, скорее всего, будете поступать так же. Однако, в ситуации дефицита времени, рискуя "что-то упустить" из внимания, можно все же ограничиться заказом графика остатков и (обязательно!) графика подбора.

Стандартизированные остатки — установите флажок для включения стандартизированных остатков в выходной диапазон.

График остатков — чтобы построить диаграмму остатков для каждой независимой переменной, установите этот флажок.

График подбора — это важнейший график, а точнее серия графиков, показывающих насколько хорошо теоретическая линия регрессии (т.е. предсказания) подобрана к наблюдаемым данным. Строится для каждой независимой отдельно. Активизируйте этот флажок, если желаете получить эту графическую информацию.

График нормальной вероятности - установите флажок для построения диаграммы нормальной вероятности.

Каждый график подбора остатка показывает, насколько теоретические значения Y, вычисленные как отклики отдельного фактора, совпадают с исходными (наблюденными) значениями Y. Если, например, красные точки теоретических (прогнозных) значений Y хорошо накладываются на синие точки исходных данных, это визуально свидетельствует об удачном уравнении (при условии отсутствия закономерностей в остатках, т.е. их случайном разбросе).

Когда переменных много, сначала полезно построить линейную диаграмму всех исходных данных, чтобы попытаться увидеть некоторые сильные или функциональные зависимости. Если масштабы данных весьма различны, то строят несколько диаграмм с разными шкалами. Управление шкалами Х и Y выполняется через опции X-Axis и Y-Axis. Линейная диаграмма исходных данных к задаче 9 визуализирует имеющиеся связи. Это облегчает познание связей, делая их зримыми.

Важно: когда при расчете множественной регрессии в окне Регрессия заказан График подборки, то по числу независимых переменных автоматически выводится серия точечных графиков корреляции, на которые вторым цветом нанесены точки теоретических значений отклика.

Рассмотрев все созданные исследовательские расчетно-графические материалы, делают окончательные выводы о пригодности модели (для предсказания неизвестных значений зависимой переменной) с точки зрения здравого смысла, т. е. знания о сущности моделируемых явлений, поскольку любая модель - это загрубление данных.

 




Поделиться с друзьями:


Дата добавления: 2014-12-07; Просмотров: 6278; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.