КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Инструментарий Microsoft Excel 2000 для решения множественной регрессионной задачи
В русифицированной версии EXCEL 97 для корреляционно-регрессионного анализа используются средства специального статистического модуля. Microsoft заказывала разработку этого модуля фирме, специализирующейся на программном обеспечении математико-статистических задач. Модуль включает в себя два вида средств математико-статистического анализа: функции и инструменты. Мы отдаем предпочтение сложным инструментам, обеспечивающим более высокий уровень автоматизации расчетов, комплексности, графического моделирования и организации результатов. Однако некоторые пользователи в определенных случаях вполне обоснованно могут предпочесть функции. Множественный корреляционно-регрессионный анализ в основном ориентирован на средства дополнительного пакета Анализ данных. Активизация команды Сервис Анализ данных открывает окно Инструменты анализа, предоставляющее 19 статистических инструментальных средств. Среди них - Корреляция и Регрессия, непосредственно и эффективно поддерживающие простой и множественный корреляционно-регрессионный анализ Эти сложные инструменты доступны в том случае, если они предварительно загружены через команду Сервис / Надстройки. В открывшемся окне дополнений следует пометить флажок слева от позиции пакет анализа, и затем щелкнуть по кнопке ОК. После повторного обращения к команде Сервис, позиция Анализ данных появится в конце меню. Если же команда Анализ данных и в этом случае отсутствует в меню Сервис, то необходимо запустить программу установки Microsoft Excel. После установки пакета анализа его необходимо активизировать с помощью команды Надстройки. С помощью инструмента Корреляция, можно получить корреляционную матрицу парных коэффициентов за один прием. Для этого, после выбора Сервис/Анализ данных/Корреляция, следует определить в качестве входного все поле имеющихся исходных данных, корреляционные связи которых изучают. Затем следует уточнить с помощью флажков, по столбцам или по строкам размещены переменные. Если поле содержит заголовочную строку (или столбец), то в диалоге активизируют графический флажок Метки (Labels). После выбора графической кнопки выполнения (ОК), корреляционная матрица автоматически выводится на новый лист той же электронной таблицы, начиная с клетки А1. Если матрицу желают вывести на какой-либо конкретный лист и начиная с клетки, определяемой пользователем, то делают соответствующие установки в окне «Выходной интервал» диалогового окна инструмента Корреляция. Вид корреляционной матрицы, полученной в результате определения входного поля представлен в таблице:
Можно осуществить преобразование корреляционной матрицы копированием в нее формулы для диагностики связей по модулю коэффициента корреляции. Вспомогательная диагностирующая формула. =ЕСЛИ(АВS(В3)<0,1;"Нет связи";ЕСЛИ(АВS(В3)<0,3;"Слабая"; ЕСЛИ(АВS(В3)<0,5;"Умеренная";ЕСЛИ(АВS(В3)<0,7;"Заметная"; ЕСЛИ(АВS(В3)<0,9;"Сильная";ЕСЛИ(АВS(В3)<=0,99; "Весьма сильная";"Полная")))))) Эта формула (для одной клетки) преобразует числовые значения коэффициентов корреляции, полученные в корреляционной матрице, в их текстовые смысловые эквиваленты. Преобразование осуществляется по модулю коэффициента корреляции. При ручном копировании формулы следует соблюдать следуют требования: 1. Матрица должна быть автоматически записана на новый рабочий лист по умолчанию, т е. начиная с клетки А1. 2. Матрица должна быть скопирована на тот же лист, ниже оригинала на одну-две строки, без смешения столбцов. Оригинал матрицы перемещать нельзя. Оригинал и копия существуют одновременно. 3. Открыть рабочую книгу, в известной клетке которой содержится оригинал диагностирующей формулы одним пробелом перед знаком равенства. Занести формулу в буфер для копирования. 4. Перейти в окно той книги и на тот ее лист, где создана и скопирована оригинальная корреляционная матрица. 5. Установить курсор в ту клетку матрицы-копии, куда скопировано значение клетки ВЗ из оригинала матрицы. Выполнить вставку из буфера (щелкнуть по пиктограмм вставки) 6. В режиме редактирования убрать пробел перед знаком равенства в формуле, нажать Еntеr. Выбрать клетку формулы и скопировать ее ("протянуть") по вертикали до последней строки матрицы, а затем каждую клетку - по горизонтали, не копируя на диагональные клетки с единицами. Можно копировать иначе. Числовая и текстовая матрицы содержат информацию для принятия решений of отборе факторов и планирования дальнейших вычислений (см. приведенные выше матрицы 1 и 3). Числовую корреляционную матрицу следует форматировать до 2-3. десятичных знаков, т. к. для принятия решений не требуется большего количества знаков. Работая непосредственно с Мicrosoft Excel 2000, вы можете получать информацию о параметрах этого окна из стандартной справки. Входной интервал Y — здесь требуется задать состоящий из одного столбца диапазон анализируемых зависимых данных. В нашей задаче это столбец значений Y. Такая установка одинакова для всех четырех уравнений, запланированных нами к исследованию. Входной интервал Х - здесь требуется определить диапазон подлежащих анализу / смежных рядов независимых данных (не более 16 независимых). Программа разместит независимые переменные заданного диапазона слева направо. Метки - здесь требуется установка флажка, если первая строка или первый столбец входного интервала содержит заголовки. Если заголовков нет, то флажок надо снять. Рекомендуется всегда включать метки во входной интервал, и поэтому не забывать щелкать по флажку "метки". Если мы забудем включить этот флажок при наличии меток, то вместо расчета получим прерывание и сообщение "Входной интервал содержит нечисловые данные". Уровень надежности - по умолчанию применяется уровень 95%. Установите флажок, если хотите включить в выходной диапазон дополнительный уровень, а в поле (рядом) введите уровень надежности, который будет использован дополнительно к применяемому. Мы решаем задачу на уровне, предложенном по умолчанию. Однако итоговое уравнение можно повторно просчитать на уровне 99%, чтобы по значению F выяснить, не будет ли оно значимым и на более надежном уровне. Константа - ноль — этот флажок необходимо пометить только в том случае, если вы хотите получить уравнение без свободного члена а0, чтобы линия регрессии прошла через начало координат. Выходной диапазон - здесь требуется определить левую верхнюю ячейку выходного диапазона. Необходимо минимум семь столбцов для итогового диапазона, который будет включать в себя: результаты дисперсионного анализа, коэффициенты регрессии, стандартную погрешность вычисления Y, среднеквадратичные отклонения, число наблюдений, стандартные погрешности для коэффициентов. Целесообразно воспользоваться этой возможностью, если задача небольшая, например, однофакторная, и вы хотите видеть на одном рабочем листе и данные, и корреляционную матрицу, и регрессию. В случае же сложной задачи, как в нашем примере, такое уплотнение материалов может создать еще большие сложности в пользовании ими. Поэтому при решении задачи 9, где требуется получить четыре результата исследования уравнений, лучше воспользоваться возможностью размещения каждого из четырех результатов на новом рабочем листе. Новый лист — здесь требуется установить переключатель для открытия нового листа е книге под результаты анализа, начиная с ячейки А1. Можно ввести имя нового листа в поле напротив переключателя. Новая книга - этот переключатель необходимо активизировать только в случае, если необходимо открыть новую книгу и вставить на ее первом листе результаты анализа, начиная с ячейки А1. Остатки - установкой этого флажка заказывается включение остатков в выходной диапазон. Советуем активизировать этот и все описанные ниже флажки диалогового окна для получения максимума информации в ходе сложного исследования. Конечно, в этом случае мы заняли позицию "перестраховщиков" и тех статистиков, которые любят видеть все, чтобы "чего-то не упустить". Выполняя серьезное маркетинговое исследование, и готовя к распечатке обстоятельный отчет по нему, вы, скорее всего, будете поступать так же. Однако, в ситуации дефицита времени, рискуя "что-то упустить" из внимания, можно все же ограничиться заказом графика остатков и (обязательно!) графика подбора. Стандартизированные остатки — установите флажок для включения стандартизированных остатков в выходной диапазон. График остатков — чтобы построить диаграмму остатков для каждой независимой переменной, установите этот флажок. График подбора — это важнейший график, а точнее серия графиков, показывающих насколько хорошо теоретическая линия регрессии (т.е. предсказания) подобрана к наблюдаемым данным. Строится для каждой независимой отдельно. Активизируйте этот флажок, если желаете получить эту графическую информацию. График нормальной вероятности - установите флажок для построения диаграммы нормальной вероятности. Каждый график подбора остатка показывает, насколько теоретические значения Y, вычисленные как отклики отдельного фактора, совпадают с исходными (наблюденными) значениями Y. Если, например, красные точки теоретических (прогнозных) значений Y хорошо накладываются на синие точки исходных данных, это визуально свидетельствует об удачном уравнении (при условии отсутствия закономерностей в остатках, т.е. их случайном разбросе). Когда переменных много, сначала полезно построить линейную диаграмму всех исходных данных, чтобы попытаться увидеть некоторые сильные или функциональные зависимости. Если масштабы данных весьма различны, то строят несколько диаграмм с разными шкалами. Управление шкалами Х и Y выполняется через опции X-Axis и Y-Axis. Линейная диаграмма исходных данных к задаче 9 визуализирует имеющиеся связи. Это облегчает познание связей, делая их зримыми. Важно: когда при расчете множественной регрессии в окне Регрессия заказан График подборки, то по числу независимых переменных автоматически выводится серия точечных графиков корреляции, на которые вторым цветом нанесены точки теоретических значений отклика. Рассмотрев все созданные исследовательские расчетно-графические материалы, делают окончательные выводы о пригодности модели (для предсказания неизвестных значений зависимой переменной) с точки зрения здравого смысла, т. е. знания о сущности моделируемых явлений, поскольку любая модель - это загрубление данных.
Дата добавления: 2014-12-07; Просмотров: 6278; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |