КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Основные сведения. Пакет анализа - это надстройка, предназначенная для статистического анализа данных
Пакет анализа - это надстройка, предназначенная для статистического анализа данных. В пакет анализа входят следующие программы: · Однофакторный дисперсионный анализ. · Двухфакторный дисперсионный анализ с повторением. · Двухфакторный дисперсионный анализ без повторений. · Корреляция. · Ковариация. · Описательная статистика. · Экспоненциальное сглаживание. · Двухвыборочный F- тест для дисперсии. · Анализ Фурье. · Гистограмма. · Скользящее среднее. · Генерация случайных чисел. · Ранг и персентиль. · Регрессия. · Выборка. · Парный двухвыборочный t-тест для средних. · Двухвыборочный t-тест с одинаковыми дисперсиями. · Двухвыборочный t-тест с разными дисперсиями. · Двухвыборочный z-тест для средних. Установка пакета анализа необходимо выполнить команду Сервис\Надстройки. Если пакет анализа установлен, в меню Сервис появляется команда Анализ данных. Для загрузки необходимой для расчета программы следует выполнить команду Сервис/Анализ данных и далее выбрать программу из списка. Описательная статистика. Рассмотрим пример применения пакета анализа для сравнения двух групп - экспериментальной и контрольной. Из числа членов генеральной совокупности в случайном порядке сформированы две группы учащихся. В ходе эксперимента получены следующие баллы по учебному предмету: Результаты эксперимента (введены в электронную таблицу )
Рисунок 8 Для получения статистических характеристик экспериментальной и контрольной групп можно использовать статистические функции, входящие в список функций Excel, или программу Описательная статистика, включенную в Пакет анализа. На рисунке 9 приведено диалоговое окно программы Описательная статистика, в которое введены параметры для рассматриваемого примера. Входной и выходной интервалы можно указать с помощью мыши.
Рисунок 9
Результаты работы программы после обработки данных программой Описательная статистика приведены на рисунке 10.
Рисунок 10 Проверка статистических гипотез. Метод статистических гипотез широко применяется в научной деятельности для оценки результатов эксперимента. Как правило, при проведении научного исследования приходится выполнять сравнительные оценки генеральных параметров по различиям, наблюдаемым между выборками. О преимуществе той или иной из сравниваемых групп обычно судят по разности между средними долями и другими выборочными показателями. При проведении статистической обработки результатов эксперимента выдвигается нулевая гипотеза (Н0), которая сводится к тому, что разница между генеральными параметрами сравниваемых групп равна нулю и что различия, наблюдаемые между выборочными характеристиками, носят случайный характер. В другой, альтернативной гипотезе делается предположение о преимуществе нового метода. Альтернативные гипотезы принимаются только тогда, когда опровергается нулевая гипотеза. Это возможно в тех случаях, когда различия в средних выборочных настолько значимы (статистически достоверны), что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимости статистического вывода: · первый уровень - 5% (допускается риск ошибки вывода в пяти случаях их ста таких же экспериментов при строго случайном отборе в выборочную совокупность); · второй уровень 1% (допускается риск ошибиться только в одном случае из ста; · третий уровень 0,1% (допускается риск ошибиться только в одном случае из тысячи). Существует два вида статистических критериев - параметрические и непараметрические. Параметрические критерии служат для проверки гипотез о параметрах совокупностей, распределяемых по нормальному закону. Рассмотрим пример применения одного из параметрических критериев - t-критерия Стьюдента для сравнительной оценки средних величин, рассчитанных для контрольной и экспериментальной групп в рассматриваемом примере. Для выполнения расчета вызовем программ у Двухвыборочн ый t-тест с разными дисперсиями, входящую в Пакет анализа и введем данные в диалоговое окно. Для ввода исходного диапазона блок данных можно выделить непосредственно в таблице. Уровень значимости задается в поле Альфа вводом значения с клавиатуры, в поле Выходной интервал указывается адрес верхней левой ячейки области размещения выходных таблиц. Выходные таблицы могут быть размещены на том же рабочем листе, на другом листе или в другом файле.
Рисунок 11 Сравнение полученной t-статистики (4,029) с t табличным (2,100) свидетельствует о том, что есть основание принять альтернативную гипотезу о том, что учащиеся экспериментальной группы показывают более высокий уровень знаний. В случаях, когда необходимо оценить эффективность проведенной экспериментальной работы в одной группе, используется парный двухвыборочный t-тест для средних. Однофакторный дисперсионный анализ. Однофакторный дисперсионный анализ применяют в тех случаях, когда может быть указан один фактор, влияющий на конечный результат, и этот фактор может принимать конечное число значений (уровней). Типичный пример задачи однофакторного анализа - сравнение по достигаемым результатам нескольких различных способов действия, направленных на достижение одной цели, например, нескольких школьных учебников, различных доз удобрений, нескольких лекарств. Рассмотрим применение метода на следующем примере: Для выяснения влияния денежного стимулирования на производительность труда шести однородным группам из 5 человек были предложены задачи одинаковой трудности. Задачи предлагались испытуемому независимо от всех остальных. Группы различаются между собой величиной денежного вознаграждения за решаемую задачу. Группы упорядочены по возрастанию влияния фактора. Исходные данные группируются в виде таблицы, в которой градации регулируемого фактора располагаются по горизонтали в верхней части таблицы, а числовые значения признака размещаются по градациям фактора. A B C D E
Рисунок 12 Если регулируемый фактор (размер вознаграждения) оказывает существенное влияние на результативный признак (количество решенных задач), то это скажется на величине групповых средних, которые будут заметно отличаться друг от друга. Нулевая гипотеза сводится к предположению, что генеральные межгрупповые средние и дисперсии равны между собой, а различия, наблюдаемые между выборочными показателями, вызваны случайными причинами, а не влиянием на признак регулируемого фактора. Нулевую гипотезу отвергают, если дисперсионное отношение Fф Fст (критерий Фишера) для принятого уровня значимости - a. Для проведения однофакторного анализа введем исходные данные в таблицу в форме представленной на рисунке 13.
Выполним команду Сервис/Анализ данных, в открывшемся списке выберем Однофакторный дисперсионный анализ и зададим параметры в диалоговом окне. Для ввода исходного диапазона блок данных можно выделить непосредственно в таблице. Уровень значимости задается в поле Альфа вводом значения с клавиатуры, в поле Выходной интервал указывается адрес верхней левой ячейки области размещения выходных таблиц. Выходные таблицы могут быть размещены на том же рабочем листе, на другом листе или в другом файле.
Рисунок 14 На рисунке 14 показан результат работы программы. В таблице ANOVA SS -сумма квадратов, df -число степеней свободы, MS - средние квадраты, F - дисперсионное отношение (отношение MS между группами к MS внутри групп). Значение F используется для проверки нулевой гипотезы. F критическое - табличная величина, критические значения F определены для нескольких уровней значимости (0,1; 0,05; 0,01). Из таблицы видно, что фактическое значение F, больше критического значения, поэтому гипотеза об отсутствии влияния фактора на исследуемый признак (нулевая гипотеза) должна быть отвергнута. Этот результат позволяет сделать заключение о том, что варьирование признака по группам достаточно велико, чтобы быть предметом статистического анализа. Регрессионный анализ Регрессионный анализ позволяет найти уравнение, которое наилучшим образом описывает множество данных или позволяет выяснить, что подходящего уравнения нет. По экспериментальным измерениям влияния одной величины на другую с помощью регрессионного анализа можно установить аналитический закон связи между этими величинами. В экономике регрессионный анализ позволяет спрогнозировать динамику продаж в зависимости от уровня цен на товары по предыстории влияния цен на оборот. Линейный регрессионный анализ заключается в подборе линейной функции, описывающей входные данные, с помощью метода наименьших квадратов. То есть необходимо найти уравнение вида Y=kx+b, Где y – функция, описывающая входные данные и зависящая от переменной х, k и b – параметры уравнения, которые нужно определить. Исходные данные для регрессионного анализа находятся в таблице. Таблица отображает экспериментальные измерения температуры и давления. Необходимо определить, насколько влияет температура на давление, и построить уравнение для этих двух величин. Для этого необходимо: · выбрать в меню команду Сервис/Анализ данных; · Щелкнуть по строке Регрессия. В диалоговом окне Регрессия · щелкнуть мышью в поле ввода Входной интервала Y в группе элементов управления Входные данные и выделить диапазон ячеек С1:С6; · Щелкнуть мышью на поле ввода Входной интервал Х и выделить диапазон ячеек В1:В6; · Установить флажок Метки в группе элементов Входные данные, так как указанные диапазоны содержат названия. · Установить параметр Новый рабочий лист и нажать ОК.
Дата добавления: 2014-11-28; Просмотров: 790; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |