Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Свойства. Можно ранжировать по признакам, которые нельзя выразить численно: субъективные оценки, предпочтения и т.д




Недостатки

Преимущество

Можно ранжировать по признакам, которые нельзя выразить численно: субъективные оценки, предпочтения и т.д. При экспертных оценках можно ранжировать оценки разных экспертов и найти их корреляции друг с другом, чтобы затем исключить из рассмотрения оценки эксперта, слабо коррелирующие с оценками других. Коэффициент корреляции рангов применяется для оценки устойчивости тенденции динамики.

Недостатком коэффициента корреляции рангов является то, что одинаковым разностям рангов могут соответствовать совершенно отличные разности значений (в случае количественных признаков). Недоучет размеров отклонений признаков от их средних величин занижает меру тесноты связи. Поэтому для количественных признаков корреляция рангов обладает меньшей информативностью, чем коэффициент корреляции числовых значений этих признаков.

· инвариантен (не изменен) по отношению к любому монотонному преобразованию шкалы измерения;

· относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале;

· при расчете не требуется никаких предположений о характере распределений признаков в генеральной совокупности.

Коэффициент корреляции рангов Спирмэна (р) основан на рассмотрении разности рангов значений результативного и факторного признаков и может быть рассчитан по формуле

где d = Nx - Ny, т.е. разность рангов каждой пары значений х и у; n - число наблюдений.

 

17.Статистическая проверка гипотез (цель, сущность), критерии их проверки.

Смысл проверки статистической гипотезы состоит в том, чтобы по имеющимся статистическим данным принять или отклонить статистическую гипотезу с минимальным рисков ошибки. Эта проверка осуществляется по определенным правилам.

Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К), являющегося функцией от результатов наблюдения.

Статистический критерий – это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н 0.

Как уже отмечалось выше, следует иметь в виду, что статистическая проверка гипотез имеет вероятностный характер, так как принимаемые вывод основываются на изучении свойств распределения случайной переменной по данным выборки, а потому всегда существует риск допустить ошибку. Однако с помощью статистической проверки гипотез можно определить вероятность принятия ложного решения. Если вероятность последнего невелика, то можно считать, что применяемый критерий обеспечивает малый риск ошибки.

При проведении проверки статистических гипотез в первую очередь приходится решать задачи статистической проверки гипотез о:

1) принадлежности «выделяющихся» единиц исследуемой выборочной совокупности генеральной совокупности;

2) виде распределения изучаемых признаков;

3) величине средней арифметической и доли;

4) наличии и тесноте связи между изучаемыми признаками;

5) о форме корреляционной связи.

 

 

18. Понятие об уровне значимости в статистических расчетах.

Значимости уровень статистического критерия, вероятность ошибочно отвергнуть основную проверяемую гипотезу, когда она верна. В теории статистической проверки гипотез Значимости уровень называется вероятностью ошибки первого рода. Понятие «Значимости уровень» возникло в связи с задачей проверки согласованности теории с опытными данными. Если, например, в результате наблюдений регистрируются значения n случайных величин X1,..., Xn и если требуется по этим данным проверить гипотезу Н, согласно которой совместное распределение величин X1,..., Xn обладает некоторым определённым свойством, то соответствующий статистический критерий конструируется с помощью подходящим образом подобранной функции Y = f (X1,..., Xn); эта функция обычно принимает малые значения, когда гипотеза Н верна, и большие значения, когда Н ложна. В частности, если X1,..., Xn результаты независимых измерений некоторой известной постоянной а и гипотеза Н представляет собой предположение об отсутствии в результатах измерений систематических ошибок, то для проверки Н разумно в качестве Y выбрать (2m — n) 2, где m — количество тех результатов измерений X1, которые превышают истинное значение а. Наблюдаемое в опыте большое значение Y можно рассматривать как значимое статистическое опровержение гипотетического согласия между результатами наблюдений и проверяемой гипотезой. Соответствующий критерий значимости представляет собой правило, согласно которому значимыми считаются значения Y, превосходящие заданное критическое значение у. В свою очередь выбор величины у определяется заданным Значимости уровень, который в случае справедливости гипотезы Н совпадает с вероятностью события { Y > y }.

Уровень значимости - это вероятность того, что мы сочли различия существенными, а они на самом деле случайны.

Если перевести все это на более формализованный язык, то уровень значимости - это вероятность отклонения нулевой гипотезы, в то время как она верна.

В статистике величину называют статистимчески знамчимой, если мала вероятность чисто случайного возникновения её или ещё более крайних величин. Здесь под крайностью понимается степень отклонения от нуль-гипотезы. Разница называется «статистически значимой», если имеются данные, появление которых было бы маловероятно, если предположить, что эта разница отсутствует; это выражение не означает, что данная разница должна быть велика, важна, или значима в общем смысле этого слова.

Уровень значимости обыкновенно обозначают греческой буквой б (альфа). Популярными уровнями значимости являются 5%, 1%, и 0.1%. Если тест выдаёт p-величину меньше б-уровня, то нуль-гипотеза отклоняется. Такие результаты неформально называют «статистически значимыми». Например, если кто-то говорит что «шансы того, что случившееся является совпадением, равны одному из тысячи», то имеется в виду 0.1 % уровень значимости.

 

19. Сравнение двух средних малых независимых выборок (цель, сущность).

t-критерий является наиболее часто используемым методом, позволяющим выявить различие между средними двух выборок. Еще раз напомним, переменные должны быть измерены в достаточно богатой шкале, например, количественной.

Конечно, применение t-критерия имеет некоторые ограничения, впрочем, очень слабые.

Теоретически t-критерий может применяться, даже если размер выборки очень небольшой (например, 10; некоторые исследователи утверждают, что можно исследовать и меньшие выборки) и если переменные нормально распределены (внутри групп), а дисперсии наблюдений в группах не слишком различны. Известно, что t-критерий устойчив к отклонениям от нормальности.

Предположение о нормальности можно проверить, исследуя распределение (например, визуально с помощью гистограмм) или применяя критерий нормальности. Следует заметить, что эффективно проверить гипотезу о нормальности можно для достаточно большого объема данных (см. замечание Фишера о проверке нормальности, цитированное нами в главе Элементарные понятия анализа данных).

Пусть M 1, M 2 — средние арифметические, σ12 — стандартные отклонения, а N 1, N 2 — размеры выборок.

В случае с незначительно отличающимся размером выборки применяется упрощённая формула приближенных расчётов:

В случае, если размер выборки отличается значительно, применяется более сложная и точная формула:

Количество степеней свободы рассчитывается как

 

 

20. Сравнение двух средних малых попарно зависимых выборок (цель, сущность).

 

 

Для вычисления эмпирического значения t-критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:

где Md — средняя разность значений, σ d — стандартное отклонение разностей, а N — количество наблюдений

Количество степеней свободы рассчитывается как

 

 

21. Доверительный интервал для оценки генерального среднего нормального распределения. Критерий Стьюдента.

 

t-критерий Стьюдента — общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий. Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

Если исходная генеральная совокупность нормальная, то выборочное распределение выборочных средних также будет нормальным. Если генеральная совокупность имеет среднюю величину m и стандартное отклонение s, то выборочное распределение средних будет иметь среднюю величину, Е (`x) = m и стандартную ошибку . Из центральной предельной теоремы известно, что данные утверждения справедливы для ненормальной генеральной совокупности, если объем выборки n не меньше 30.

Если мы отобрали n единиц из генеральной совокупности N и нашли среднюю величину по выборке`x, то `x может быть использовано для оценки генеральной средней m.

 

 

22. Основные понятия в теории тестов. Требования к тестам.

Измерение или испытание, проводимое для определения состояния или способностей спортсмена, называется тестом. Как было показано, таких измерений может быть проведено очень много, но в качестве тестов могут быть использованы лишь те,которые удовлетворяют следующим метрологическим требованиям:

1) должна быть определена цель применения любого теста;

2) следует разработать стандартизированную методику изме

рений результатов в тестах и процедуру тестирования;

3) необходимо определить их надежность и информативность;

4) должна быть разработана система оценок результатов

в тестах;

5) необходимо указать вид контроля (оперативный, текущий

или этапный).

Процедура выполнения теста называется т е с т и р о в а н и е м;р е з у л ь т а т о м те с т и р о в а н и я является численное значение, полученное в ходе измерений. В зависимости от цели все тесты подразделяются на несколько групп.

В первую из них входят показатели, измеряемые в покое. К таким тестам относят показатели, физического развития (длина и масса тела, толщина жировых складок, объем мышечной и жировой ткани и т. д.), показатели__~ク、_OV__, характеризующие функционирование основных систем организма (частоту сердечных сокращений, состав крови, мочи и т. п.). В эту же группу входят психические тесты. Информация, получаемая с помощью этих тестов, является основной — во-первых, для оценки физического состояния спортсменов, во-вторых, для сравнения значений, полученных при выполнении нагрузки.

 

25. Классификация двигательных тестов.

В зависимости от цели все тесты подразделяются на несколько групп.

В первую из них входят показатели, измеряемые в покое. К таким тестам относят показатели, физического развития (длина и масса тела, толщина жировых складок, объем мышечной и жировой ткани и т. д.), показатели__~ク、_OV__, характеризующие функционирование основных систем организма (частоту сердечных сокращений, состав крови, мочи и т. п.). В эту же группу входят психические тесты. Информация, получаемая с помощью этих тестов, является основной — во-первых, для оценки физического состояния спортсменов, во-вторых, для сравнения значений, полученных при выполнении нагрузки.

Вторая группа — это стандартные тесты, когда всем спортсменам предлагается выполнить одинаковое задание (например, бежать на тредбане со скоростью 5 м/с в течение 5 мин или в течение одной минуты подтянуться на перекладине 10 раз и т. д.). Специфическая особенность этих тестов заключается в выполнении непредельной нагрузки, и следовательно, отсутствует мотивация на достижение максимально возможного результата. Результат такого теста зависит от способа задания нагрузки: если задается механическая величина нагрузки, то измеряются медико-биологические показатели. Если же нагрузка теста задается по величине сдвигов медико-биологических показателей, то измеряется физические величины нагрузки (время, расстояние и т. п.).

Третья группа — это тесты, при выполнении которых нужно показать максимально возможный двигательный результат, а измеряются значения различных функциональных систем (ЧСС,МПК и т. д.). Особенность таких тестов — высокий психологический настрой (мотивация) спортсмена на достижение предельных результатов. Следовательно, все, что регистрируется при их выполнении, зависит как минимум от двух факторов: 1) уровня развития измеряемого качества (например, выносливости или техники и т. д.) и 2) мотивации. Может оказаться так, что спортсмен, обладающий высоким уровнем выносливости, не продемонстрирует его в тесте: он прекратит работу в тесте «до отказа» задолго до исчерпания резервных возможностей, не проявив своих волевых качеств.

 

24 Надежность, согласованность и эквивалентность тестов.

 

Надежностью теста называется степень совпадения результатов при повторном тестировании одних и тех же людей в одинаковых условиях. Как уже отмечалось, полное совпадение результатов при повторных измерениях практически невозможно, и поэтому основное уравнение измерений выглядит так:

 

где xt — зарегистрированный в процессе измерений результат теста; x ист — так называемый истинный результат. Условно он соответствует среднему значению измеряемой величины при бесконечно большом числе измерений одного показателя в одних и тех же условиях. Величина e1 —это систематические и случайные ошибки измерений, причины появления которых рассмотрены в разделе. Величина е2 отражает различия в процедуре тестирования при повторных измерениях. И наконец, величина е 3 характеризует внутреннюю нестабильность функциональных систем организма.

Коэффициент надежности (rt t)—это отношение ис тинной дисперсии к дисперсии, зарегистрированной в процессе измерений:

 

 

Согласованность тестов характеризуется независимостью результатов тестирования от личных качеств лица, проводящего или оценивающего тест. Если результаты спортсменов в тесте, который проводят разные специалисты (эксперты, судьи, оценщики), совпадают, то это свидетельствует о высокой степени согласованности теста. Это свойство теста зависит от совпадения методик тестирования у разных специалистов.

Когда создается новый тест, нужно обязательно проверить его на согласованность. Делается это так: разрабатывается унифицированная методика проведения теста, а потом два или более специалиста по очереди в стандартных условиях тестируют одних и тех же спортсменов.

Эквивалентность тестов определяется следующим образом: спортсмены выполняют одну разновидность теста и затем, после небольшого отдыха, вторую и т. д.

Если результаты оценок совпадают (например, лучшие в подтягивании оказываются лучшими и в отжимании), то это свидетельствует об эквивалентности тестов. Коэффициент эквивалентности определяется с помощью корреляционного или дисперсионного анализа.

Применение эквивалентных тестов повышает надежность оценки контролируемых свойств моторики спортсменов. Поэтому если нужно провести углубленное обследование, то лучше применить несколько эквивалентных тестов. Такой комплекс называется гомогенным. Во всех остальных случаях лучше использовать гетерогенные комплексы: они состоят из неэквивалентных тестов.

 

25. Информативность тестов. Эмпирическая и логическая информативность.

Информативным * называется тест, по результатам которого можно судить о свойстве (качестве, способности и т. п.), измеряемом в ходе контроля. Если говорить об оценке подготовленности спортсменов, то наиболее информативным показателем является результат в соревновательном упражнении. Однако он зависит от большого количества факторов, и один и тот же результат в соревновательном упражнении могут показывать люди, заметно отличающиеся друг от друга по структуре подготовленности.

Для выявления ведущих факторов, от которых зависит результат в соревновательном упражнении, и используются информативные тесты.




Поделиться с друзьями:


Дата добавления: 2015-04-30; Просмотров: 680; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.