Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Проверка данных

Ранжирование должностного статуса

Ранжирование уровней образования

 

Ранг Уровень образования
  Менее 5 классов школы
  5-8 классов или училище с дипломом о неполном среднем образовании
  9-11 классов или училище с дипломом о полном среднем образовании
  Техникум или колледж, или 1-2 курса вуза
  3-6 курсов вуза без диплома о высшем образовании
  Вуз с дипломом
  Аспирантура, ординатура или другие формы постдипломного образо­вания со сроком обучения 2 года и более

 

Разумеется, включая в обработку полученные таким образом числовые величины, мы не всегда обнаруживаем ясно выраженную зависимость этих параметров от остальных. Тем не менее мы получаем возможность хотя бы приблизительной оценки взаимосвязей. Эту оценку можно сделать и други­ми способами. Например, при компьютерной обработке и использовании системы управления базой данных можно формировать подвыборки по раз­ным основаниям деления, в том числе и по уровню образования или долж­ностному статусу, и проверять различия между отдельными категориями выборки.

Таблица 10

Ранг Должностной статус, категория
  Подсобные рабочие, технические исполнители
  Квалифицированные рабочие, вспомогательный персонал среднего уровня квалификации
  Инженерно-технические работники, специалисты со средним специ­альным и высшим образованием
  Работники нижнего руководящего звена (бригадиры, начальники участ­ков и т. п.), руководители подразделений, имеющие в подчинении ис­полнителей, специалисты высокой квалификации, преподаватели, име­ющие ученую степень
  Работники среднего руководящего звена (начальники цехов, отделов и т. д.), руководители основных структурных подразделений, имеющих в своем составе подразделения нижнего уровня, заместители руководи­телей предприятий, ведущие специалисты
  Работники верхнего руководящего звена (руководители предприятий, учреждений и организаций, их первые заместители, главные специа­листы)

Описанное числовое кодирование полезно для предварительного (раз­ведочного) анализа - немного шансов выявить отчетливые закономернос­ти, но проделать эту работу полезно. Включение, например, в корреляцион­ный анализ таких числовых величин может обнаружить существование или отсутствие взаимосвязей с другими параметрами, позволит не тратить вре­мя на более сложные процедуры.

 

После создания таблицы на бумаге или компьютере необходимо прове­рить качество полученных данных. Для этого часто достаточно вниматель­но осмотреть массив данных. Начать проверку следует с выявления оши­бок (описок), которые заключаются в том, что неправильно написан поря­док числа. Например, 100 написано вместо 10, 9,4 - вместо 94 и т. п. При внимательном просмотре по столбцам это легко обнаружить, поскольку сравнительно редко встречаются параметры, которые сильно варьируют. Чаще всего значения одного параметра имеют один порядок или ближай­шие порядки. При наборе данных на компьютере важно соблюдать требо­вания к формату данных в используемой статистической программе. Преж­де всего это относится к знаку, который должен отделять в десятичном чис­ле целую часть от дробной (точка или запятая).

 

Затем массив данных надо проверить на наличие «выскакивающих», вариант - выделяющихся значений, которые могли быть получены в резуль­тате неточных измерений, ошибок в записях, отвлечения внимания испыту­емого и т. д. Если обнаружены «подозрительные» значения, то принять обо­снованное решение об их выбраковке, используя достаточно мощный пара­метрический критерий t. Он рассчитывается по следующей формуле:

V – M

t = 0 > t st

 

где t - критерий выпада; V — выпадающее значение признака; М- средняя величина признака для всей группы, включающей артефакт; tst - стандарт­ные значения критерия выпадов, определяемые для трех уровней довери­тельной вероятности по таблице приложения 1. Смысл критерия в том, что­бы определить, находится ли данная варианта в интервале, характерном для большинства членов выборки, или же вне его.

 

Допустим, нами принят уровень значимости 0,05 (доверительная веро­ятность 0,95), а значение критерия составило 1.5. Поскольку 95 % вариант лежат в пределах М ± 1,96 о (1,5 меньше 1,96), то, следовательно, и данная варианта лежит в указанном интервале. Если же значение критерия боль­ше, например, 2,4, то это означает, что данное значение не относится к ана­лизируемой совокупности (выборке), включающей 95 % вариант, а есть про­явление иных закономерностей, ошибок и пр. и поэтому должно быть ис­ключено из рассмотрения.

 

Например, в эксперименте вы предлагаете решать мыслительные зада­чи и регистрируете в числе других параметров время решения. При про­смотре данных обнаруживаете, что у одного из испытуемых время решения заметно больше, чем у остальных. Это бывает связано с тем, что вместо решения очередной задачи испытуемый начинает «искать закономерность более широкого плана», «выводить общий принцип» или нечто подобное. Об этом он может сообщить, но может и не сообщить экспериментатору. Понятно, что время решения конкретной задачи при этом может сильно отличаться от средней величины. Если у вас есть предположение, что ре­зультаты какого-либо опыта, пробы обусловлены влиянием, которое вы не можете оценить или его оценка не входит в ваши планы, то вы окажетесь перед необходимостью принять обоснованное решение - включать полу­ченное численное значение в дальнейшую обработку или нет.

 

Предположим, в эксперименте были получены следующие значения не­которого параметра: 10,20, 20, 30, 30, 40,40, 50, 210. Следовательно, п = 9. Вычислили: М = 50, а = 61. Можно ли считать значение 210 выпадающим?

t = 210 – 50 = 2,6; (по табл.) = 2,4 (для Р = 0,95;. 61

Следовательно, значение 210 может считаться выпадающим и должно быть исключено из дальнейшей обработки.

После исключения выпадающих значений первичные статистические параметры вычисляются заново.

Вопрос № 2

<== предыдущая лекция | следующая лекция ==>
Преобразование формы информации | Анализ первичных статистик
Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 240; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.014 сек.