КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Преобразование формы информации
Составление таблиц ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ ОБРАБОТКА ЭМПИРИЧЕСКИХ ДАННЫХ Вопросы № 1 В ходе математико-статистической обработки данных (на специальном жаргоне) термины «признак», «показатель», «параметр» и «переменная» нередко употребляются как синонимы. Важно отличать от них понятие «значение». Каждое значение - это эмпирически выявленная, вполне определенная числовая величина того или иного показателя у конкретного испытуемого. Например, время реакции на раздражитель в третьей (первой, второй, десятой) пробе, время решения пятой задачи в третьей серии, выбранный испытуемым вариант ответа из семи предложенных и т. п. В большинстве случаев обработку целесообразно начать с составления таблиц (сводных таблиц) полученных данных. В таблицу можно свести не только числовые данные. К данным качественного характера также могут быть применены простейшие способы количественной обработки. Для всей выборки и отдельных подвыборок могут быть подсчитаны частоты встречаемости (количество случаев появления события), а затем и частости (относительные частоты, то есть частоты, деленные на количество испытаний) интересующих вас индикаторов, проявлений некоторого вида.
Так, например, при использовании рисуночного теста «Дерево» можно в качестве параметра рассматривать наличие/отсутствие листьев на ветках в рисунке. Если этот параметр будет определен у всех испытуемых, это позволит подсчитать частость его появления по всей выборке и для отдельных групп внутри ее. В таблицу могут быть сведены данные и по другим параметрам теста «Дерево», а затем подсчитаны частости. Далее можно составить таблицу, в которой будут представлены данные не по отдельным испытуемым, а для всей вашей выборки и отдельных групп. Это позволит сделать шаг к более целостному представлению информации.
Основной для сводной таблицы исходных данных является следующая форма. Каждая строка содержит значения всех показателей одного испытуемого. В каждом столбце (поле) записаны значения одного показателя по всем испытуемых. Таким образом, в каждой ячейке (клетке) таблицы записано только одно значение одного показателя одного испытуемого. В самой верхней строке дана нумерация всех столбцов. Во второй строке названы измеренные вами показатели, шкальные оценки и т. п. Вторая строка облегчает вам ориентировку в таблице. Оператору, который будет вводить ваши данные через клавиатуру компьютера, эта строка не нужна. В каждой последующей строке записана фамилия испытуемого и значения всех, измеренных у него параметров; разумеется, для всех испытуемых в одном и том же порядке показателей. Все строки и все столбцы должны быть пронумерованы. Последовательность признаков может быть упорядочена по разным основаниям. В первых столбцах лучше разместить демографические или социально-демографические показатели: пол, возраст, уровень образования (если важен) и т. д. Затем по убывающей значимости (предполагаемой информативности) приведены измеренные в эксперименте параметры. Параметры, полученные с помощью одной методики, удобнее располагать компактно - в одной группе (рядом друг с другом), например, все шкалы одной методики, шкалы следующей и т. д.
Испытуемых можно перечислить в алфавитном порядке, но лучше использовать этот принцип на самом нижнем уровне деления. Сначала лучше разделить испытуемых по их принадлежности к каким-либо подгруппам, которые будут сравниваться между собой. Внутри этих подгрупп полезно упорядочить испытуемых по полу, возрасту или другому, важному для вас, параметру (см. табл. 8).
Таблица 8
Таблицам необходимо давать заголовки, достаточно полно отражающие их содержание и специфику. При большом количестве таблиц без заголовков по ходу ознакомления с текстом трудно понять их назначение.
И для ручной, и для компьютерной обработки в исходную сводную таблицу чаще всего заносят начальные данные. Сейчас преимущественной формой математико-статистической обработки стала компьютерная. Если форма распределения эмпирических данных незначительно отличается от нормального распределения, то предварительное центрирование, нормирование или перевод в шкальные (стандартизированные) оценки по имеющимся в данной методике таблицам не требуется. В начальный период обработки данных можно предположить, что собранный вами материал подходит для обработки средствами параметрической статистики. Получив на первом шаге компьютерных вычислений первичные статистики признаков, можно сделать дальнейшие, более точные, предположения о форме распределения каждого признака.
В ходе обработки данных весьма вероятно, что потребуются несколько пользовательских программ. Современные программы предоставляют довольно широкие возможности перевода данных из одной в другую. Однако не будет лишним соблюсти некоторые правила, чтобы облегчить преобразование формата данных.
Старайтесь без особой необходимости не заносить в таблицу различные текстовые символы (точки, запятые, тире и т. п.). Всю информацию, которую можно закодировать числами, лучше перевести в числовую форму. Это даст больше возможностей для разных видов обработки данных. Исключением является строка, в которой записаны названия (чаще краткие названия - аббревиатуры) измеренных показателей.
До начала набора данных в электронную таблицу узнайте, в каком виде должны записываться десятичные дроби - какой знак (точка или запятая) должен разделять целую дробную части.
Не объединяйте без необходимости ячейки рабочей таблицы. Эстетическому чувству полезно дать проявиться при оформлении таблицы в тексте рукописи, когда все подсчитано, но не ранее. Особо внимательно отнеситесь к первым ячейкам - в левом верхнем углу таблицы. Лучше заполнить их произвольными числами, чем оставлять пустыми. Без этого при экспорте в другой формат может быть не считана вся первая строка или может измениться структура всей таблицы.
В таблицу целесообразно внести все интересующие вас признаки в форме десятичного числа, то есть предварительно пересчитать минуты в десятичные доли часа, секунды - в десятичные доли минуты, количество месяцев - в десятичную долю года и т. д. Это необходимо, поскольку формат данных для большинства используемых сейчас компьютерных программ накладывает свои ограничения.
В виде чисел в таблицу можно вписать информацию и о тех параметрах выборки, которые предположительно могут оказаться значимыми факторами, но имеются у вас в качественных показателях. Наиболее простыми операциями могут быть: числовое кодирование (мужчины - 1, женщины - 2; прошедшие обучение - 1, не прошедшие - 2 и т. п.) и перевод качественных показателей в ранги. Число 0 для кодирования лучше не использовать, поскольку некоторые статистические компьютерные программы не смогут обработать такие данные. Это не значит, что в таблицу вообще не могут быть записаны нулевые значения. Имеются в виду те случаи, когда в сформированной рабочей подвыборке какой-либо признак имеет только нулевые значения.
Уровень образования, ранжируя, можно следующим образом перевести в числа (см. табл. 9). Таблица9
Дата добавления: 2014-01-06; Просмотров: 455; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |