Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Преобразование формы информации

Составление таблиц

ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ

ОБРАБОТКА ЭМПИРИЧЕСКИХ ДАННЫХ

Вопросы № 1

В ходе математико-статистической обработки данных (на специальном жаргоне) термины «признак», «показатель», «параметр» и «переменная» не­редко употребляются как синонимы. Важно отличать от них понятие «зна­чение». Каждое значение - это эмпирически выявленная, вполне опреде­ленная числовая величина того или иного показателя у конкретного испы­туемого. Например, время реакции на раздражитель в третьей (первой, вто­рой, десятой) пробе, время решения пятой задачи в третьей серии, вы­бранный испытуемым вариант ответа из семи предложенных и т. п.

В большинстве случаев обработку целесообразно начать с составления таблиц (сводных таблиц) полученных данных. В таблицу можно свести не только числовые данные. К данным качественного характера также могут быть применены простейшие способы количественной обработки. Для всей выборки и отдельных подвыборок могут быть подсчитаны частоты встре­чаемости (количество случаев появления события), а затем и частости (от­носительные частоты, то есть частоты, деленные на количество испыта­ний) интересующих вас индикаторов, проявлений некоторого вида.

 

Так, например, при использовании рисуночного теста «Дерево» можно в качестве параметра рассматривать наличие/отсутствие листьев на ветках в рисунке. Если этот параметр будет определен у всех испытуемых, это по­зволит подсчитать частость его появления по всей выборке и для отдель­ных групп внутри ее. В таблицу могут быть сведены данные и по другим параметрам теста «Дерево», а затем подсчитаны частости. Далее можно со­ставить таблицу, в которой будут представлены данные не по отдельным испытуемым, а для всей вашей выборки и отдельных групп. Это позволит сделать шаг к более целостному представлению информации.

 

Основной для сводной таблицы исходных данных является следующая форма. Каждая строка содержит значения всех показателей одного испыту­емого. В каждом столбце (поле) записаны значения одного показателя по всем испытуемых. Таким образом, в каждой ячейке (клетке) таблицы запи­сано только одно значение одного показателя одного испытуемого.

В самой верхней строке дана нумерация всех столбцов. Во второй стро­ке названы измеренные вами показатели, шкальные оценки и т. п. Вторая строка облегчает вам ориентировку в таблице. Оператору, который будет вводить ваши данные через клавиатуру компьютера, эта строка не нужна. В каждой последующей строке записана фамилия испытуемого и значения всех, измеренных у него параметров; разумеется, для всех испытуемых в одном и том же порядке показателей. Все строки и все столбцы должны быть пронумерованы. Последовательность признаков может быть упоря­дочена по разным основаниям. В первых столбцах лучше разместить де­мографические или социально-демографические показатели: пол, возраст, уровень образования (если важен) и т. д. Затем по убывающей значимости (предполагаемой информативности) приведены измеренные в эксперимен­те параметры. Параметры, полученные с помощью одной методики, удоб­нее располагать компактно - в одной группе (рядом друг с другом), напри­мер, все шкалы одной методики, шкалы следующей и т. д.

 

Испытуемых можно перечислить в алфавитном порядке, но лучше ис­пользовать этот принцип на самом нижнем уровне деления. Сначала лучше разделить испытуемых по их принадлежности к каким-либо подгруппам, которые будут сравниваться между собой. Внутри этих подгрупп полезно упорядочить испытуемых по полу, возрасту или другому, важному для вас, параметру (см. табл. 8).

 

Таблица 8

 

  Форма сводной таблицы данных      
          б       -
№ п/п Фамилия, имя, отчество Пол Ио Ид Ин А В С Е -
  Глухарь П. И.                 -
  Орел С. С.                  
  Петух И. И.                 -
- - - - - - - - - - -
- - - - - - - - - - -
- - - - - - - - - - -
  Кура Н. Н.                 -
  Сова Т. О.                 -
  Утка Л. А.                 -

 

Таблицам необходимо давать заголовки, достаточно полно отража­ющие их содержание и специфику. При большом количестве таблиц без заголовков по ходу ознакомления с текстом трудно понять их назна­чение.

 

И для ручной, и для компьютерной обработки в исходную сводную таб­лицу чаще всего заносят начальные данные. Сейчас преимущественной фор­мой математико-статистической обработки стала компьютерная. Если фор­ма распределения эмпирических данных незначительно отличается от нор­мального распределения, то предварительное центрирование, нормирова­ние или перевод в шкальные (стандартизированные) оценки по имеющим­ся в данной методике таблицам не требуется. В начальный период обработ­ки данных можно предположить, что собранный вами материал подходит для обработки средствами параметрической статистики. Получив на пер­вом шаге компьютерных вычислений первичные статистики признаков, можно сделать дальнейшие, более точные, предположения о форме распре­деления каждого признака.

 

В ходе обработки данных весьма вероятно, что потребуются несколько пользовательских программ. Современные программы предоставляют до­вольно широкие возможности перевода данных из одной в другую. Однако не будет лишним соблюсти некоторые правила, чтобы облегчить преобра­зование формата данных.

 

Старайтесь без особой необходимости не заносить в таблицу различ­ные текстовые символы (точки, запятые, тире и т. п.). Всю информацию, которую можно закодировать числами, лучше перевести в числовую фор­му. Это даст больше возможностей для разных видов обработки данных. Исключением является строка, в которой записаны названия (чаще краткие названия - аббревиатуры) измеренных показателей.

 

До начала набора данных в электронную таблицу узнайте, в каком виде должны записываться десятичные дроби - какой знак (точка или запятая) должен разделять целую дробную части.

 

Не объединяйте без необходимости ячейки рабочей таблицы. Эстети­ческому чувству полезно дать проявиться при оформлении таблицы в тек­сте рукописи, когда все подсчитано, но не ранее. Особо внимательно отне­ситесь к первым ячейкам - в левом верхнем углу таблицы. Лучше запол­нить их произвольными числами, чем оставлять пустыми. Без этого при экспорте в другой формат может быть не считана вся первая строка или может измениться структура всей таблицы.

 

В таблицу целесообразно внести все интересующие вас признаки в фор­ме десятичного числа, то есть предварительно пересчитать минуты в деся­тичные доли часа, секунды - в десятичные доли минуты, количество меся­цев - в десятичную долю года и т. д. Это необходимо, поскольку формат данных для большинства используемых сейчас компьютерных программ накладывает свои ограничения.

 

В виде чисел в таблицу можно вписать информацию и о тех параметрах выборки, которые предположительно могут оказаться значимыми фактора­ми, но имеются у вас в качественных показателях. Наиболее простыми опе­рациями могут быть: числовое кодирование (мужчины - 1, женщины - 2; прошедшие обучение - 1, не прошедшие - 2 и т. п.) и перевод качествен­ных показателей в ранги. Число 0 для кодирования лучше не использовать, поскольку некоторые статистические компьютерные программы не смогут обработать такие данные. Это не значит, что в таблицу вообще не могут быть записаны нулевые значения. Имеются в виду те случаи, когда в сфор­мированной рабочей подвыборке какой-либо признак имеет только нуле­вые значения.

 

Уровень образования, ранжируя, можно следующим образом перевес­ти в числа (см. табл. 9).

Таблица9

<== предыдущая лекция | следующая лекция ==>
Вопрос № 6 Использование компьютера | Проверка данных
Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 455; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.014 сек.