Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Часть III. Сбор, подготовка и анализ данных 4 страница. Идентификационные данные о рес-




переменной

В

IQ

И

IP

Название переменной

Идентификационные данные о рес-

понденте

Номер записи

Код проекта

Код интервью

Код даты

Код времени

Проверочный код

Пробел

Кто ходит за покупками

Степень знакомства с магазином 1

Степень знакомства с магазином 2

Степень знакомства с магазином 3

Степень знакомства с магазином 10

Частота: магазин 1

Частота: магазин 2

Частота: магазин '10

Пробел

Рейтинг магазина 1: качество

Рейтинг магазина 10: качество

Рейтинг магазина 1: разнообразие

Рейтинг магазина 10: разнообразие

Рейтинг магазина 1: цены

Рейтинг магазина 10: цены

Пробел

Номер Инструкции кодирования

вопроса

Номера от 001 до 890. При необходимо-

сти добавьте перед числом ноль

1 (Одинаково для всех респондентов)

31 (Одинаково для всех респондентов)

Как указано в анкете

Как указано в анкете

Как указано в анкете

Как указано в анкете

Не заполняйте эти столбцы

1 Мужчины — 1

Женщины — 2

Прочее — 3

Введите обведенный номер

Пропущенные значения — 9

На По вопросам a-j вопроса II введите об-

веденные номера

lib Не очень знаком 1

Очень знаком — 6

Пропущенные значения — 9

Не

III

Ilia По вопросам a-j вопроса III введите об-

веденные номера

Illb Никогда— 1

Очень часто — 6

Пропущенные значения — 9

IHJ

Не заполняйте эти столбцы

IVa Для вопросов IV-XI введите обведен-

ные номера

IVa

IVb

IVb

IVc

IVc

He заполняйте эти столбцы

Рис. 14.2. Фрагмент кодировочной книги, содержащий информацию по первой записи Й/w проекта

"Выбор универмага "

524 Часть III. Сбор, подготовка и анализ данных

Столбцы 1—3 представляют собой одно поле, и в них указаны номера респондентов, за-

кодированные номерами от 001 до 271. Столбец 4 содержит номер записи. В нем проставлено

значение 1 для всех строк, поскольку в нашем примере отображается только первая запись по

всем респондентам. В столбцах 5 и 6 содержится код проекта, 31. В столбцах 7 и 8 указывает-

ся код интервьюера от 01 до 55, поскольку в данном опросе задействовано 55 интервьюеров.

Колонки 26—35, каждая из которых представляет определенное поле, содержат рейтинговую

оценку (от 1 до 6) степени ознакомления респондентов с 10 универмагами, вошедшими в ис-

следование. И наконец, столбец 77 отображает рейтинговую оценку цен универмага №10.

Обратите внимание, что столбцы 78 и 80 не заполнены. По каждому респондент)' представ-

лено 10 записей. Количество строк составляет 2710, что указывает на то, что в данном файле

содержится информация, полученная от 271 респондента.

Если анкета включает только структурированные вопросы или очень незначительное коли-

чество неструктурированных вопросов, она кодируется заранее. Это означает, что коды при-

сваиваются, прежде чем начинается непосредственная полевая работа. Если же в анкете содер-

жатся в основном неструктурированные вопросы, коды присваиваются уже после того, как за-

полненные анкеты возвращаются с места сбора данных (так называемое посткодирование) [3].

Предварительное кодирование кратко обсуждалось в главе 10, посвященной описанию струк-

туры анкет. Ниже вашему вниманию представлены дальнейшие основные рекомендации по

этой процедуре [4].

Кодирование вопросов

Код респондента и номер записи необходимо указывать для каждой записи данных. Сле-

дует также включать дополнительные коды для каждого респондента: код проекта, код ин-

тервьюера, код даты и времени, проверочный код. Настоятельно рекомендуется также ис-

пользовать фиксированные коды полей (fixed field code), в которых номер записей по каждому

респонденту одинаков, и в одних и тех же колонках по всем респондентам указываются одни

и те же данные.

Фиксированный код поля (fixed field code)

Код, в котором номер записей по каждому респонденту кодируется одним и тем же номе-

ром, в одних и тех же столбцах по всем респондентам указываются одни и те же данные.

Если это возможно, по всем пропущенным данным следует использовать стандартные ко-

ды, Так, переменную, указываемую в одном столбце, можно закодировать №9; для перемен-

ной, указываемой в двух столбцах, назначить код 99 и т.д. Следует помнить, что коды пропу-

щенных значений должны отличаться от кодов, присвоенных ответам, полученным надлежа-

щим способом в ходе опроса.

Кодирование структурированных вопросов — относительно простая процедура, поскольку в

этом случае варианты ответов определяются заранее. Исследователь присваивает каждому воз-

можному варианту ответа код и указывает соответствующую запись и столбец, в который эти

коды будут введены. Например:

1. Действителен ли на сегодня ваш паспорт?

Да 2. Нет (2/54)

Ответ "Да" на этот вопрос закодирован кодом 1, а ответ "Нет" — кодом 2. Числа в скобках

говорят о том, что данный присвоенный код указывается во второй записи по данному респон-

денту в столбце 54. Поскольку вопрос предусматривает только один ответ и на выбор предло-

жено всего два варианта (1 или 2), одного столбца достаточно. Как правило, одного столбца бы-

вает достаточно для кодирования любого структурированного вопроса, предполагающего один

вариант ответа, если на выбор предлагается меньше девяти вариантов ответов.

Если же существует большое количество вариантов ответов, для каждого возможного

варианта следует выделить отдельный столбец. К таким вопросам относятся, например,

Глава 14. Подготовка данных к анализу 525

вопросы об использовании торговой марки, о читательских и зрительских предпочтениях

респондентов и т.д. Например:

Вопрос: Какие счета вы имеете в данном банке?(Пометить крестиком все варианты ответа)

Запись №9

Обычный сберегательный счет D (62)

Обычный текущий счет D (63)

Ипотечный (64)

Счет НАУ П (65)

Клубный счет (рождественский и т.д.) D (66)

Кредитная линия П (67)

Срочный сберегательный счет (срочные депозиты и т.д.) (68)

Страхование жизни в сберегательном банке П (69)

Заем на усовершенствование жилища D (70)

Заем на приобретение автомобиля (71)

Другие услуги (72)

Для примера представим, что респондент помечает обычный сберегательный, текущий и

срочный сберегательный счета. Таким образом, в записи №9 в столбцах 62, 63 и 68 введен код 1.

Во всех остальных столбцах (64, 65, 66, 67, 69, 70, 71 и 72) проставляется код 0.

Кодирование неструктурированных вопросов или вопросов, допускающих несколько ва-

риантов ответа, представляет более сложную задачу. Сначала ответы респондентов дословно

записываются в анкету. Затем для них разрабатываются коды, которые и присваиваются

конкретным ответам. Иногда, основываясь на предыдущих проектах или на теоретических

предпосылках, маркетолог может разработать коды еще до начала работы по сбору данных.

Однако обычно к этой процедуре приступают только тогда, когда получены заполненные

анкеты. После этого исследователь составляет список, включающий 50-100 наиболее частых

вариантов ответов на неструктурированные вопросы, и определяет категории, подлежащие

кодированию. После того как коды разработаны, необходимо подготовить кодировщика, ко-

торый будет присваивать записанным в словарной форме ответам соответствующие коды.

Обычно при кодировании неструктурированных вопросов и анкет вообще рекомендуется

выполнять следующие правила [5].

Коды категорий должны быть взаимоисключающими и взаимоисчерпываюшими. Катего-

рии считаются взаимоисключающими, если каждому ответу присваивается только один код.

Категории не должны перекрывать одна другую. Категории считаются взаимоисчерпывающи-

ми, если каждый ответ соответствует одному из кодов, присвоенных данной категории. Этого

можно достичь введением дополнительного кода категории, например "другое" или "ни один

из предложенных вариантов". Однако следует помнить, что в эту категорию должна войти

только незначительная часть ответов (не больше 10%). Подавляющая часть ответов должна от-

носиться к значимым категориям.

По наиболее важным вопросам коды категорий должны присваиваться даже в том случае,

если они не упоминались ни одним из респондентов. Иногда важно знать именно то, что ни-

кто из отвечающих не дал тот или иной вариант ответа. Представим, например, что руководство

одной крупной компании, выпускающей потребительские товары, решило выяснить, нравится

ли потребителям упаковка новой марки мыла. С этой целью при кодировании вариантов отве-

тов на вопрос "Что вам больше всего не нравится в этой марке мыла?" была включена отдель-

ная категория "упаковка". Данные кодируются для того, чтобы сохранить как можно больше

деталей ответов. Например, собрав данные о частоте перелетов, совершаемых бизнесменами с

использованием конкретных коммерческих авиалиний, необходимо закодировать ее подробно,

а не просто сгруппировать по двум кодам категорий — "летаю часто" и "летаю нечасто". Эти

данные по частоте перелетов позволят исследователю впоследствии разграничить категории

бизнесменов-путешественников несколькими разными способами. Если же категории опреде-

лены заранее, последующий анализ данных ограничится только этими категориями.

526 Часть III. Обор, подготовка и анализ данных

Кодировочная книга

Кодировочная книга (codebook) содержит инструкции по кодированию, а также необходи-

мую информацию о переменных, используемых в конкретном наборе данных.

Кодировочная книга (codebook)

Книга, содержащая инструкции по кодированию и необходимую информацию о перемен-

ных, используемых в конкретном наборе данных.

Кодировочная книга применяется как руководство для кодировщика и помогает исследова-

телю правильно определять и располагать переменные. Даже если анкета закодирована заранее,

следует подготовить формальную кодировочную книгу. Кодировочная книга обычно включает

следующую информацию: номер столбца, номер записи, номер переменной, название пере-

менной, номер ответа, инструкции по кодированию. На рис. 14.2 изображен фрагмент из ко-

дировочной книги, разработанной для проекта "Выбор универмага".

Кодирование анкет

На рис. 14.3 приведен пример кодирования анкеты. На нем изображена часть закодирован-

ной анкеты, которая использовалась в ходе реализации проекта "Выбор универмага".

И наконец, в этой части нашей анкеты мы просим вас дать определенную информацию о себе,

которая необходима нам для выполнения классификации

Часть D Запись№7

1. Ответы на вопросы данной анкеты предоставлены (29)

1. Мужчиной-главой семьи

2. Женщиной-главой семьи

3. Совместно мужчиной и женщиной

2. Семейное положение (30)

1. Замужем (женат)

2. Никогда не была замужем (женат)

3. Разведен(а)/Живетотдельно/Вдов(а)

3. Укажите общее количество членов семьи, живущих с вами в одном доме (31—32)

4. Укажите количество детей, живущих с вами

a) Младше 6 лет (33)

b) Старше 6 лет _ (34)

5. Укажите количество детей, живущих отдельно (35)

6. Обведите кружком общее количество лет учебы (если таковой имеется, ука-

жите эти же данные по своему супругу)

Средняя Незаконченное Законченное высшее

школа высшее образование образование

a) Вы 8 или меньше 9 10 13141516 17 18 19 2021 22 или (36-37)

1112 больше

b) Супруг (а) 8 или меньше 9 10 13141516 17 18 19 20 21 22 или (38-39)

11 12 больше

7. а) Укажите свой возраст (40—41)

Ь) Укажите возраст супруга (супруги) (42—43)

8. Если работаете, укажите род деятельности обоих супругов, пометив все необ-

ходимые категории

44 45

Мужчина Женщина

1. Профессионально-техническая

2. Менеджмент и управление _ ____

Глава 14. Подготовка данных к анализу 527

3. Торговый работник

4. Офисная или подобная работа

5. Рабочий/оператор

6. Работник на дому

7. Прочее (пожалуйста, назовите)

8. Данных нет

9. Принадлежит ли семье занимаемое ею жилье? (46)

1. При надлежит семье

2. Арендуется

10. Сколько лет ваша семья проживает в районе Атланты? (47-48)

__лет

11. Каков общий годовой доход вашей семьи до уплаты налогов. Пометьте нуж- (49-50)

ный вариант.

01. Меньше 10000 долл. _ 08. От 40000 до 44999 __

02. От 10000 до 14999 _ 09. От 45000 до 49999 _

03. От 15000 до 19999 _ 10. От 50000 до 54999 _

04. От 20000 до 24999 _ 11. От 55000 до 59999 _

05. От 25000 до 29999 _ 12. От 60000 до 69999 _

06. От 30000 до 34999 13. От 70000 до 89999 _

07. От 35000 до 39999 14. 90000 и больше

Примечание. В столбцах 1-3 данной записи содержатся идентификационные сведения о респонденте,

в столбце 4 — номер записи (7), столбцы 5 и б пустые. Столбцы с 7 по 27 включают информацию из части

С данной анкеты, столбец 28 пустой. Таким образом, информация по части D анкеты кодируется, начи-

ная с колонки 29.

Рис. J4.3. Пример кодирования анкеты: кодирование демографических данных

Данную анкету закодировали заранее. Код респондента и номер записи указан по каждой

записи. Первая запись содержит дополнительные коды: код проекта, код интервьюера, коды

даты и времени и проверочный код. Полезный совет: рекомендуется разграничивать отдельные

части анкеты пробелами. Иногда вместо вписывания кодов в анкету они заносятся в специаль-

ный документ, содержащий 80 столбцов и известный как "кодировочная таблица".

ПРЕОБРАЗОВАНИЕ ДАННЫХ

Преобразование данных заключается в переносе закодированных данных из анкеты или

копировочных таблиц на диски или магнитные ленты либо во введении их непосредственно в

компьютер через клавиатуру. Если данные собраны с использованием автоматизированных

компьютерных систем, их преобразование не обязательно, поскольку они вводятся в компью-

тер в процессе их сбора. Данные можно вводить не только с клавиатуры, но и в процессе считы-

вания меток или маркеров с бланков, оптического сканирования или компьютеризированного

сенсорного анализа (рис. 14.4).

Для того чтобы воспользоваться методом считывания меток с бланков, ответы должны

записываться специальным карандашом в конкретные поля анкеты, закодированные для

данного ответа. Зафиксированные таким образом данные могут считываться машиной. Оп-

тическое сканирование заключается в прямом машинном считывании кодов с одновремен-

ным преобразованием данных. Известным примером оптического сканирования может слу-

жить преобразование штрих-кода при считывании его в кассах супермаркетов. Технический

прогресс привел к созданию систем компьютеризированного сенсорного анализа, благодаря

которым можно автоматизировать процесс сбора данных. Вопросы выводятся на специаль-

ной компьютеризированной панели, а ответы с помощью сенсорных устройств вводятся не-

посредственно в компьютер.

528 Часть III. Сбор, подготовка и анализ данных

Используя метод ввода ответов с клавиатуры, полностью избежать ошибок трудно, по-

этому необходимо проверять введенные массивы данных, по крайне мере частично. Для

проверки правильности введенных данных применяется проверочный компьютер и второй

оператор. Второй оператор повторно вводит данные из закодированных анкет, после чего

преобразованные данные, введенные двумя операторами, сравниваются по записям. Любое

расхождение между двумя комплектами преобразованных данных исследуется с тем, чтобы

выявить и исправить ошибки в результате ввода данных с клавиатуры. Если проверяются

результаты ввода всего набора данных, время и затраты на преобразование данных удваива-

ются. Учитывая дополнительные временные и денежные затраты, а также то, что опытные

операторы по вводу данных работают довольно точно и практически без ошибок, обычно

достаточно сверить 20—25% данных.

Автоматизированные

ATI/CAP! -

Бланш,

заполненные методом,

позволяющим считывание

.- меток или маркеров с них-.

Огттическое

сканирование

Компьютеризированный

сенсорный анализ

Проверка достоверности

данных: Исправление ошибок s

результате ввода с клавиатуры~

ВНННВЯвВЯН^^^И

Диски

Преобразованные да

Рис. 14.4. Преобразование данных

Если используются автоматизированные системы CATI и CAPI, правильность ввода дан-

ных проверяется по мере их поступления. При вводе неприемлемого варианта ответа компью-

тер выдает респонденту или интервьюеру соответствующее предупреждение. Если же ответ

приемлем, интервьюер или респондент могут увидеть его на экране и проверить его правиль-

ность до передачи на дальнейшую обработку.

Выбор метода преобразования данных зависит от способа проведения интервью и наличия

необходимого оборудования. При использовании методов CAPI и CATI данные вводятся непо-

средственно в компьютер. Ввод данных с клавиатуры терминала с электронно-лучевой трубкой

(CRT) чаще всего применяется при опросе по телефону, при обходе домов, при опросах в уни-

вермагах и по почте. Поскольку при опросах на дому все чаше применяются специальные кла-

виатуры и портативные компьютеры, в последнее время интенсивно используются системы

для компьютеризированного сенсорного анализа. Оптическое сканирование широко применя-

ется при проведении струкурированных и периодически повторяющихся опросов, а метод

считывания меток или маркеров с бланков — при специальных наблюдениях [6].

Глава 14. Подготовка данных к анализу 529

ОЧИЩЕНИЕ ДАННЫХ

Процедура очищения данных (data cleaning) заключается в проверке состоятельности соб-

ранных данных и работе с пропущенными ответами.

Очищение данных (data cleaning)

Тщательная и всесторонняя проверка состоятельности собранных данных и работа с пропу-

щенными ответами.

Предварительная проверка состоятельности собранных данных проводится на этапе редак-

тирования, но проверка, которая проводится на стадии очищения данных, намного точнее и

тщательнее, поскольку выполняется с использованием компьютерной техники.

Проверка состоятельности данных

Проверка состоятельности данных (consistency checks) позволяет выявить данные, выходя-

щие за пределы определенного диапазона, и логически непоследовательные ответы либо опре-

делить экстремальные значения.

Проверка состоятельности данных (consistency checks)

Часть процесса очищения собранных данных, когда исследователь выявляет данные, выхо-

дящие за пределы конкретного диапазона, и логически непоследовательные ответы либо

определяет экстремальные значения. Данные со значениями, не указанными в кодировоч-

ной схеме, не принимаются.

Значения, выпадающие из конкретного диапазона, нельзя использовать в анализе, и их

необходимо исправить. Представим, например, что респондентов попросили выразить сте-

пень их согласия по ряду вопросов относительно стиля жизни по шкале от 1 до 5. Код 9 ис-

пользуется для обозначения пропущенных ответов, а значения 0, 6, 7 и 8 выходят за пределы

назначенного диапазона. Существует множество компьютерных пакетов, например APSS,

SAS, BMDP, Minitab и Excel, с помощью которых можно написать программы выявления по

каждой переменной значений, выходящих за пределы определенного диапазона, а также

распечатать код респондента, код переменной, название переменной, номер записи и столб-

ца и выпадающее из необходимого диапазона значение [7]. Все это значительно упрощает

процедуру систематической проверки каждой переменной по каждому ее значению, выхо-

дящему из определенного диапазона. Правильные ответы можно определить, возвратившись

к отредактированному и закодированному варианту анкеты,

Различают несколько типов логической непоследовательности ответов. Так, респондент

может указать, что обычно при междугородних переговорах пользуется специальной карточ-

кой, но при этом отметить, что ни разу не звонил. Либо респондент указывает, что часто поль-

зуется каким-то товаром, и в то же время отмечает, что никогда его не приобретал. Чтобы вы-

явить такие ответы и провести соответствующую корректировку, всю необходимую информа-

цию (код респондента, код переменной, название переменной, номер записи и столбца и

выпадающее из необходимого диапазона значение) нужно распечатать,

И наконец, необходимо тщательно проанализировать экстремальные значения. Следует

помнить, что экстремальные значения — не всегда результат ошибок, нередко они указыва-

ют на то, что существуют определенные проблемы с качеством собранных данных. Напри-

мер, чрезмерно заниженная оценка какой-либо торговой марки может быть результатом то-

го, что респондент просто без разбора пометил 1 по всем ее характеристикам (по рейтинговой

шкале от 1 до 7).

530 Часть III. Сбор, подготовка и анализ данных

Работа с пропущенными ответами

Пропущенными ответами (missing responses) называют значения переменных, которые оста-

лись неизвестными исследователю либо потому, что ответы респондентов были неоднозначны,

либо неправильно или неразборчиво записаны.

Пропущенные ответы (missing responses)

Значения переменных, неизвестные по причине того, что респонденты не дали однозначных

ответов на предложенный вопрос.

Работа с пропущенными ответами связана с рядом проблем, особенно если доля таких отве-

тов превышает 10%. Существует несколько методов работы с пропущенными ответами [8].

Замена пропущенного значения нейтральным. По этому методу вместо пропущенных ответов

подставляются нейтральные значения, обычно среднее значение по данной переменной. При

этом среднее значение переменной остается неизменным, а другие статистические данные, на-

пример корреляция, искажаются незначительно. Хотя этот подход и имеет ряд преимуществ,

подстановка среднего значения (например, 4) вместо всех пропущенных ответов респондентов

весьма неоднозначна и сомнительна, если учесть, что если бы они все же ответили, то могли бы

выбрать значительно более высокий (например, 6 или 7) или более низкий (1 или 2) рейтинго-

вый показатель [9].

Замена пропущенного значения условным (вменение значений). Для определения условного

значения или вычисления подходящих ответов на пропущенные вопросы можно использовать

структуру ответов респондентов по другим вопросам. На основе имеющихся данных исследова-

тель пытается определить, какие ответы дал бы конкретный респондент, если бы он ответил на

все вопросы. Это можно сделать статистически, на основе собранных данных, определив взаи-

мосвязи между пропущенной переменной и другими переменными. Так, показатель частоты

использования товара можно связать с размером семей респондентов, предоставивших инфор-

мацию по этим показателям. Затем пропущенные данные по использованию товара можно вы-

числить, воспользовавшись показателем размера семьи респондента. Однако следует помнить,

что этот метод очень трудоемок и нередко серьезно искажает данные. Чтобы избежать этого,

для вычисления условных значений по пропущенным ответам разработаны сложные статисти-

ческие процедуры, о чем рассказывается в следующем примере.

ПРИМЕР. Вменение значений повышает целостность массива данных

Рассмотрим исследование, определяющее, насколько семьи желают учитывать рекомен-

дации служб, занимающихся аудитом расхода электроэнергии (зависимая переменная) с

учетом определенных финансовых факторов. В качестве независимых переменных исполь-

зовались пять финансовых факторов, которыми манипулировали на известных уровнях, их

значения благодаря удачно выбранному плану исследования были всегда известны. Однако

в анкетах некоторые значения зависимой переменной оказались пропущенными. Их заме-

нили условными (вмененными), вычисленными статистическим методом на основе соот-

ветствующих значений независимых переменных. Такая работа с отсутствующими значе-

ниями в огромной мере упростила последующий анализ и повысила достоверность его ре-

зультатов [10].

Исключение объекта целиком. При исключении объекта целиком (casewise deletion) все на-

блюдения или респонденты с пропущенными ответами исключаются из анализа.

Исключение объекта целиком (casewise deletion)

Метод работы с пропущенными ответами, при котором наблюдения или респонденты с

пропущенными ответами исключаются из анализа.

Глава 14. Подготовка данных к анализу 531

Поскольку нередки случаи, когда многие респонденты не отвечают на те или иные вопро-

сы, данный метод может вызвать значительное сокращение выборки. Следует помнить, что ис-

ключение большого количества данных нежелательно, поскольку процесс сбора данных дорог

и требует больших временных затрат. Кроме того, респонденты с пропущенными значениями

систематически отличаются от респондентов, ответивших на все вопросы. В таких случаях ис-

ключение по данному методу может значительно исказить результаты опроса.

Попарное исключение переменных. При попарном исключении (pairwise delition) вместо от-

браковывания всех случаев с любыми отсутствующими значениями исследователь во всех

своих вычислениях рассматривает только наблюдения или респондентов, по которым есть

полные ответы.

Попарное исключение (pairwise delition)

Метод работы с пропущенными значениями, в соответствии с которым наблюдения или

респонденты с пропущенными данными не отбраковываются автоматически; исследователь

во всех своих вычислениях учитывает только наблюдения или респондентов, по которым

есть полные ответы.

В результате разные вычисления в ходе анализа могут основываться на разных размерах вы-

борок. Такая процедура обычно применяется при следующих условиях: если размеры выборки

велики, если количество пропущенных ответов незначительно, если переменные не сильно

взаимосвязаны. Следует помнить, что и в этом случае данная процедура может привести к не-

достоверным и даже нелогичным результатам исследования.

Применение разных методов работы с пропущенными значениями нередко приводит к

разным итогам, особенно если пропуск ответов носит систематический характер, а переменные

тесно взаимосвязаны. Таким образом, исследователю необходимо свести к минимуму количе-

ство пропущенных ответов. Кроме того, прежде чем выбрать конкретный метод для работы с

пропущенными значениями, он должен тщательно проанализировать все последствия приме-

нения той или иной процедуры.

СТАТИСТИЧЕСКАЯ КОРРЕКТИРОВКА ДАННЫХ

Процедуры статистической корректировки данных включают взвешивание, переопределе-

ние переменной и преобразования шкалы. Все эти корректировки необязательны, но, приме-

няя их, можно значительно повысить качество анализа.

Взвешивание

При взвешивании (weighting) каждому наблюдению или респонденту в базе данных при-

сваивается весовой коэффициент, отображающий степень его значимости по сравнению с дру-

гими наблюдениями или респондентами.

Взвешивание (weighting)

Метод статистической корректировки данных, при котором каждому наблюдению или рес-

понденту в базе данных присваивается весовой коэффициент, отображающий степень его

значимости по сравнению с другими наблюдениями или респондентами.

Значение 1,0 применяется для обозначения наблюдения с отсутствием весового коэффици-

ента. Цель взвешивания заключается в том, чтобы увеличить либо уменьшить в выборке коли-

чество наблюдений с определенными характеристиками (в главе 12 обсуждалось использование

метода взвешивания для корректировки ситуаций с отказом отвечать на вопросы).

Взвешивание чаще всего применяется для того, чтобы выборочные данные максимально




Поделиться с друзьями:


Дата добавления: 2015-05-09; Просмотров: 332; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.03 сек.