Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Пример использования программы Typology Tables




Работа с программой Typology Tables

Статистические эксперименты

Критические значения Z-статистики при множественных сравнениях.

Для выяснения значимости вычисляется критическое значение максимальной по модулю Z -статистики таблицы (max| Z ij|) и значимыми считаем Z ij, превышающие это значение. Как обычно, критическое значение выбирается так, чтобы вероятность случайно его превзойти была равна заданному значению (обычно - 5%).

Для выяснения критического значения max|Zij| многократно (заданное число раз) имитируется ситуация независимости ответов, соответствующих строкам и столбцам. В ходе имитации в клетках таблицы получаются значения Z-статистик. Такая имитация осуществляется за счет случайного перемешивания данных, которое можно представить так: мы как будто рассыпали листочки с разными вопросами анкеты и случайно собираем их вместе.

По эмпирической функции распределения получается критические значения для максимума Z -статистики.

Эксперименты позволяют также оценить в каждой клетке наблюдаемую множественную значимость Z -статистики - вероятность на всей таблице случайно получить большее значение Z -статистики.

Коротко статистический анализ таблиц при помощи Typology Tables можно представить последовательностью следующих естественных действий.

  • Задание групповых переменных
  • Выбор переменных для строк, столбцов, если необходимо - переменных для вычисления средних и условий (слоев).
  • Выбор таблицы сопряженности или средних (на основе числа валидных ("немиссинговых") объектов в нутри таблицы.
  • Статистический эксперимент.
  • Выдача результатов. Программа может выводить результат в текстовый файл, формат, применяемый в интернет (HTML) и в виде файла EXCEL.

Каждое из этих действий в программе обеспечено своей экранной формой; переход от одной формы к другой происходит естественным путем (запуском очередных расчетов) или с помощью специальных кнопок-переключателей.

 

В информации RLMS сведения о покупках 3700 семей, сделанных в течение 1 недели (молочных продуктов, спиртного и табака, сладостей и другого), о размерах жилья и имеющихся в жилье удобствах, о наличии в семье дорогостоящих предметов и недвижимости.

Связаны ли ответы о покупках спиртного и табака с наличием автомобиля, дачи и других предметов крупной собственности? Этот вопрос мы проанализируем с помощью Typology Tables. Таблица 3.10, полученная по совокупности городских семей (подвыборка из RLMS 2604 семей), показывает такую связь. В таблице строки соответствуют ответам по одному, столбцы - ответам по другому вопросу, отличие от обычной таблицы частот только в том, что группы объектов (семей), соответствующие разным ответам, могут пересекаться.

Явно видно, что в семьях, владеющих крупной собственностью, употребляют больше алкоголя и табака (может быть, сказывается наличие в них большего числа мужчин?). Однако, насколько надежен этот вывод? Особенно для группы владельцев грузового автомобиля - уж слишком мала эта группа для надежных выводов.

Таблица 3.10. Покупка алкоголя и табачных изделий и наличие крупной собственности (фрагмент таблицы сопряженности, частоты и % по строкам)

Z -статистики в таблице 3.11 показывают значимость связей некоторых ответов. Однако множественные сравнения не позволяют полностью доверять этим результатам.

Таблица 3.11. Z-статистики и значимость (%) связи покупки алкоголя и табачных изделий и наличие крупной собственности (фрагмент таблицы, Z-статистики)

В таблице 3.12 отмечены значимые с точки зрения множественнях сравнений Z -статистики. При этом оценка 5% критического значения Z равна 3.09, а не 1.96, как это было бы в обычном анализе.

В каждой клетке расположены также наблюдаемые множественные значимости. Например, Z статистика 6.46 в клетке "Легковой автомобиль - пиво" практически не может быть получена случайно (вероятность получить большее значение равна нулю), а связь, характеризуемая значением Z=2.84 в клетке "Другая квартира - водка" - под сомнением: такие и большие значения в одной из 28 клеток таблицы можно получить случайно с вероятностью 10.8%.

Таблица 3.12. Z-статистики отклонений частот и их наблюдаемая множественная значимость (в %, 5% критическое значение max|Zij|= 3.09).

Таблица средних. Молочные продукты и жилплощадь.

Некоторые товары настолько общеупотребительны, что их покупает каждая семья, другие - чаще приобретаются семьями с детьми, третьи товары берут для стариков и т.п. Молодые семьи обычно имеют маленьких детей и часто нуждаются в жилплощади. Можно ли по косвенному признаку, жилплощади, выяснить, какие молочные товары приобретаются семьей? Для исследования подобных вопросов в клетках таблицы для неальтернативных вопросов размещаются средние значения количественной переменной. В таблице 3.13. размещена средняя жилплощадь в пересекающихся группах семей по покупкам молочных продуктов. Эта таблица показывает, что городские семьи, покупающие кисломолочные продукты, имеют в среднем меньшую, а семьи, покупающие сухое молоко, большую жилплощадь. Но может быть это не закономерность, а игра случая?

Таблица 3.13. Средняя жилплощадь в группах семей по покупкам молочных продуктов.

Узнать это, определить, какое смещение значимо, а какое - нет, помогут множественные сравнения Z -статистик отклонения средних в клетках от среднего по всей совокупности (см. таблицу 5). В ней выделена единственная значимая на 5% уровне клетка, показывающая относительно малую обеспеченность жилплощадью покупателей кисломолочных продуктов (скорее всего, эти покупатели - из молодых семей с детьми). Абсолютная величина ее значения (- 2.87)случайно может быть перекрыта лишь с вероятностью 0.029 (наблюдаемая множественная значимость равна 2.9%).

Таблица 3.14. Z-статистики отклонений средних для таблицы 4 (5% множественное критическое значение равно 2.69).

Душевой доход любителей сладкого и жилье. Одновременное сравнение средних по строкам таблицы.

Насколько отличаются доходы потребителей сладкого внутри групп по-разному обеспеченных жильем - имеющих квартиру, свой дом, часть квартиры и др.?

Для выяснения этого изучим средние логарифмы доходов (вспомним, что для получения устойчивых результатов в таких исследованиях лучше использовать логарифм дохода).

Из таблицы 3.15. видно, что обладатели отдельных квартир - самые богатые, отдельного дома - чуть победнее (скорее всего это обитатели городских окраин), а те, кто имеет часть дома или квартиры - самые бедные. У них разные условия существования и полезно изучить эти группы по отдельности. Это значит, что смещение средних в клетках таблицы нужно рассмотреть не по отношению к общему среднему (5.6), а по отношению к итогам по строкам (например, существенно ли выделяются по доходам среди обитателей домов (средний логарифм дохода равен 5.5) любители мороженого (средний логарифм дохода равен 5.9)).

Таблица 3.15. Средний логарифм доходов в группах по жилищным условиям и по покупкам сладкого (среднее, стд.отклонение, численность в группах).

Таблица 3.16. Z-статистики отклонений средних для таблицы 6 (5% множественное критическое значение равно 3.1).

Таким образом, мы одновременно рассматриваем Z статистики для каждой группы и проводим множественные сравнения 21 смещения средних (покупателями джема и варенья оказались только жители отдельных квартир, поэтому для части клеток таблицы средние и, следовательно, Z-статистики их отклонений не определены). Способы определения значимости смещений в двумерной таблице и одномерной таблице средних идентичны, здесь также используется перемешивание данных по зависимой переменной.

На основании таблицы 3.16 можно достоверно утверждать, что среди обитателей отдельных квартир большие доходы имеют семьи любителей мороженого, конфет и печенья с пирожными; среди жильцов отдельных домов существенно выделяются по доходам семьи у покупателей сахара (только в 5% случаев в таблице случайно можно получить большие Z -статистики). В остальных клетках таблицы Z - статистики незначимы - либо отклонения несущественны, либо выборка маловата, чтобы делать надежные выводы.

Глава 4. Сравнение средних, корреляции




Поделиться с друзьями:


Дата добавления: 2014-12-27; Просмотров: 784; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.019 сек.