Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Программы обработки данных

В настоящее время к статистическому программному обеспечению принято относить пакеты программ статистического анализа общего и специального назначения, пакеты программ табулирования, пакеты программ редактирования, пакеты программ управления данными, пакеты программ для выборочных обследований, а также многие графические пакеты, пакеты эконометрического моделирования и прогнозирования, имитационного моделирования, распознания изображений и т.д.

Появление персонального компьютера третьего поколения послужило базой для создания сложных пакетов программ статистического анализа, и в настоящее время существует около тысячи статистических пакетов, универсальных или ориентированных на использование в каких-либо специальных областях, и число их продолжает расти.

Конструкция пакетов статистического анализа зависит в значительной степени от типа используемого персонального компьютера, его конфигурации, оперативной системы, а также от уровня подготовки пользователя пакета в области программирования для персонального компьютера.

Основным требованием, предъявляемым к организации решения задач экономики и управления, научных, социологических и других задач, является минимизация ресурсов, потребляемых для достижения поставленной цели. В зависимости от характера задачи на объём потребляемых ресурсов оказывают влияние временные и стоимостные ограничения. Соблюдению этих ограничений может в значительной степени способствовать использование персонального компьютера на всех или отдельных этапах решения задачи.

Эффективность автоматизации решения задачи может проявляться как в сокращении расходов на обработку информации (прямая эффективность), так и в улучшении функционирования управляемого объекта (косвенная эффективность) за счёт таких факторов, как повышение достоверности и сокращение времени обработки информации, что позволяет более обоснованные и качественные решения. Применение персонального компьютера является предпосылкой реализации принципа новых задач, развития новых способов исследования, проникновения в сущность социально-экономических процессов, и это оказывает влияние на оценку важности критериев выбора между ручными способами обработки данных и способами и использованием персонального компьютера.

При обработке статистических данных обычно используются одинаковые или в значительной степени сходные по своей мощности и разнообразию технические средства, программное обеспечение и режимы обработки данных. Подключение к мощным базовым персональным компьютерам с развитыми операционными системами разнообразных периферийных устройств, включая средства дистанционной передачи данных, оптические считывающие/записывающие устройства, графические дисплеи, графопостроители, средства вывода на микрофильм, позволяет обрабатывать данные в пакетном и интерактивном режимах с прямым доступом к рабочим и постоянным файлам и выводом результатов на различные носители в соответствии с разнообразными требованиями пользователей, а также создаёт предпосылки для реализации интегрированных систем обработки статистических данных.

Социологические исследования являются сложной деятельностью, которая нередко осуществляется на протяжении длительного промежутка времени, в географически отдалённых друг от друга местах, с привлечением большого числа специалистов, с использованием различных методик сбора и обработки данных. Это требует применения к планированию и контролю за его проведением программного обеспечения сетевого планирования и управления, а также других средств автоматизации.

Новые типы вычислительной техники, и прежде всего персональные компьютеры (ПК), позволяют проводить оперативный и более тонкий анализ информации. Теперь диалог специалиста в конкретной области с вычислительной машиной может проходить без посредничества программиста и операторов. Новые графические средства обеспечивают наглядное представление результатов применения различных методов, что значительно облегчает их восприятие. Однако для реализации преимуществ ПК необходимо специальное программное обеспечение. Практика показывает, что адапта­ция пакетов программ, созданных для больших ЭВМ, на ПК (SPSS, BMDP, SPAD) не обладает должным уровнем «дружелюбия». Использование таких продуктов требует долгого обу­чения и солидной подготовки в области математической статистики. При этом следует отметить, что несмотря на широту имеющихся методов и программ, относительно слабо продвинут предварительный анализ данных. Между тем, специфика социологических данных (неоднородность, зависимость на­блюдений друг от друга и от времени, обилие качественных признаков) в первую очередь требует его применения. Имеются в виду методы, не опирающиеся на вероятностные предположения о природе данных, например детерминационный анализ и анализ соответствий, которые в отличие от классических методов математической статистики дают результаты, относящиеся к выборке, а не к генеральной совокупности. Их можно эффективно использовать как на предварительном этапе изучения данных (для выявления аномальных наблюдений и возможных кластеров), так и для интерпретации результатов моделирования.

Кроме того, отсутствует адекватное статистическое и программное обеспечение анализа динамики качественных показателей, который особенно актуален в связи с проводимыми в последнее время лонгитюдными обследованиями.

Эти соображения легли в основу развития некоторых методов и создания Системы анализа нечисловой информации (САНИ).

Система анализа нечисловой информации предназначена для обработки данных, измеренных в разнородных шкалах: номинальной, порядковой, интервальной и количественной. В первую очередь она ориентирована на социально-экономические задачи, но может использоваться в биологии, медицине, других областях, где приходится иметь дело с нечисловой информацией.

САНИ реализована на совместимых с IBM персональных компьютерах и требует около 1 МБайта памяти на жестком диске. Она предполагает лишь элементарное знакомство пользователя с ПК. Работа осуществляется в диалоговом режиме с помощью иерархического меню или непосредственно нажатием определенных комбинаций клавиш.

Система позволяет одновременно обрабатывать до 320 признаков (вопросов); число объектов (респондентов) не должно превосходить 32000 для категоризованного признака и 8000 – для числового. Однако приведенные ограничения, имеют чисто технический характер, и допустимый объем данных зависит от используемого метода и типа компьютера.

В любой момент доступны: справка об используемом методе со ссылкой на литературу или разъяснение сложившейся ситуации; справки обо всех активных переменных, содержащие информацию, полученную от пользователя при первом вводе, и некоторые результаты проделанного анализа; данные об объектах (соответствующие значения переменных). Результаты анализа выводятся на экран и могут быть распечатаны или скопированы в файл для последующего включения в отчет.

Функциональное наполнение. Методы, используемые САНИ, распадаются на три группы. Первая — реализует возможности базы данных, вторая – объединяет средства предварительного анализа, позволяющие сформировать гипотезы о структуре данных, выявить «выбросы». При этом эффективно применяются графические возможности современной вычислительной техники. Методы, входящие в третью группу, используют вероятностные предположения о природе данных и позволяют проверять различные гипотезы. Особое внимание уделено анализу нечисловых признаков, изменяющихся во времени.

Работа с данными. Они могут быть введены вручную, импортированы из прямоугольных таблиц «объект-признак» или «признак-объект» в кодах ASCII или из общего статистического пакета SYSTAT. Имеется возможность экспортировать данные в виде таблиц ASCII или в системном формате SYSTAT.

В системе «САНИ» каждому признаку соответствует справка, содержащая сведения о шкале, в которой он измерен, код и число пропущенных значений, имена и частоты категорий, историю создания и комментарии пользователя. Кроме того, в справке хранятся некоторые результаты предыдущей обработки: имена независимых и тесно связанных с данной переменных. Они предостерегают исследователя от мало осмысленных шагов, например от использования неза­висимых переменных в анализе соответствий.

Имеется возможность получать подвыборки: отбирать или удалять объекты с фиксированной комбинацией значе­ний переменных. Можно создавать новые переменные в виде фиксированных комбинаций значений имеющихся переменных, агрегированием категорий, разбиением количественных переменных на интервалы, всевозможными комбинациями двух переменных (для снижения размерности). Все преобра­зования фиксируются в справках. Мощный редактор позволяет вводить и проверять данные вручную, а также изменять имя, комментарий, шкалу и значения переменных.

Программное обеспечение IP Sociologist 2.03-3.05 – профессиональное программное обеспечение для обработки и анализа данных социологических и маркетинговых исследований.

Представляет собой клиент-серверный продукт, ориентированный на использование в исследовательских центрах и маркетинговых отделах предприятий. Устанавливается только серверное программное обеспечение, после чего на всех (количество сетевых рабочих мест не ограничивается лицензией) рабочих станциях в пределах локальной сети предприятия возможен графический ввод без установки дополнительного программного обеспечения на клиентские машины.

Преимуществом данной программы являются большие возможности анализа и интуитивно понятный интерфейс как оператора, так и социолога. Все операции максимально визуализированы, реализованы с помощью удобного графического интерфейса и не требуют глубокого понимания их статистической сущности.

Возможности:

- Контекстное CDD-взвешивание (Pro);

- Детерминационный анализ (Pro);

- Произвольное расширение выборки по признаку (Pro);

- Расчет распределения Хи-квадрат (Standard, Pro);

- Расчет коэффициентов Крамера и Чупрова (Standard, Pro);

- Расчет коэффициента корреляции Пирсона (Standard, Pro);

- Расчет коэффициента корреляции Пирсона для ранговых признаков с использованием явных рангов (Standard, Pro);

- Экспорт данных в MS Excel и текст, разделенный табуляциями;

- 6 типов вопросов (номинальная и ранговая шкала – одиночный выбор, номинальная шкала с совместимыми альтернативами – множественных выбор, количественная шкала, таблица номинальных признаков, таблица номинальных признаков с совместимыми альтернативами – таблица с множественным выбором, таблица метрических признаков);

- Анализ произвольного количества двумерных зависимостей ответов на один вопрос в зависимости от ответов на другой, как в текстовой форме, так и в виде диаграмм MS Excel;

- Построение трехмерных диаграмм зависимости одного фактора от 2-х других;

- Графический ввод с неограниченного количества компьютеров в пределах одного сегмента ЛВС предприятия с помощью интуитивно понятного интерфейса MS Internet Explorer или Opera;

- Повопросный и поанкетный ввод с возможностью условных запретов;

- Просмотр и редактирование уже введенных анкет с помощью графического интерфейса;

- Возможность задания множественного фильтра анкет и вывод с его учетом отчета (работа в произвольном контексте);

- Работу с отдельными сессиями повопросного (в том числе и множественного) и поанкетного ввода анкет и формирование отчета по каждой из них (например, по каждому интервьюеру);

- Расчет частот и процентов для номинальных вопросов; мат. ожидания, стд. отклонения, вариации, ошибки среднего, минимума, максимума - для метрических признаков по каждой проекции;

- Выдачу отчетов в формате HTML, пригодном как для печати, так и для публикаций в сети Интернет;

- Выдача отчетов в Word;

- Подготовка и передача анкеты в Word;

- Работа с базой стандартных вопросов (репозиторием);

- Работа с несколькими социологическими исследованиями одновременно.

Программа Vortex предназначена для разработки инструментария сбора данных (анкеты, бланка интервью, теста, html-формы и т.п.), ввода, обработки и анализа информации, представления полученных результатов в виде таблиц, текстов и диаграмм с возможностью их переноса в другие приложения.

Области применения: любые исследования связанные с опросами населения, сотрудников или экспертов, анализ данных наблюдений, статистики.

Социологические исследования: комплекс наиболее востребованных процедур обработки и анализа количественных социологических данных, в том числе:

- расчет объема выборки и определение ошибки репрезентативности;

- экстраполяция данных на генеральную совокупность;

- обработка вопросов с множественным выбором, открытых и полузакрытых вопросов;

- обработка табличных вопросов, ранговых методик и полярных профилей;

- множество методик разработки вторичных показателей;

- одномерный, двухмерный и многомерный частотный анализ;

- регрессионный, кластерный, детерминационный и другие виды многомерного анализа.

Политические исследования: оценка и прогнозирование электоральной активности и политических предпочтений, выявление факторов влияющих на политическое поведение, разработка типологий политического поведения, сегментация электората по актуальным проблемам и информационным источникам.

Социально-психологические исследования: обработка данных, полученных в ходе опроса, наблюдения или тестирования сотрудников организации, оценка социально-психологического климата, неформальной структуры группы.

Социально-медицинские исследования: обработка данных, полученных в ходе опроса пациентов, наблюдения или оценки результатов анализов.

Конструирование и обработка данных психологических тестов:

- стандартизация тестов для различных групп испытуемых;

- оценка дискриминативности исходных и объективных показателей;

- расчет результатов тестирования;

- определение процентилей и СТЭНов.

<== предыдущая лекция | следующая лекция ==>
Средства компьютационной социологии | Инструменты для компьютерной обработки социологических данных
Поделиться с друзьями:


Дата добавления: 2014-01-20; Просмотров: 8946; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.008 сек.