КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Кластерный анализ в Excel
Программа Excel из состава пакета MS Office является стандартным средством хранения и обработки числовой информации. Кроме того, благодаря встроенному языку программирования Visual Basic for Application (VBA), пользователи этой программы имеют уникальную возможность создавать собственные приложения, ориентированные на решение специализированных задач практически любой степени сложности. В данном случае средствами VBA реализован один из наиболее используемых методов статистических исследований – кластерный анализ. В программе выполняется алгоритм иерархической кластеризации, в качестве меры сходства объектов используется эвклидово расстояние (Q- тип) или парный коэффициент корреляции (R-тип). Программа представляет собой надстройку Excel (файл с расширением имени xla). Чтобы установить программу, надо выполнить следующие действия: в меню Сервис выбрать команду Надстройки; нажать кнопку Обзор и найти файл, содержащий программу; в окне Список надстроек появится название надстройки “Cluster” с установленным флажком. Нажимаете кнопку ОК и после этого программа готова к использованию. В Excel появится дополнительная панель инструментов с двумя кнопками: Q и R, соответственно для анализа Q и R типа. Загрузив файл, содержащий данные, следует выделить диапазон ячеек, первая строка которого обязательно должна содержать имена переменных, а первая колонка – номера образцов (анализов и т.п.). Выделение может состоять из нескольких областей. Таким образом можно, например, исключать из расчета некоторые переменные или анализы. Пример такого выделения показан на рисунке. Многодиапазонное выделение выполняется при нажатой клавише Ctrl. После выделения данных кнопкой на панели инструментов активизируется процедура кластерного анализа Q или R типа. Процесс вычислений контролируется индикатором выполнения. После завершения расчетов на листе появится окно, содержащее дендрограмму, построенную по результатам кластерного анализа. Полученный график можно редактировать и распечатать непосредственно из Excel или перенести, воспользовавшись буфером обмена, в какой-либо графический редактор, например, в CorelDraw. Векторный формат изображения удобен для редактирования при подготовке иллюстрационной графики. Основным преимуществом данного подхода является возможность избежать утомительной процедуры экспорта данных из Excel в программу, выполняющую статистические вычисления, что существенно экономит время.
Дата добавления: 2014-11-28; Просмотров: 11371; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |