Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Структура витрат науково-дослідних та дослідно-конструкторських робіт світових кампаній




Процедури класифікації

Лабораторна робота 2

Модуль 2. Моделі управління інноваційними процесами

Одним із типів економічних задач є задачі класифікації. Для рішення задач цього типу в системі Statistica є два модулі – «Кластерний аналіз» і «Дискримінантний аналіз». Розглянемо роботу цих модулів на прикладах.

 

Кластерні процедури класифікації

 

У табл. 7 наведені дані про структуру витрат на науково-дослідні та дослідно-конструкторські роботи світових кампаній різних країн. Необхідно провести класифікацію кампаній за рівнем вкладень у науково-дослідні розробки методами кластерного аналізу, навести основні характеристики виділених класів, дати інтерпретацію отриманих результатів.

 


Таблиця 7

№ з/п Назва кампанії Витрати на науково-дослідні та дослідно-конструкторські роботи у 2008 р., млн. дол. США (Х1) Зміна порівняно з 2007 р. (Х2) Відсоток від загального об’єму продаж кампанії, % (Х3)
         
  Toyota 8,994 -5,7 4,4
  Nokia 8,733 5,7 11,8
  Roche Holding 8,168 5,5 19,4
  Microsoft 8,164 14,6 13,5
  General Motors 8,000 -1,2 5,4
  Pfizer 7,945 -1,8 16,5
  Johnson & Johnson 7,577 -1,3 11,9
  Ford 7,300 -2,7 5,0
  Novartis 7,217 12,2 17,4
  Sanofi-Aventis 6,695 0,8 16,6
  GlaxoSmithKline 6,425 8,3 14,4
  Samsung 6,413 16,2 5,8
  IBM 6,337 3,0 6,1
  Intel 5,722 -0,6 15,2
  Siemens 5,680 11,3 4,9
  Honda 5,603 -4,2 5,6
  Volkswagen 5,429 6,7 3,3
  AstraZeneca 5,179 0,3 16,4
  Cisco Systems 5,153 14,5 13,0
  Panasonic 5,152 -6,6 6,7

 

Запускаємо програму Statistica і формуємо таблицю (файл) вихідних даних. Для того, щоб результати аналізу були представлені наглядніше, пропонується ввести замість кампаній їхні назви. Це можна зробити подвійним натисканням кнопки миші на номері об’єкта (кампанії).

Перед тим, як проводити аналіз, зверніть увагу на те, у якому вигляді представлені вихідні дані. Якщо вихідні дані мають різні одиниці або масштаб вимірів, то перед початком аналізу їх необхідно стандартизувати. Це можна зробити наступним чином: виділити стовпці та натиснути праву кнопку миші Fill/Standardize Block → Standardize Columns. Якщо ж розмірність однакова для всіх аналізованих ознак, то стандартизацію можна не проводити.

Спочатку проведемо кластеризацію ієрархічним методом. На панелі інструментів Statistics або в меню Statistics виберемо функцію Cluster AnalysisКластерний аналіз і у вікні, що з’явилося, виберемо Ієрархічний метод кластеризаціїJoining (tree clustering). Обравши цей метод, отримаємо стартове вікно ієрархічного методу кластеризації (рис. 22).

 

Рис. 22. Стартове вікно ієрархічного методу кластерного аналізу

 

У цьому вікні оберемо змінні, за якими буде проводитися кластеризація (кнопка VariablesЗмінні). У рядку Input file необхідно задати форму представлення вихідних даних (спостережувані – Rawdata або матриця відстаней – Distance matrix). У рядку Cluster потрібно вибрати вид класифікації (класифікація Випадків (рядків)Cases (rows) або класифікація Змінних (стовпців)Variables (columns)).

Нижче вибирається алгоритм кластеризації та міра відстані.

У Statistica можна вибрати один з таких методів (алгоритмів) ієрархічного об'єднання кластерів:

Single linkage – метод одиночного зв’язку;

Complete linkage – метод повного зв’язку;

Unweighted pair-group average – незважений метод „середнього зв’язку”;

Weighted pair-group average – зважений метод „середнього зв’язку”;

Unweighted pair-group centroid – незважений центроїдний метод;

Weighted pair-group centroid (median) – зважений центроїдний метод;

Ward's method – метод Уорда.

У Statistica реалізовані такі міри відстаней: евклідова відстань, квадрат евклідової відстані, манхеттенівська відстань (або „відстань міських кварталів”), метрика Чебишева, метрика Мінковського, пірсонівський коефіцієнт кореляції та ін.

Наприклад, виберемо алгоритм Уорда й евклідову відстань (див. установки на рис. 17).

Після натискання кнопки ОК одержуємо вікно результатів ієрархічного кластерного аналізу (рис. 23). В інформаційній частині вікна зазначена така інформація: кількість аналізованих змінних і випадків (у даному разі – областей), вид класифікації, спосіб обробки пропущених значень, алгоритм кластеризації та міра відстаней. У функціональній частині вікна є ряд кнопок, що дозволяють різнобічно переглянути результати кластеризації.

 

Рис. 23. Вікно результатів кластеризації ієрархічним методом

Наглядно результати кластеризації ієрархічними методами подаються на дендрограмі (дереві класифікації), для побудови якої призначені дві кнопки у вікні результатів – Horizontal hierarchical tree plot (горизонтальна дендрограма) та Vertical icicle plot (вертикальна дендрограма). Вид дерева класифікації обирається суб’єктивно. На рис. 24 показане горизонтальне дерево класифікації областей за двома показниками.

 

Рис. 24. Горизонтальна дендрограма

 

Розглянемо отриману дендрограму. На ній наглядно представлено об’єднання кампаній у кластери. Якщо умовно „розрізати” дендрограму на рівні 6, то одержимо три кластери (класи світових кампаній за структурою витрат на науково-дослідні та дослідно-конструкторські роботи). У перший кластер увійшли 5 кампаній: Toyota, General Motors, Ford, Honda і Panasonic. У другий кластер увійшли також 5 кампаній: Samsung, IBM, Siemens, Volkswagen, Cisco Systems. У третій кластер увійшли 10 кампаній: Nokia, Microsoft, Roche Holding, Novartis, GlaxoSmithKline, Pfizer, Johnson & Johnson, Sanofi-Aventis, Intel, AstraZeneca. На дендрограмі також зазначені відстані, на яких відбулося об’єднання елементів (кампаній) у кластери, алгоритм, міра відстаней і кількість оброблених випадків.

Матрицю приєднань, у якій зазначені об'єкти (області) і відстані, на яких відбулося об'єднання областей у кластери, можна побачити, натиснувши кнопку Amalgamation schedule (список приєднань). З цього списку також можна встановити, які області об’єдналися в кластери.

Матрицю відстаней між областями можна побачити, натиснувши кнопку Distance matrix. Ініціювавши кнопку Descriptive statisticsОписова статистика, отримаємо матрицю, у якій будуть указані середні значення показників та їх стандартні відхилення для кожного об’єкта.

Проведемо кластеризацію методом k-середніх і порівняємо отримані результати.

На панелі інструментів Statistics або в меню Statistics вибрати функцію Cluster AnalysisКластерний аналіз, а у вікні, що з’явилося, вибрати ітеративний метод кластеризації – k-means clustering. Обравши цей метод, отримаємо стартове вікно для кластеризації (рис. 25).

 

Рис. 25. Стартове вікно методу k-середніх

 

У стартовому вікні аналізу вибираються змінні для класифікації (кнопка Variables), вибирається бажана кількість кластерів (Number of clusters), кількість ітерацій (Number of iterations). Тут також задаються початкові умови вибору центрів кластерів (три опції внизу): Choose observations to maximize initial between-cluster distances – вибрати як центри такі елементи, щоб максимізувати відстань між кластерами; Sort distances and take observations at constant intervals – вибрати відстані в постійних інтервалах; Choose the first N (Number of clusters) observations – як центри взяти перші N елементів (див. установки на рис. 25).

Після натискання кнопки ОК одержуємо вікно результатів кластерного аналізу методом k-середніх (рис. 26).

 

Рис. 26. Вікно результатів кластеризації методом k-середніх

 

В інформаційній частині вікна зазначена кількість показників, за якими проведена класифікація, кількість оброблених випадків, метод кластеризації, спосіб обробки пропущених значень, кількість виділених кластерів і номер ітерації, після якої закінчився процес класифікації.

У функціональній частині вікна є ряд кнопок, що дозволяють усебічно розглянути результати класифікації. Призначення кнопок наведено в табл. 8.

На графіку середніх (рис. 27) зображені середні значення змінних у кластерах. Так у перший кластер увійшли кампанії з низьким рівнем витрат на науково-дослідні та дослідно-конструкторські роботи у 2008 р. та низьким відсотком витрат на дослідницьку діяльність від загального об’єму продаж кампанії. У другій кластер увійшли кампанії, що мають найвищий показник витрат на науково-дослідні та дослідно-конструкторські роботи у 2008 р. У третій кластер увійшли кампанії, що мають найбільший рівень показника відсоток від загального об’єму продаж кампанії.

 

Таблиця 8




Поделиться с друзьями:


Дата добавления: 2014-11-29; Просмотров: 615; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.024 сек.