Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Лекция 2. Интеллектуальный анализ данных в СУБД MicrosoftSQLServer




Интеллектуальный анализ данных в СУБД MicrosoftSQLServer

Постоянное обучение, начиная со школы до пенсионного возраста.

Совести.

Культурно-исторического релятивизма.

Лакатос.

595. В.Виндельбанд, Г.Риккерт, считавшие ценность формой трансцендентальной нормы, являются представителями аксиологической концепции:

1. Персоналистского онтологизма.

2. Социологизма.

3. Трансцендентализма.

4. Натуралистического психологизма.

596. Наука, предлагаемая Кудайбердиевым, для введения в систему образования о:

1. Жизни.

2. Человеке.

3. Добре.

4. Справедливости.

597. Непрерывное образование:

2. Периодическое участие в мероприятиях по повышению квалификации.

3. Обновление устаревших знаний.

4. Совершенствование профессиональной деятельности.

5. Послевузовское обучение.

598. Престиж образования определяет:

1. Уровень материального вознаграждения.

2. Признание значимости знаний обществом.

3. Уровень морального удовлетворения.

4. Материальное обеспечение образования.

5. Бесплатность, всеобщность образования.

599. Гуманитаризация образования:

1. Усиление внимания к изучению гуманитарных дисциплин.

2. Гуманное отношения учителя к учащимся.

3. Оказание помощи школам, институтам со стороны гуманитарных фондов.

4. Создания условий для полноценного обучения.

5. Компьютеризация обучения.

600. Образование осуществляет функцию:

1. Социальной защищенности.

2. Генератора культурного достояния общества.

3. Социальной мобильности.

4. Хранителя культурного достояния общества.

5. Производства блага.

 

 

 

 

 

Аннотация: В лекции рассматривается архитектура СУБД Microsoft SQL Server, место занимаемое в ней аналитическими службами, а также способы их взаимодействия с внешними приложениями. Приводится перечень алгоритмов интеллектуального анализа, входящих в поставку SQL Server 2008 и описываются имеющиеся различия между версиями СУБД.

Ключевые слова: СУБД, server, ПО, DMX, ссылка, работ, отношение, алгоритм, поиск, SQL, дерево принятия решений, standard, enterprise, developer, MSDN, ADO, net,HTTP, OLAP

Рассмотрим реализацию средств интеллектуального анализа данных в СУБДMicrosoftSQLServer. Как было отмечено в предыдущей лекции, решаются эти задачи службами AnalysisServices. На рисунке 2.1 схематично представлены компоненты СУБДMSSQLServer 2008 и выделена подсистема интеллектуального анализа данных [5].


Рис. 2.1. Службы и компоненты СУБД MicrosoftSQLServer 2008

Службы AnalysisServices предоставляют следующие функции и средства для создания решений по интеллектуальному анализу данных:

набор стандартных алгоритмов интеллектуального анализа данных;

конструктор интеллектуального анализа данных, предназначенный для создания и просмотра моделей интеллектуального анализа данных, управления ими и построения прогнозов;

язык расширений интеллектуального анализа данных(DataMiningeXtensionstoSQL,DMX).

Для работы с предоставляемыми средствами интеллектуального анализа используется среда BusinessIntelligenceDevelopmentStudio, сокращенно BIDevStudio (рис. 2.2, 2.3).

Рис. 2.2. Запуск SQL Server Business Intelligence Development Studio

Рис. 2.3. Создание нового проекта в BusinessIntelligenceDevelopmentStudio

Также SQLServer 2008 и 2008 R2 поддерживают создание, управление и использование моделей интеллектуального анализа данных из MicrosoftExcel с помощью Надстроек интеллектуального анализа данных SQLServer 2008 для Office 2007. Надстройки свободно доступны для скачивания на сайте Microsoftпо адресу (ссылка приводится для локализованной версии, возможно, выпущены более свежие версии): http://www.microsoft.com/downloads/ru-ru/details.aspx?FamilyID=a42c6fa1-2ee8-43b5-a0e2-cd30d0323ca3&displayLang=ru

Выполнению интеллектуального анализа данных с помощью надстроек посвящена первая часть лабораторных работ данного курса.

Введем ряд понятий [5]. Структура интеллектуального анализа данных может быть представлена как совокупность исходных данных и описания способов их обработки. Структура содержит модели, которые используются для анализа ее данных. В частности, одна структура может поддерживать несколько моделей. В структуре интеллектуального анализа данных можно выделить обучающий и проверочный набор данных, задав процентное отношение или объем данных.

Модель интеллектуального анализа данных представляет собой сочетание самих данных, алгоритма интеллектуального анализа данных и коллекции значений параметров и фильтров, управляющих использованием и обработкой данных. Модель интеллектуального анализа данных определяется на языке расширений интеллектуального анализа данных или с помощью мастера интеллектуального анализа данных в среде BI DevStudio.

Алгоритм интеллектуального анализа данных представляет собой механизм, создающий модель интеллектуального анализа данных. Чтобы создать модель, алгоритм сначала анализирует набор данных, осуществляя поиск определенных закономерностей и трендов. Алгоритм использует результаты этого анализа для определения параметров модели интеллектуального анализа данных. Затем эти параметры применяются ко всему набору данных, чтобы выявить пригодные к использованию закономерности и получить подробную статистику.

Ниже перечислены алгоритмы интеллектуального анализа данных, реализованные в MicrosoftSQLServer 2008 R2 (указание на Майкрософт говорит о том, что это ее реализации алгоритмов, а приводимые английские названия понадобятся нам в дальнейшем):

1. упрощенный алгоритм Байеса (Майкрософт) - MicrosoftNaiveBayes;

2. алгоритм дерева принятия решений (Майкрософт) - MicrosoftDecisionTrees;

3. алгоритм временных рядов (Майкрософт) - MicrosoftTimeSeries;

4. алгоритм кластеризации (Майкрософт) - MicrosoftClustering;

5. алгоритм кластеризации последовательностей (Майкрософт) - MicrosoftSequenceClustering;

6. алгоритм взаимосвязей Майкрософт - MicrosoftAssociationRules;

7. алгоритм нейронной сети (Майкрософт) - MicrosoftNeuralNetwork;

8. алгоритм линейной регрессии (Майкрософт) - MicrosoftLinearRegression;

9. алгоритм логистической регрессии (Майкрософт) - MicrosoftLogisticRegression.

Подробно с перечисленными алгоритмами мы познакомимся в следующих разделах, сейчас же приведем некоторые примеры использования интеллектуального анализа данных и соответствующие им алгоритмы [6].

Таблица 2.1. Примеры использования алгоритмов интеллектуального анализа
Задача и пример Подходящие алгоритмы
Прогнозирование дискретного атрибута. Например, купит ли получатель целевой рассылки определенный продукт. Алгоритм дерева принятия решений. Упрощенный алгоритм Байеса. Алгоритм кластеризации. Алгоритм нейронной сети.
Прогнозирование непрерывного атрибута. Например, прогноз продаж на следующий год. Алгоритм дерева принятия решений. Алгоритм временных рядов.
Прогнозирование последовательности. Например, анализ маршрута перемещения по веб-узлу компании. Алгоритм кластеризации последовательностей
Нахождение групп общих элементов в транзакциях. Например, использование анализа покупательского поведения для предложения дополнительных продуктов заказчику. Алгоритм взаимосвязей Алгоритм дерева принятия решений
Нахождение групп схожих элементов. Например, разбиение демографических данных на группы для лучшего понимания связей между атрибутами. Алгоритм кластеризации. Алгоритм кластеризации последовательностей.

 

Два слова надо сказать и о различиях в версиях СУБД MicrosoftSQLServer 2008 и 2008 R2,в которых доступны средства интеллектуального анализа данных. Это версии Standard, Enterprise, а также версия для разработчиков Developer, функционально аналогичная Enterprise, но отличающаяся от нее лицензионными условиями использования. В таблице 2.2 приведены результаты сравнения возможностей (в соответствии со статьей MSDN "Возможности, поддерживаемые различными выпусками SQLServer 2008", http://msdn.microsoft.com/ru-ru/library/cc645993(v=SQL.100).aspx). По ходу изложения материала, тема различия версий СУБД еще будет неоднократно затрагиватьсяи некоторые непонятные пока возможности будут подробно рассмотрены.

Таблица 2.2. Различия версий СУБД MicrosoftSQLServer 2008 в области интеллектуального анализа данных
Возможность Enterprise/ Developer Standard
Стандартные алгоритмы Да Да
Средства интеллектуального анализа данных: мастера, редакторы, построители запросов Да Да
Перекрестная проверка Да  
Модели на фильтрованных подмножествах структур интеллектуального анализа данных Да  
Временные ряды: пользовательское объединение моделей ARTXP и ARIMA Да  
Временные ряды: прогноз новых данных Да  
Неограниченные параллельные запросы интеллектуального анализа данных Да  
Дополнительная настройка алгоритмов Да  
API-интерфейс для подключаемых модулей алгоритмов Да  
Параллельная обработка модели Да  
Временные ряды: прогноз перекрестных рядов Да  
Неограниченные атрибуты для правил взаимосвязи Да  
Прогнозирование последовательности Да  
Множественные цели прогнозирования для упрощенного алгоритма Байеса, нейронной сети и логистической регрессии Да  

В заключение рассмотрим схему взаимодействия аналитических служб SQLServer с внешними приложениями (рис. 2.4) [13 ].

Рис. 2.4. Схема взаимодействия аналитических служб SQLServer с внешними приложениями

На рисунке 2.4 видно, что внешние приложения, используя разнообразные средства (ADO.Net и др.) и протокол XMLA(XMLforAnalysis) "поверх" протоколаTCP или HTTP(характерно для web-решений) могут взаимодействовать с аналитическими службами. При этом, в зависимости от типа запроса, задействуется или подсистема OLAP,или подсистема интеллектуального анализа данных. Обрабатываться запросы интеллектуального анализа могут с помощью как стандартных алгоритмов Майкрософт, так и алгоритмов разработки третьих фирм. Результат посредством XMLA передается обратно приложению.

 




Поделиться с друзьями:


Дата добавления: 2014-12-08; Просмотров: 799; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.007 сек.