КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Лекция 2. Интеллектуальный анализ данных в СУБД MicrosoftSQLServer
Интеллектуальный анализ данных в СУБД MicrosoftSQLServer Постоянное обучение, начиная со школы до пенсионного возраста. Совести. Культурно-исторического релятивизма. Лакатос. 595. В.Виндельбанд, Г.Риккерт, считавшие ценность формой трансцендентальной нормы, являются представителями аксиологической концепции: 1. Персоналистского онтологизма. 2. Социологизма. 3. Трансцендентализма. 4. Натуралистического психологизма. 596. Наука, предлагаемая Кудайбердиевым, для введения в систему образования о: 1. Жизни. 2. Человеке. 3. Добре. 4. Справедливости. 597. Непрерывное образование: 2. Периодическое участие в мероприятиях по повышению квалификации. 3. Обновление устаревших знаний. 4. Совершенствование профессиональной деятельности. 5. Послевузовское обучение. 598. Престиж образования определяет: 1. Уровень материального вознаграждения. 2. Признание значимости знаний обществом. 3. Уровень морального удовлетворения. 4. Материальное обеспечение образования. 5. Бесплатность, всеобщность образования. 599. Гуманитаризация образования: 1. Усиление внимания к изучению гуманитарных дисциплин. 2. Гуманное отношения учителя к учащимся. 3. Оказание помощи школам, институтам со стороны гуманитарных фондов. 4. Создания условий для полноценного обучения. 5. Компьютеризация обучения. 600. Образование осуществляет функцию: 1. Социальной защищенности. 2. Генератора культурного достояния общества. 3. Социальной мобильности. 4. Хранителя культурного достояния общества. 5. Производства блага.
Аннотация: В лекции рассматривается архитектура СУБД Microsoft SQL Server, место занимаемое в ней аналитическими службами, а также способы их взаимодействия с внешними приложениями. Приводится перечень алгоритмов интеллектуального анализа, входящих в поставку SQL Server 2008 и описываются имеющиеся различия между версиями СУБД. Ключевые слова: СУБД, server, ПО, DMX, ссылка, работ, отношение, алгоритм, поиск, SQL, дерево принятия решений, standard, enterprise, developer, MSDN, ADO, net,HTTP, OLAP Рассмотрим реализацию средств интеллектуального анализа данных в СУБДMicrosoftSQLServer. Как было отмечено в предыдущей лекции, решаются эти задачи службами AnalysisServices. На рисунке 2.1 схематично представлены компоненты СУБДMSSQLServer 2008 и выделена подсистема интеллектуального анализа данных [5].
Службы AnalysisServices предоставляют следующие функции и средства для создания решений по интеллектуальному анализу данных: набор стандартных алгоритмов интеллектуального анализа данных; конструктор интеллектуального анализа данных, предназначенный для создания и просмотра моделей интеллектуального анализа данных, управления ими и построения прогнозов; язык расширений интеллектуального анализа данных(DataMiningeXtensionstoSQL,DMX). Для работы с предоставляемыми средствами интеллектуального анализа используется среда BusinessIntelligenceDevelopmentStudio, сокращенно BIDevStudio (рис. 2.2, 2.3). Рис. 2.2. Запуск SQL Server Business Intelligence Development Studio Рис. 2.3. Создание нового проекта в BusinessIntelligenceDevelopmentStudio Также SQLServer 2008 и 2008 R2 поддерживают создание, управление и использование моделей интеллектуального анализа данных из MicrosoftExcel с помощью Надстроек интеллектуального анализа данных SQLServer 2008 для Office 2007. Надстройки свободно доступны для скачивания на сайте Microsoftпо адресу (ссылка приводится для локализованной версии, возможно, выпущены более свежие версии): http://www.microsoft.com/downloads/ru-ru/details.aspx?FamilyID=a42c6fa1-2ee8-43b5-a0e2-cd30d0323ca3&displayLang=ru Выполнению интеллектуального анализа данных с помощью надстроек посвящена первая часть лабораторных работ данного курса. Введем ряд понятий [5]. Структура интеллектуального анализа данных может быть представлена как совокупность исходных данных и описания способов их обработки. Структура содержит модели, которые используются для анализа ее данных. В частности, одна структура может поддерживать несколько моделей. В структуре интеллектуального анализа данных можно выделить обучающий и проверочный набор данных, задав процентное отношение или объем данных. Модель интеллектуального анализа данных представляет собой сочетание самих данных, алгоритма интеллектуального анализа данных и коллекции значений параметров и фильтров, управляющих использованием и обработкой данных. Модель интеллектуального анализа данных определяется на языке расширений интеллектуального анализа данных или с помощью мастера интеллектуального анализа данных в среде BI DevStudio. Алгоритм интеллектуального анализа данных представляет собой механизм, создающий модель интеллектуального анализа данных. Чтобы создать модель, алгоритм сначала анализирует набор данных, осуществляя поиск определенных закономерностей и трендов. Алгоритм использует результаты этого анализа для определения параметров модели интеллектуального анализа данных. Затем эти параметры применяются ко всему набору данных, чтобы выявить пригодные к использованию закономерности и получить подробную статистику. Ниже перечислены алгоритмы интеллектуального анализа данных, реализованные в MicrosoftSQLServer 2008 R2 (указание на Майкрософт говорит о том, что это ее реализации алгоритмов, а приводимые английские названия понадобятся нам в дальнейшем): 1. упрощенный алгоритм Байеса (Майкрософт) - MicrosoftNaiveBayes; 2. алгоритм дерева принятия решений (Майкрософт) - MicrosoftDecisionTrees; 3. алгоритм временных рядов (Майкрософт) - MicrosoftTimeSeries; 4. алгоритм кластеризации (Майкрософт) - MicrosoftClustering; 5. алгоритм кластеризации последовательностей (Майкрософт) - MicrosoftSequenceClustering; 6. алгоритм взаимосвязей Майкрософт - MicrosoftAssociationRules; 7. алгоритм нейронной сети (Майкрософт) - MicrosoftNeuralNetwork; 8. алгоритм линейной регрессии (Майкрософт) - MicrosoftLinearRegression; 9. алгоритм логистической регрессии (Майкрософт) - MicrosoftLogisticRegression. Подробно с перечисленными алгоритмами мы познакомимся в следующих разделах, сейчас же приведем некоторые примеры использования интеллектуального анализа данных и соответствующие им алгоритмы [6].
Два слова надо сказать и о различиях в версиях СУБД MicrosoftSQLServer 2008 и 2008 R2,в которых доступны средства интеллектуального анализа данных. Это версии Standard, Enterprise, а также версия для разработчиков Developer, функционально аналогичная Enterprise, но отличающаяся от нее лицензионными условиями использования. В таблице 2.2 приведены результаты сравнения возможностей (в соответствии со статьей MSDN "Возможности, поддерживаемые различными выпусками SQLServer 2008", http://msdn.microsoft.com/ru-ru/library/cc645993(v=SQL.100).aspx). По ходу изложения материала, тема различия версий СУБД еще будет неоднократно затрагиватьсяи некоторые непонятные пока возможности будут подробно рассмотрены.
В заключение рассмотрим схему взаимодействия аналитических служб SQLServer с внешними приложениями (рис. 2.4) [13 ]. Рис. 2.4. Схема взаимодействия аналитических служб SQLServer с внешними приложениями На рисунке 2.4 видно, что внешние приложения, используя разнообразные средства (ADO.Net и др.) и протокол XMLA(XMLforAnalysis) "поверх" протоколаTCP или HTTP(характерно для web-решений) могут взаимодействовать с аналитическими службами. При этом, в зависимости от типа запроса, задействуется или подсистема OLAP,или подсистема интеллектуального анализа данных. Обрабатываться запросы интеллектуального анализа могут с помощью как стандартных алгоритмов Майкрософт, так и алгоритмов разработки третьих фирм. Результат посредством XMLA передается обратно приложению.
Дата добавления: 2014-12-08; Просмотров: 799; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |