КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Дерево решений 2 страница
Для непрерывных и дискретных данных рассчитываются различные статистические показатели. Для непрерывных данных рассчитывается: • количество значений - количество значений, присутствующих • минимальное значение - минимальное значение, • максимальное значение - максимальное значение,
450 Использование основных объектов конфигурации Анализ и прогнозирование данных
• среднее значение - среднее арифметическое значений • размах - разность между максимальным и минимальным • стандартное отклонение - среднее квадратичное отклонение • медиана - значение, лежащее в середине выборки Для дискретных данных рассчитывается: • количество значений - общее количество значений, • количество уникальных значений - количество уникальных • мода - значение, наиболее часто встречающееся в исходной Кроме того, для дискретных значений рассчитывается таблица частот, содержащая следующие показатели: • частота - количество вхождений уникального значения в • относительная частота - частота, выраженная в процентах • накопленная частота - сумма частоты значения и частот всех • накопленная относительная частота - сумма относительной При выводе отчета при помощи построителя отчета анализа данных, будет создана круговая диаграмма по относительной частоте значений в выборке. Типы колонок источника данных: • Не используется - колонка не участвует в анализе, • Входная - содержит исходные данные для анализа. Параметры анализа данных при общестатистическом анализе не задаются. Пример
качестве примера общестатистического анализа рассмотрим анализ данных, содержащихся в регистре накопления «Продажи». Для анализа выберем все записи регистра, в которых нас будут интересовать значение ресурсов «Сумма», «Количество» и значение измерения «Контрагент». Допустим, мы будем иметь следующие исходные данные для анализа:
452 Использование основных объектов конфигурации Анализ и прогнозирование данных
Результат анализа будет выглядеть следующим образом: Общая статистика Информация о данных Количествообьектов: 20 Непрерывные поля Дискретные поля Контрагент Количество значений: 20 Количествоуникальных значений; 6 Мода: Федоров Д.Е.
Таблица частот Поиск ассоциаций
ип анализа АнализДанныхПоискАссоциаций предназначен для поиска часто встречаемых вместе групп объектов или значений характеристик, а также выполняет поиск правил ассоциаций. Этот тип анализа может использоваться для определения часто приобретаемых вместе товаров или услуг. Типы колонок источника данных: • Не используется - колонка не используется в анализе. • Объект - колонка содержит объект, например документ • Элемент - колонка содержит элемент, например Параметры: • МинимальныйПроцентСлучаев - (Число) - минимальный • МинимальнаяДостоверностъ - (Число) - минимальная • МинималънаяЗначимостъ - (Число) - минимальная • ПоискПоИерархии - (Булево) - необходимость поиска по • ТипОтсеченияПравил - (избыточные, покрытые) - тип • ТипИсточникаДанных - (объектный, событийный) - тип
454 Использование о сновных объектов конфигурации Анализ и прогнозирование данных
объект с его характеристиками. Событийный - источник данных содержит список событий. Например, состав документа «Оказание услуги». ИспользованиеЧисловыхЗначений ~ (как булево, как число) как интерпретировать числовые значения. Можно интерпретировать числовые значения как числа или как логические значения, т.е. рассматривать ноль как Ложь, а все остальные ненулевые значения как Истина. ИгнорироватьНезаполненныеЗначения ~ (Булево) - Как использовать незаполненные значения. Т.е. игнорировать их или нет. Порядок - (по достоверности, по значимости, по количеству случаев) - определяет порядок отображения данных в результате анализа. Пример качестве примера возьмем данные регистра «Продажи»: поле «Регистратор» и измерение «Номенклатура»:
456 Использование основных объектов конфигурации Анализ и прогнозирование данных
Результат анализа будет выглядеть следующим образом: Поиск ассоциативных правил Параметры анализа Минимальный процент случаев: Минимальнаядостоверность: 60 Минимальная значимость: 0 Отсечениеправил: Избыточные Колонки источника данных Входные колонки Информация о данньк Количество элементов: 12 Количество обьектов: 11 Средиее количество элементов в объекте: 1,82 Результат анализа Найдено часто встречаемых групп: 4 Найдено ассоциативных правил: 5 Часто встречаемые группы Поиск последовательностей
ип анализа АнализДанныхПоискПоследовательностей предназначен для выявления в источнике данных последовательных цепочек событий. Например, это может быть цепочка услуг, которые часто последовательно заказывают клиенты. Поддерживается поиск по иерархии, что позволяет отслеживать не только последовательности конкретных событий, но и последовательности родительских групп. Набор параметров анализа позволяет ограничивать временные расстояния между элементами искомых последовательностей, а также регулировать точность получаемых результатов. Типы колонок источника данных: • Не используется - колонка не используется в анализе. • Элемент - колонка содержит исследуемый элемент. • Последовательность - колонка содержащая • Время - время события. Параметры: • МинимальныйПроцентСлучаев - (Число) - минимальное • ПоискПоИерархии - (Булево) - необходимо ли осуществлять • МинимальныйИнтервал - (Булево) - признак того, что • ЕдиницаМинимальногоИнтервала - единица минимального
458 Использование основных объектов конфигурации Анализ и прогнозирование данных
КратностъМинималъногоИнтервала - (Число) - кратность минимального интервала МаксималъныйИнтервал - (Булево) - признак того, что установлен максимальный интервал между наблюдаемыми событиями. Установка максимального интервала означает, что для того, чтобы элементы попали в искомую последовательность необходимо, чтобы временной интервал между элементами был не более установленного. ЕдиницаМаксималъногоИнтервала - единица максимального интервала КратностъМаксималъногоИнтервала - (Число) - кратность максимального интервала ИнтервапЭквивалентностиВремени - (Булево) - признак того, что установлен интервал эквивалентности времени между наблюдаемыми событиями. Если установлен интервал эквивалентности времени, то события, временной интервал между которыми меньше интервала эквивалентности времени считаются произошедшими в одно время. ЕдиницаИнтервалаЭквталентностиВремени — единица интервала эквивалентности времени КратностьИнтервалаЭквталентностиВремени - (Число) - кратность интервала эквивалентности времени Минимальная длина - (Число) - минимальная длина последовательности. Порядок - (по длине, по количеству случаев) - определяет порядок отображения данных в результате анализа. Пример качестве примера снова возьмем данные регистра «Продажи»: измерения «Номенклатура», «Контрагент» и поле «Период»:
460 Использование основных объектов конфигурации Анализ и прогно зирование данных
Результат анализа будет выглядеть следующим образом: Поиск последовательностей Параметры анализа Минимальный процент случаев: 10 Минимальный интервал: Максимальный интервал: Интервал эквивалентности времени: Минимальная длина последовательности: 2 Информация о данных Количество элементов: 12 Количество последовательностей: 6 Результат анализа Найдено последовательностей: 2 Последовательности Дерево решений
ип анализа АнализДанныхДеревоРешении дерево решений позволяет построить иерархическую структуру классифицирующих правил, представленную в виде дерева. Для построения дерева решений необходимо выбрать целевой атрибут, по которому будет строиться классификатор и ряд входных атрибутов, которые будут использоваться для создания правил. Целевой атрибут может содержать, например информацию о том, перешел ли клиент к другому поставщику услуг, удачна ли была сделка, качественно ли была выполнена работа и т.д. Входными атрибутами, для примера, могут выступать возраст сотрудника, стаж его работы, материальное состояние клиента, количество сотрудников в компании и т.п. Результат работы анализа представляется в виде дерева, каждый узел которого содержит некоторое условие. Для принятия решения к какому классу следует отнести некий новый объект, необходимо отвечая на вопросы в узлах пройти цепочку от корня до листа дерева, переходя к дочерним узлам в случае утвердительного ответа и к соседнему узлу в случае отрицательного. Набор параметров анализа позволяет регулировать точность полученного дерева. Типы колонок источника данных: • Неиспользуемая - колонка не используется в анализе, • Входная - колонка будет использоваться как атрибут для • Прогнозируемая - колонка, содержащая классификацию. Параметры: • МинимальноеКоличествоСлучаев - (Число) - минимальное • МаксимальнаяГлубина - (Число) - максимальная глубина • ТипУпрощения - (не упрощать, упрощать) - тип упрощения
462 Использование основных объектов конфигурации Анализ и прогнозирование данных
Пример
а этот раз мы проанализируем данные справочника «КоличествоРозничныхТочек», «КоличествоАвтомобилей» «ВремяРаботыОрганизации» и «ВремяЗаключенияДоговора»' Прогнозируемой колонкой будет поле реквизита справочника «Контрагенты» - «ПрекращениеОтношений». Результат анализа будет иметь следующий вид: Параметры анализа Минимальноеколичествоэлементов вузле: 0 Максимальная глубина дерева: 1 000 Тип упрощения дерева решений: Упрошать Колонки источника данных Входные колонки
Прогнозируемые колонки
Информация о данных Количество объектов Количество классов: Результат анализа Глубина дерева решений: Количество внутренних узлов: Количество листьев' Ошибка, %:
Дата добавления: 2014-11-16; Просмотров: 511; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |