Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Основные идеи и понятия

Сглаживание данных

Анализ временных рядов - Две основные цели.

Имеются две основные цели анализа временных рядов:

а) определение природы ряда;

б) прогнозирование (предсказание будущих значений временного ряда по настоящим и прошлым значениям).

Обе эти цели требуют, чтобы модель ряда была идентифицирована и, более или менее, формально описана. Как только модель определена, Вы можете с ее помощью интерпретировать рассматриваемые данные (например, использовать в Вашей теории для понимания сезонного изменения цен на товары, если занимаетесь экономикой). Не обращая внимания на глубину понимания и справедливость теории, Вы можете экстраполировать затем ряд на основе найденной модели, т.е. предсказать его будущие значения.

В дальнейшем нам понадобятся очень важные понятия, использующиеся в анализе временных рядов, такие как: тренд ряда, циклическая составляющая ряда, трендциклическая компонента ряда, сезонная составляющая ряда и шумовая компонента или просто шум. Дадим краткое пояснение данным элементам:

1. Формально Временной ряд - это ряд наблюдений анализируемой случайной величины , произведенных в последовательные моменты времени . В чем же состоят принципиальные отличия ряда от простой последовательности наблюдений, образующих случайную выборку? Этих отличий два:

 

Рисунок 1. График временного ряда.

Во-первых, в отличие от элементов случайной выборки члены временного ряда не являются статистически независимыми.

Во-вторых, члены временного ряда не являются одинаково распределенными, т.е. верно следующее соотношение между вероятностями.

2. Трендом называют неслучайную функцию, формируемую под действием общих или долговременных тенденций, влияющих на наш ряд. Например, в качестве формирующей тенденции, может выступать фактор роста исследуемого рынка.

Не существует автоматического способа обнаружения тренда в временном ряде. Однако если тренд является монотонным (устойчиво возрастает или устойчиво убывает), то анализировать такой ряд обычно нетрудно. Если временные ряды содержат значительную ошибку, то первым шагом выделения тренда является сглаживание.

Сглаживание. Сглаживание всегда включает некоторый способ локального усреднения данных, при котором несистематические компоненты взаимно погашают друг друга. Самый общий метод сглаживания - скользящее среднее, в котором каждый член ряда заменяется простым или взвешенным средним n соседних членов, где n - ширина окна. Вместо среднего можно использовать медиану значений, попавших в окно. Основное преимущество медианного сглаживания, в сравнении со сглаживанием скользящим средним, в том, что результаты становятся более устойчивыми к выбросам (имеющимся внутри окна). Таким образом, если в данных имеются выбросы (связанные, например, с ошибками измерений), то сглаживание медианой обычно приводит к более гладким или, по крайней мере, более надежным кривым, по сравнению со скользящим средним с тем же самым окном. Основной недостаток медианного сглаживания в том, что при отсутствии явных выбросов, он приводит к более зубчатым кривым (чем сглаживание скользящим средним) и не позволяет использовать веса.

Все эти быстрые преобразования присутствуют в модуле Временные ряды. Относительно реже, когда ошибка измерения очень большая, используется сглаживание методом наименьших квадратов, взвешенных относительно расстояния или метод отрицательного экспоненциально взвешенного сглаживания. Все эти методы отфильтровывают шум и преобразуют данные в относительно гладкую кривую. Ряды с относительно небольшим количеством наблюдений и систематическим расположением точек могут быть сглажены с помощь бикубических сплайнов.

Подгонка функции. Многие монотонные временные ряды можно адекватно приблизить линейной функцией. Если же имеется явная монотонная нелинейная компонента, то данные вначале следует преобразовать, чтобы устранить нелинейность. Обычно для этого используют логарифмическое, экспоненциальное или (менее часто) полиномиальное преобразование данных. Имеется несколько способов выполнить эти преобразования в STATISTICA. Можно экспериментировать с преобразованиями практически неограниченной сложности, используя формулы таблиц исходных данных и далее анализировать преобразованные ряды с помощью линейной регрессии (в модуле Множественная регрессия или в модуле Временные ряды) и строить прогноз (Множественная регрессия). Нелинейные функции практически неограниченной сложности, включая кусочно-линейные с точками разрыва (различные функции могут быть одновременно подогнаны на различных участках ряда) могут быть получены в модуле Нелинейное оценивание. Наконец, STATISTICA предлагает подгонку различных кривых: полиномов (с определенным пользователем порядком), логарифмических функций (с определенным пользователем основанием), экспоненциальных и других.

3. Циклической компонентой также является неслучайная функция, обусловленная действием долговременных циклов различной природы.

4. Для удобства, вместо предыдущих двух понятий используют совместное понятие трендциклической компоненты (см. Классическая сезонная декомпозиция (Метод Census I)). Характер поведения отображен на рисунке.

 

Рисунок 2. График трендцицклической компоненты временного ряда.

5. Понятие сезон временного ряда или сезонная компонента используется для обозначения неслучайной функции. Данная функция формируется на основе периодически повторяющихся в определенное время года колебаний исследуемого ряда. Часто данную функцию измеряют в процентах, которые характеризуют сезонные отклонения от трендциклической компоненты. Пример данной функции приведен на рисунке.

 

 

Рисунок 3. График сезонной компоненты временного ряда.

Периодическая и сезонная зависимость (сезонность) представляет собой другой общий тип компонент временного ряда. Это понятие было проиллюстрировано ранее на примере авиаперевозок пассажиров. Можно легко видеть, что каждое наблюдение очень похоже на соседнее; дополнительно, имеется повторяющаяся сезонная составляющая, это означает, что каждое наблюдение также похоже на наблюдение, имевшееся в том же самом месяце год назад. В общем, периодическая зависимость может быть формально определена как корреляционная зависимость порядка k между каждым i-м элементом ряда и (ik)-м элементом. Ее можно измерить с помощью автокорреляции (т.е. корреляции между самими членами ряда); k обычно называют лагом (иногда используют эквивалентные термины: сдвиг, запаздывание). Если ошибка измерения не слишком большая, то сезонность можно определить визуально, рассматривая поведение членов ряда через каждые k временных единиц.

Автокорреляционная коррелограмма. Сезонные составляющие временного ряда могут быть найдены с помощью коррелограммы. Коррелограмма (автокоррелограмма) показывает численно и графически автокорреляционную функцию (AКФ), иными словами коэффициенты автокорреляции (и их стандартные ошибки) для последовательности лагов из определенного диапазона (например, от 1 до 30). На коррелограмме обычно отмечается диапазон в размере двух стандартных ошибок на каждом лаге, однако обычно величина автокорреляции более интересна, чем ее надежность, потому, что интерес в основном представляют очень сильные (а, следовательно, высоко значимые) автокорреляции.

Исследование коррелограмм. При изучении коррелограмм следует помнить, что автокорреляции последовательных лагов формально зависимы между собой. Рассмотрим следующий пример. Если первый член ряда тесно связан со вторым, а второй с третьим, то первый элемент должен также каким-то образом зависеть от третьего и т.д. Это приводит к тому, что периодическая зависимость может существенно измениться после удаления автокорреляций первого порядка, т.е. после взятия разности с лагом 1. Взятие разности также удаляет тренд, который обычно подавляет другие автокорреляции. Например, если имеется устойчивый линейный тренд, как в ряде авиаперевозок, то каждое наблюдение в большой степени является линейной функцией предыдущего наблюдения.

Частные автокорреляции. Другой полезный метод исследования периодичности состоит в исследовании частной автокорреляционной функции (ЧАКФ), представляющей собой углубление понятия обычной автокорреляционной функции. В ЧАКФ устраняется зависимость между промежуточными наблюдениями (наблюдениями внутри лага). Другими словами, частная автокорреляция на данном лаге аналогична обычной автокорреляции, за исключением того, что при вычислении из нее удаляется влияние автокорреляций с меньшими лагами. На лаге 1 (когда нет промежуточных элементов внутри лага), частная автокорреляция равна, очевидно, обычной автокорреляции. На самом деле, частная автокорреляция дает более чистую картину периодических зависимостей.

Удаление периодической зависимости. Как отмечалось выше, периодическая составляющая для данного лага k может быть удалена взятием разности соответствующего порядка. Это означает, что из каждого i-го элемента ряда вычитается (i-k)-й элемент. Имеются два довода в пользу таких преобразований.

Во-первых, таким образом можно определить скрытые периодические составляющие ряда. Напомним, что автокорреляции на последовательных лагах зависимы. Поэтому удаление некоторых автокорреляций изменит другие автокорреляции, которые, возможно, подавляли их, и сделает некоторые другие сезонные составляющие более заметными.

Во-вторых, удаление сезонных составляющих делает ряд стационарным, что необходимо для применения АРПСС и других методов, например, спектрального анализа.

6. Шумом во временном ряде, называют случайные не поддающиеся регистрации величины. Как и большинство других видов анализа, анализ временных рядов предполагает, что данные содержат систематическую составляющую (обычно включающую несколько компонент) и случайный шум (ошибку), который затрудняет обнаружение регулярных компонент. Большинство методов исследования временных рядов включает различные способы фильтрации шума, позволяющие увидеть регулярную составляющую более отчетливо.

 

<== предыдущая лекция | следующая лекция ==>
 | 
Поделиться с друзьями:


Дата добавления: 2014-01-07; Просмотров: 313; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.01 сек.