Курсовая Построение моделей временных рядов
Работа добавлена на сайт bukvasha.net: 2015-10-25Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
Кафедра теории рынка
Курсовая работа
по дисциплине: Эконометрика
на тему «Построение моделей временных рядов»
Вариант 16
Выполнил: Атаманчук Я.П.
Группа: ФБЭ - 81
Проверил: Тимофеев В.С.
Новосибирск 2011
Ситуация 9: “Загон для коз”. Робинзон живет на необитаемом острове и организует свой быт. Вот что пишет по этому поводу Д.Дефо: “Я задумал развести целое стадо коз, рассудив, что это единственный способ обеспечить себя мясом и молоком к тому времени, когда у меня выйдут порох и дробь. Единственным средством для этого было держать коз в загоне, огороженном прочным частоколом или плетнем так, чтобы козы не могли сломать его ни изнутри, на снаружи”. Сказано – сделано. И далее: “Я решил огородить кусок луга ярдов в полтораста длиной и сто шириной и на первый раз ограничиться этим… Этот участок я огораживал около трех месяцев, а затем перевел в этот загон всех своих коз”.
Однако через некоторое время он заметил, что молока, которое он получал со своего стада, стало не хватать для всех нужд – ведь он потреблял не только само молоко, но и получал из него сыр, масло и т.д. Проведя ревизию своего хозяйства, он выяснил, что объемы удоев стали уменьшаться из-за ухудшения качества и особенно количества кормов, т.е. травы, которая росла на участке, стало не хватать для всего стада, которое поедало ее, а времени вырасти для новой травы не хватало. Он огородил новый участок и перевел стадо туда, оставив старый участок для восстановления травяного покрова.
В нашем распоряжении есть два временных ряда: X1 – месячный уровень осадков (в миллиметрах) и X2 – среднемесячные удои молока (в галлонах), которые Робинзон составил за это время.
Цель: проведение эконометрического анализа заданных временных рядов для прогнозирования их значений.
Построить графики временных рядов. Для каждого временного ряда провести первичный статистический анализ, включая:
Вычисление среднего значения, дисперсии, меры разброса;
Вычисление автоковариационной и автокорреляционной функций;
Построение коррелограммы.
Сделать выводы.
На графике временного ряда X1(t) прослеживаются периодически повторяющиеся изменения признака. Период составляет 12 месяцев. В среднем не наблюдается долгосрочных тенденций ни к увеличению, ни к уменьшению. Влияние всех компонент временного ряда на значения элементов ряда носит аддитивный характер.
На графике наблюдается долгосрочная тенденция к уменьшению. Вместе с тем, происходят периодически повторяющиеся изменения признака. Временной ряд имеет сезонную и/или циклическую компоненту.
В момент времени (t=40), удои молока достигают наивысшего уровня. Это может объясняться наличием структурных изменений в этой точке. Очевидно, именно в этот момент Робинзон перевел свое стадо на новый участок.
Первичный статистический анализ:
а = 1N Σ x(t);
σ2 = 1N-1 Σ (xt-а) 2;
γτ= 1N-τ t=1N-τ (xt - а)(xt + τ - а));
Для временного ряда х1(t):
E[X1(t)] = а = 30,3236;
D[X1(t)] = σ2 = 17,6307;
γ(τ)=5,10348;
Средний месячный уровень осадков составляет около 30 мм. Отклонение от среднего составляет 4,1989 мм.
Для временного ряда х2(t):
E[X1(t)] = а = 7,0982;
D[X1(t)] = σ2 = 2,32944;
γτ=1,12624;
Среднемесячные удои молока в среднем составляют около 7 галлонов. Отклонение от среднего равно 1,52625 галлона молока.
Найдем значения оценок автокорреляционной функции:
Рекомендуемое количество элементов автокорреляционной функции не должно превышать N/3 18,3.
Для временного ряда х1(t):
r1 | 0,300274 |
r2 | -0,243352 |
r3 | -0,361304 |
r4 | -0,400067 |
r5 | 0,0144388 |
r6 | 0,5417388 |
r7 | 0,0207405 |
r8 | -0,433738 |
r9 | -0,415498 |
r10 | -0,284967 |
r11 | 0,245709 |
r12 | 0,9827882 |
r13 | 0,2988384 |
r14 | -0,259614 |
r15 | -0,370474 |
r16 | -0,402023 |
r17 | 0,0166211 |
r18 | 0,5434392 |
Коррелограмма для временного ряда X1(t)
Коррелограмма показывает степень статистической взаимозависимости между элементами временного ряда.
Для стационарного ряда, чем больше разнесены во времени элементы временного ряда, тем слабее их взаимосвязь.
Исходя из полученной коррелограммы можно сделать вывод о том, что временной ряд «Месячное количество осадков» не является стационарным.
Элементы временного ряда являются взаимосвязанными, что говорит о наличии сезонной компоненты.Анализ автокорреляционной функции позволяет предположить, что наиболее тесным образом связаны элементы ряда, разнесенные на 6, 12, 18 и т.д. месяцев.
Наиболее высоким для временного ряда осадков оказался коэффициент корреляции 12-го порядка, это значит, что временной ряд содержит циклические колебания в 12 месяцев.
Для временного ряда х2(t):
r1 | 0,529201 |
r2 | 0,13054468 |
r3 | 0,00722151 |
r4 | -0,0266268 |
r5 | 0,164693 |
r6 | 0,4670576 |
r7 | 0,1645495 |
r8 | -0,1266122 |
r9 | -0,1870788 |
r10 | -0,2207901 |
r11 | -0,095556 |
r12 | 0,2221958 |
r13 | -0,097639 |
r14 | -0,3676262 |
r15 | -0,4155157 |
r16 | -0,4258159 |
r17 | -0,206055 |
r18 | 0,2386529 |
Коррелограмма для временного ряда X2(t)
Исходя из полученной коррелограммы можно сделать вывод о том, что временной ряд «Среднемесячные удои молока» не является стационарным.
Элементы временного ряда являются взаимосвязанными, что говорит о наличии сезонной компоненты. Ряд среднемесячных удоев молока имеет тенденцию к снижению, т.к. максимальное значение принимает коэффициент автокорреляции 1-ого порядка.
Построить модель временного ряда. Для этого:
Записать основное разложение временного ряда и проверить гипотезу о наличии неслучайных компонент в этом разложении;
Построить модели для неслучайных компонент, присутствие которых в разложении было доказано. При построении модели в качестве возможных регрессоров рассмотреть следующие функции:
t2, t, 1t, 1t2, 1t, 13t , 14t
Привести несколько вариантов функции тренда, и обосновать выбор наилучшей;
С помощью критерия Дарбина – Уотсона проверить остатки на автокорреляцию;
Если на графике временного ряда продолжительно наблюдаются структурные изменения, то выдвинуть соответствующую гипотезу и проверить с помощью теста Чоу и подхода Гуйарати.
Сделать выводы.
По графикам временных рядов видно, что амплитуда колебаний примерно одинакова, следовательно, в качестве моделей выберем аддитивные.
Тогда получим разложение следующего вида:
X(t) = T(t) + S(t) + C(t) + ε (t)
T (t) – неслучайная, монотонная функция тренда
S (t) – неслуяайная периодическая функция с периодом, кратным «сезону»
С (t) – неслучайная периодическая функция
ε (t) – случайная составляющая
Для выявления факта наличия/отсутствия неслучайной составляющей проверим гипотезу:
Н0: E[X(t)] = const – ряд стационарный
Н1: E[X(t)] ≠ const.
Временной ряд X1 (t)
Критерий серий
.
Xmed =xN+12, если N нечетно;(xN2+ xN2+1)2, иначе.
“+”: х(t) > x med“-”: x(t) < x med
Хmed = 31; V(N) = 27; τ(N) = 4
Условия: τ(N) ≥ 1,43Ln(N+1); V(N) ≤ 0,5(N+2-1,96N-1),
Если выполняется хотя бы одно условие, то гипотеза H0 отвергается.
τ(N) < 5,756; V(N) > 21,298 , следовательно гипотеза не отвергается, а значит, неслучайные компоненты могут не присутствовать.
Критерий «восходящих» и «нисходящих» серий
“+”: x(t+1) – x(t) >0
“-”: x(t+1) – x(t) < 0
V(N) = 36; τ(N) = 3
Условия: V(N) < 132N-1-1,9616N-2990 ; τ(N) ≥ τ0 (N),
Если выполняется хотя бы одно условие, то гипотеза H0 отвергается.
τ0(N) = 5, N ≤ 266, 26< N ≤ 1537, 153 > N τ0(55)=6
V(N) > 30,306; τ(N) < 6 => гипотеза не отвергается , следовательно неслучайные компоненты могут и не присутствовать.
Критерий Фостера-Стьюарта
mt = 1, xt>xk, k=1, …(t-1)0, иначе
lt = 1, xt
dt = mt – lt , rt = mt + lt ;
D = t=2Ndt = -2
R = t=2Nrt = 10
tD = DσD , tR = R- µσR,
σD = 2lnN- 0.8456 = 2,6775
σR = 2lnN- 3.4253 = 2,1423
µ = 2t=2N1t = 3.6227
tD = -0.747; tR = 1.32146
| tD | < 2,0057
| tR| < 2.0057, следовательно, гипотеза не отвергается, а значит в структуре временного ряда отсутствуют трендовые компоненты.
Временной ряд X2 (t)
Критерий серий
.
Xmed =xN+12, если N нечетно;(xN2+ xN2+1)2, иначе.
“+”: х(t) > x med“-”: x(t) < x med
Хmed = 6,8; V(N) = 20; τ(N) = 7
Условия: τ(N) ≥ 1,43Ln(N+1); V(N) ≤ 0,5(N+2-1,96N-1),
Если выполняется хотя бы одно условие, то гипотеза H0 отвергается.
τ(N) > 5,756; V(N) < 21,298 , следовательно гипотеза отвергается, а значит неслучайные компоненты присутствуют.
Критерий «восходящих» и «нисходящих» серий
“+”: x(t+1) – x(t) >0
“-”: x(t+1) – x(t) < 0
V(N) = 35; τ(N) = 3
Условия: V(N) < 132N-1-1,9616N-2990 ; τ(N) ≥ τ0 (N),
Если выполняется хотя бы одно условие, то гипотеза H0 отвергается.
τ0(N) = 5, N ≤ 266, 26< N ≤ 1537, 153 > N τ0(55)=6
V(N) > 30,306; τ(N) < 6 => гипотеза не отвергается , следовательно неслучайные компоненты могут и не присутствовать.
Критерий Фостера-Стьюарта
mt = 1, xt>xk, k=1, …(t-1)0, иначе
lt = 1, xt
dt = mt – lt , rt = mt + lt ;
D = t=2Ndt = -8
R = t=2Nrt = 12
tD = DσD , tR = R- µσR,
σD = 2lnN- 0.8456 = 2,6775
σR = 2lnN- 3.4253 = 2,1423
µ = 2t=2N1t = 7,169
tD = -2,98785; tR = 2,25504
| tD | > 2,0057
| tR| > 2.0057, следовательно, гипотеза отвергается, а значит в структуре временного ряда присутствуют трендовые компоненты.
В силу того, что критерий «восходящих» и «нисходящих» серий говорит о возможном отсутствии неслучайных компонент во временном ряде Х2, проведем еще одну проверку ряда на наличие неслучайной компоненты при помощи критерия Аббе.
Критерий Аббе
Данный критерий служит для выявления систематического смещения значений временного ряда. Для проверки гипотезы Н0 необходимо вычислить статистику вида
A=q2σ2,
где q2=12(N-1)t=1N-1xt+1-x(t)2
Гипотеза Н0 отвергается с вероятностью ошибки 0,05, если выполняется условие
A≤1+uγN+121+uγ2,
Где uγ- квантиль стандартного нормального распределения для доверительной вероятности γ=0,95.
Для модели времянного ряда X2:
q2=1,013
σ2 = 2,32944;
A=1,0132,32944=0,435
uγ=0,8289,
0,435≤1+0,828955+121+(0,8289)2,
0,435≤1,111 – неравенство выполняется, следовательно гипотеза Н0 отвергается, а значит делаем вывод о наличии в структуре временного ряда Х2 неслучайных, зависящих от времени компонент.
Проверив данные временные ряды на наличие неслучайной компоненты можно сделать следующие выводы:
При проверке гипотезы о наличии неслучайных компонент во временном ряду месячного уровня осадков получились, что по критерию серий и критерию восходящих и нисходящих серий, критерию Фостера-Cтьюарта неслучайная компонента в модели отсутствует.
При проверке гипотезы о наличии неслучайных компонент во временном ряду среднемесячного удоя молока получились, что по критерию серий и по критерию Аббе неслучайная компонента в модели присутствует. По критерию восходящих и нисходящих серий неслучайная компонента может и не присутствовать. Критерий Фостера-Стьюарта показывает наличие трендовой компоненты. В целом мы можем сделать вывод о присутствии неслучайной компоненты во временном ряду среднемесячного удоя молока.
Временной ряд X1(t)
Шаг 1. Произведем выравнивание исходного временного ряда методом скользящей средней. Найдем годовую добычу дичи Робинзоном, после чего найдем скользящие средние. Для приведения в соответствие с фактическими моментами времени, найдем центрированные скользящие средние.
месяц | кол-во | скользящие средние за год | центрированные скользящие средние | оценка сезонной компоненты |
1 | 27,50 | | | |
2 | 31,90 | | | |
3 | 29,80 | | | |
4 | 31,70 | | | |
5 | 29,60 | | | |
6 | 25,00 | 30,45 | | |
7 | 24,10 | 30,46667 | 30,45833 | -6,36 |
,,, | ,,, | ,,, | ,,, | ,,, |
49 | 27,30 | 30,61667 | 30,68333 | -3,38333 |
50 | 33,20 | | | |
51 | 30,30 | | | |
52 | 32,10 | | | |
53 | 30,80 | | | |
54 | 24,60 | | | |
55 | 22,50 | | | |
Шаг 2. Оценим сезонные компоненты как разность между фактическими элементами ряда и центрированными скользящими средними.
Скорректированные оценки сезонной компоненты определяются путем вычитания из средней оценки сезонной компоненты для месяца корректирующего коэффициента.
k = Siсредн12= 0,010475
год\мес. | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
1 | | | | | | | -6,35833 | 2,583333 | 1,2 | 8,070833 | 4,258333 | -3,32917 |
2 | -2,87083 | 2,5625 | 0,066667 | 1,0625 | -0,57083 | -6,29583 | -7,2375 | 2,333333 | 1,129167 | 8,1125 | 4,904167 | -3,5625 |
3 | -1,98333 | 1,9625 | 0,379167 | 0,804167 | -0,34583 | -4,925 | -7,77917 | 2,375 | 1,4 | 8,016667 | 4,579167 | -5,33333 |
4 | -2,87917 | 2,191667 | -0,0875 | 1,091667 | 0,345833 | -5,53333 | -6,66667 | 3,520833 | 1,208333 | 7,7 | 4,991667 | -4,775 |
5 | -3,38333 | | | | | | | | | | | |
Siсредн | -2,77917 | 2,238889 | 0,119444 | 0,986111 | -0,19028 | -5,58472 | -7,01042 | 2,703125 | 1,234375 | 7,975 | 4,683333 | -4,25 |
Si | -2,78964 | 2,228414 | 0,10897 | 0,975637 | -0,20075 | -5,5952 | -7,02089 | 2,69265 | 1,2239 | 7,964525 | 4,672859 | -4,26047 |
Шаг 3. Устраним сезонную компоненту S из исходных уравнений ряда и получим выровненные данные T+=X(t)-S
Месяц | Х(t) | Si | X(t) - Si |
1 | 27,50 | -2,78964 | 30,29 |
2 | 31,90 | 2,228414 | 29,67159 |
3 | 29,80 | 0,10897 | 29,69103 |
… | … | … | … |
53 | 30,80 | -0,20075 | 31,00075 |
54 | 24,60 | -5,5952 | 30,1952 |
55 | 22,50 | -7,02089 | 29,52089 |
T=X(t) -S
После исключения сезонной компоненты из временного ряда можно говорить об отсутствии трендовой компоненты в разложении временного ряда.
Временной ряд X2(t)
Шаг 1. Произведем выравнивание исходного временного ряда методом скользящей средней. Найдем годовую добычу дичи Робинзоном, после чего найдем скользящие средние. Для приведения в соответствие с фактическими моментами времени, найдем центрированные скользящие средние.
Месяц | Кол-во | Скользящие средние за год | Центрированные скользящие средние | Оценка сезонной компоненты |
1 | 11,00 | | | |
2 | 9,70 | | | |
3 | 8,50 | | | |
4 | 8,70 | | | |
5 | 7,60 | | | |
6 | 6,70 | 8,066667 | | |
7 | 6,10 | 7,65 | 7,858333 | -1,76 |
,,, | ,,, | ,,, | ,,, | ,,, |
49 | 6,50 | 7,166667 | 7,25 | -0,75 |
50 | 7,50 | | | |
51 | 6,90 | | | |
52 | 7,60 | | | |
53 | 6,60 | | | |
54 | 5,30 | | | |
55 | 4,80 | | | |
Шаг 2. Оценим сезонные компоненты как разность между фактическими элементами ряда и центрированными скользящими средними.
Используем полученные оценки сезонной компоненты для расчета сезонности S. Для этого найдем средние месячные оценки сезонной компоненты.
Скорректированные оценки сезонной компоненты определяются путем вычитания из средней оценки сезонной компоненты для месяца корректирующего коэффициента.
k = Siсредн12= 0,012471
Год/месяц | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
1 | | | | | | | -1,75833 | 0,145833 | -0,07917 | 1,9625 | 1,158333 | -1,04167 |
2 | -0,92917 | 0,55 | -0,1875 | 0,4625 | 0,120833 | -1,52083 | -1,58333 | 0,358333 | 0,104167 | 2,258333 | 1,016667 | -0,85 |
3 | -0,71667 | 0,508333 | -0,1875 | 0,1625 | 0,0125 | -1,275 | -1,7625 | 0,754167 | 0,354167 | 1,2125 | 0,529167 | -1,72917 |
4 | -1,73333 | -0,90417 | -1,14167 | 4,225 | 2,108333 | -0,4875 | -1,175 | 0,541667 | -0,02083 | 1,2375 | 0,854167 | -1,02083 |
5 | -0,75 | | | | | | | | | | | |
Si ср | -1,03229 | 0,051389 | -0,50556 | 1,616667 | 0,747222 | -1,09444 | -1,56979 | 0,45 | 0,089583 | 1,667708 | 0,889583 | -1,16042 |
Si ск | -1,04476 | 0,038918 | -0,51803 | 1,604196 | 0,734751 | -1,10692 | -1,58226 | 0,437529 | 0,077112 | 1,655237 | 0,877112 | -1,17289 |
Шаг 3. Устраним сезонную компоненту S из исходных уравнений ряда и получим выровненные данные T+=X(t)-S
Месяц | Х(t) | Si | X(t) - Si |
1 | 11,00 | -1,04476 | 12,04 |
2 | 9,70 | 0,038918 | 9,661082 |
3 | 8,50 | -0,51803 | 9,018027 |
… | … | … | … |
53 | 6,60 | 0,734751 | 5,87 |
54 | 5,30 | -1,10692 | 6,406916 |
55 | 4,80 | -1,58226 | 6,382263 |
Шаг 4.Используя регрессионный анализ, проведем аналитическое выравнивание ряда T=X-S
Несколько вариантов функции тренда:
T=θ0+θ1t
θ1 = NtiTi –(ti)(Ti)Nti2- (ti)2
θ0 = T- t* θ1
θ1 = -0,0132
θ0 = 7,5023
T = 7,5023 -0,0132t
ESS = (Ti-Ti)2= 78,90959
RSS = (Ti-Ti)2 = 2,420453
TSS = (Ti-Ti)2= 81,33005
R2 = RSS/TSS = 0,029761
Данная модель тренда объясняет всего 2,97% вариации среднемесячных удоев молока за последние 5 лет, поэтому данную модель лучше не использовать.
Θ= (XTX)-1 XT Y, где
Y=T, X = 1 t11 t21… … …1 t1n t2n , t1 = 1 t , t2 = 14t
θ0 = 8,182
θ1 = 7,887
θ2 = -3,574
ESS = (Ti-Ti)2= 45,47
RSS = (Ti-Ti)2 = 35,78
TSS = (Ti-Ti)2= 81,27
R2 = RSS/TSS = 0,4402, следовательно, данная модель тренда объясняет 44,02% вариации среднемесячных удоев молока за последние 5 лет.
Проверим на значимость параметры модели.
H0 : θi = 0 – параметр не значим;
H1 : θi ≠ 0.
t= θiSθi- статистика Стьюдента;
S2 = 1N-m*1Nei2 - оценка дисперсии ошибок, где ei = Тi - Тi;
Sθi2=S2*qii – оценка дисперсии оценки, где - элемент главной диагонали матрицы (XTX)-1.
S2 = 45,5/52 = 0,8749
Sθ02 = 0,8749*1,075 = 0,941
Sθ0=0,941 =0,97
t = 8,182 / 0,97 = 8,435
tкр(0,05;52)=2,00
|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 0 в данном уравнении регрессии является значимым.
Sθ12 = 0,8749*4,237 = 3,7069
Sθ1=3,7069 =1,925
t = 7,887 /1,925=4,096
|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 1 в данном уравнении регрессии является значимым.
Sθ22 = 0,8749*6,09289 = 5,3308
Sθ2=5,3308 =2,3089
t = -3,574 / 2,3089= -1,548
|t| < tкр(0,05;52) следовательно, гипотеза не отвергается, то есть параметр 2 в данном уравнении регрессии не является значимым.
Проверим значимость модели по критерию Фишера.
- уравнение не значимое
Статистика Фишера:
F = (0,44/ 1 – 0,44) * (52/2) = 20,45
Fкр(2, 52) = 3,2
F > Fкр(2, 52), то гипотеза отвергается, и уравнение является значимым.
Θ= (XTX)-1 XT Y, где
Y=T, X = 1 t11 t21 t31 … … … …1 t1n t2n t3n , t1 = 1 t , t2= 1t , t3 = 14t
θ0 = 18,29
θ1 = -13,465
θ2 = 57,471
θ3 = -50,353
ESS = (Ti-Ti)2= 42,52
RSS = (Ti-Ti)2 = 38,75
TSS = (Ti-Ti)2= 81,27
R2 = RSS/TSS = 0,4768, следовательно, данная модель тренда объясняет 47,68% вариации среднемесячных удоев молока за последние 5 лет.
Проверим на значимость параметры модели.
H0 : θi = 0 – параметр не значим;
H1 : θi ≠ 0.
t= θiSθi- статистика Стьюдента;
S2 = 1N-m*1Nei2 - оценка дисперсии ошибок, где ei = Тi - Тi;
Sθi2=S2*qii – оценка дисперсии оценки, где - элемент главной диагонали матрицы (XTX)-1.
S2 = 42,52/51 = 0,8338
Sθ02 = 0,8338*35,45 = 29,56
Sθ0=29,56 =5,4367
t = 18,29 / 5,4367= 3,3642
tкр(0,05;51)=2,00
|t| > tкр(0,05;51) следовательно, гипотеза отвергается, то есть параметр 0 в данном уравнении регрессии является значимым.
Sθ12 =0,8338*157,63 = 131,433
Sθ1=131,433 =11,4644
t = -13,465 /11,4644=-1,17
|t| < tкр(0,05;51) следовательно, гипотеза не отвергается, то есть параметр 1 в данном уравнении регрессии не является значимым.
Sθ22 = 0,8338*1111,24 = 926,5588
Sθ2=926,5588 =30,4394
t = 57,471 / 30,4394= 1,888
|t| < tкр(0,05;51) следовательно, гипотеза не отвергается, то есть параметр 2 в данном уравнении регрессии не является значимым.
Sθ32 = 0,8338*742,32 = 618,95
Sθ3=618,95 =24,8787
t = -50,353 / 24,8787= -2,0239
|t| > tкр(0,05;51) следовательно, гипотеза отвергается, то есть параметр 3 в данном уравнении регрессии является значимым.
Проверим значимость модели по критерию Фишера.
- уравнение не значимое
Статистика Фишера:
F = (0,4768/ 1 – 0,4768) * (51/3) = 15,49
Fкр(3, 51) = 2,8
F > Fкр(2, 51), то гипотеза отвергается, и уравнение является значимым.
- T=4
Преобразуем данную модель к модели вида Т4=
Θ= (XTX)-1 XT Y, где
Y=Т4, X = 1 t11 t21… … …1 t1n t2n , t1 = 1 t , t2 = 13t
θ0 = 7029,97
θ1 = 31151,31
θ2 = -17141,69
ESS = (Ti-Ti)2= 145623360,70
RSS = (Ti-Ti)2 = 381033397,01
TSS = (Ti-Ti)2= 526656757,72
R2 = RSS/TSS = 0,7235, следовательно, данная модель тренда объясняет 72,34% вариации среднемесячных удоев молока за последние 5 лет.
Проверим на значимость параметры модели.
H0 : θi = 0 – параметр не значим;
H1 : θi ≠ 0.
t= θiSθi- статистика Стьюдента;
S2 = 1N-m*1Nei2 - оценка дисперсии ошибок, где ei = Тi - Тi;
Sθi2=S2*qii – оценка дисперсии оценки, где - элемент главной диагонали матрицы (XTX)-1.
S2 = 145623360,70/52 = 2800449,244
Sθ02 = 2800449,244*0,5967 = 1671061,15
Sθ0=1671061,15 =1292,69
t = 7029,97 / 1292,69 = 5,438
tкр(0,05;52)=2,00
|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 0 в данном уравнении регрессии является значимым.
Sθ12 = 2800449,244*5,33 = 14927190,66
Sθ1=14927190,66 =3863,57
t = 31151,32/3863,57=8,063
|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 1 в данном уравнении регрессии является значимым.
Sθ22 = 2800449,244*6,077 = 17018504
Sθ2=17018504 =4125,35
t = -17141,69/ 4123,35= -4,155
|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 2 в данном уравнении регрессии является значимым.
Проверим значимость модели по критерию Фишера.
- уравнение не значимое
Статистика Фишера:
F = (0,7235/ 1 – 0,7235) * (52/2) = 68,03
Fкр(2, 52) = 3,2
F > Fкр(2, 52), то гипотеза отвергается, и уравнение является значимым.
T=4
Преобразуем данную модель к модели вида Т4=
Θ= (XTX)-1 XT Y, где
Y=Т4, X = 1 t11 t21… … …1 t1n t2n , t1 = 13t, t2 = 14t
θ0 = 35714,47
θ1 = 251132,01
θ2 = -267257,62
ESS = (Ti-Ti)2= 152050307,12
RSS = (Ti-Ti)2 = 374606450,59
TSS = (Ti-Ti)2= 526656757,72
R2 = RSS/TSS = 0,7113, следовательно, данная модель тренда объясняет 71,13% вариации среднемесячных удоев молока за последние 5 лет.
Проверим на значимость параметры модели.
H0 : θi = 0 – параметр не значим;
H1 : θi ≠ 0.
t= θiSθi- статистика Стьюдента;
S2 = 1N-m*1Nei2 - оценка дисперсии ошибок, где ei = Тi - Тi;
Sθi2=S2*qii – оценка дисперсии оценки, где - элемент главной диагонали матрицы (XTX)-1.
S2 = 152050307,12/52 = 2924044,36
Sθ02 = 2924044,36*8,244 = 24105156,03
Sθ0=24105156,03 =4909,7
t = 35714,47 / 4909,7 = 7,2743
tкр(0,05;52)=2,00
|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 0 в данном уравнении регрессии является значимым.
Sθ12 = 2924044,36*322,42 = 942773721,9
Sθ1=942773721,9 =30704,62
t = 251132,01/30704,62=8,179
|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 1 в данном уравнении регрессии является значимым.
Sθ22 = 2924044,36*406,69= 1189187744
Sθ2=1189187744 =34484,60
t = -267257,62/ 34484,60= -7,75
|t| > tкр(0,05;52) следовательно, гипотеза отвергается, то есть параметр 2 в данном уравнении регрессии является значимым.
Проверим значимость модели по критерию Фишера.
- уравнение не значимое
Статистика Фишера:
F = (0,7113/ 1 – 0,7113) * (52/2) = 64,056
Fкр(2, 52) = 3,2
F > Fкр(2, 52), то гипотеза отвергается, и уравнение является значимым.
По результатам проведенного анализа в качестве наилучших моделей были выбраны: Модель 3: При проверке уравнения модели по критерию Стьюдента, значимым оказались параметры - θ0 и θ3, θ1 и θ2- незначимы, уравнение по статистике Фишера значимо, R2=0,4768
Модель 4: Все неизвестные параметры уравнения при проверке по критерию Стьюдента оказались значимыми, уравнение по статистике Фишера значимо, R2=0,7235
Модель 5: Все неизвестные параметры уравнения при проверке по критерию Стьюдента оказались значимыми, уравнение по статистике Фишера значимо; R2=0,7113.
Из трех представленных моделей наилучшей является модель вида т.к. все ее параметры являются значимыми, сама
модель значима и объясняет 72,35% (наибольший процент) вариации среднемесячных удоев молока.
Проверим остатки на автокорреляцию.
Выдвигаем гипотезу об отсутствии автокорреляции в остатках и две альтернативные ей.
: r (1) = 0
: r (1) > 0
H2 : r (1) < 0
Рассчитываем статистику Дарбина-Уотсона:
= 126110735,12145623360,70 = 0,866
dL=1,49dU=1,64 - кр. значения Дарбина-Уотсона (0,05; 2; 55)
А+ ? А0 ? А-
0 dL dU 4-dU 4-dL 4
Значение статистики d (= 0,866) попадает в критическую область “А+”, следовательно, гипотеза отвергается в пользу альтернативы H1, а значит r(1)>0.
По графику временного ряда X2(t) можно предположить наличие структурных изменений. Проверим эту гипотезу с помощью теста Чоу и подхода Гуйарати.
Критерий Чоу.
В ходе своих наблюдений Робинзон заметил, что удои резко сократились в некоторый момент времени. Он пришел к выводу, что необходимо построить новое пастбище для своих коз, и поэтому огородил новую местность. Это изменение привело к резкому скачку в удоях, что отразилось на временном ряде и вызвало структурные изменения.
По графику временного ряда было сделано предположение о наличии структурных изменений в момент t*=40 (40-ой месяц, 4-ый год). Проверим это предположение с помощью теста Чоу.
t*=40, тогда:
T (t) – единая модель временного ряда
T1 (t) – модель временного ряда, построенная на промежутке до t*
T2 (t) – модель временного ряда, построенная на промежутке после t*
N, N1, N2 – количество наблюдений, использованное для построения моделей T (t), T1 (t), T2 (t).
Кусочная модель может быть записана в виде:
T1+2 (t) = T1t, t
Модель
Число наблюдений
Число степеней свободы
Остаточная сумма квадратов
55
52
145623360,70
39
36
17637380,26
16
13
12411431,02
Выдвигаем гипотезу о структурной стабильности временного ряда:
H0 : ΔESS = 0
H1 : ΔESS ≠ 0
ESS1+2 = ESS1 + ESS2 = 17637380,26+12411431,02=30048811,29
ΔESS = 145623360,70 – 30048811,29= 115574549,4
F = ΔESSkESS1+2N-2k = (115574549,4/3)/( 30048811,29/(55-6))=62,82 Fкр (0,05; 2; 52)= 3,186
F > Fкр , следовательно, гипотеза отвергается и для моделирования следует использовать кусочную модель.
Критерий Гуйарати.
T1(t) = θ0(1) + θ1(1) f1(t) + … + θk(1) fk(t)
T2(t) = θ0(2) + θ1(2) f1(t) + … + θk(2) fk(t)
Выдвигаем гипотезу о структурной стабильности:
H0 : {временной ряд x(t) структурно стабилен}
H1: {структурные изменения оказывают влияние на временной ряд x(t)}
Построим вспомогательное регрессионное уравнение Гуйарати:
x(t) = θ0(1) + θ0(z) Z(t) + θ1(1) f1(t) + θ1(z) f1(t)Z(t) + … + θk(1) fk(t) + θk(z) fk(t)Z(t) + e(t)
В нашем случае, уравнение будет иметь следующий вид:
x(t) = 4θ0(1) + θ0(z) Z(t) + θ1(1) f1(t) + θ1(z) f1(t)Z(t) + … + θk(1) fk(t) + θk(z) fk(t)Z(t) + e(t)
Z (t) = 0, t
Оценка вектора неизвестных параметров вспомогательного уравнения:
Θ = (XTX)-1XTY, где
Y – матрица значений временного ряда X2(t)
X = 1 Z11t f11t f11t*Z11t f21t f21t*Z11(t)… … … … … …1 Z1nt f1nt f1nt*Z1nt f2nt f2nt*Z1n(t)
t* = 40
1,083435
-1,08344
2,429773
-2,42977
-3,14102
3,14101711
-1,08344
30987,27
-2,42977
724881
3,141017
-167664,07
2,429773
-2,42977
6,947653
-6,94765
-7,56885
7,56884673
-2,42977
724881
-6,94765
16989764
7,568847
-3924682,2
-3,14102
3,141017
-7,56885
7,568847
9,418588
-9,4185884
3,141017
-167664
7,568847
-3924682
-9,41859
907385,732
Получаем:
(XTX)-1 =
Θ=3872,33480225,6525821,3812753370,7-9174,5567-2707877,9
X(t)=43872,33+480225,65 Zt+25821,38 13t+12753370,7 13t Zt-9174,5567 14t-2707877,914t Zt+ e(t)
Н0: θ0(z), θ1(z),θ2(z), =0- незначимые параметры
Н1: θ0(z), θ1(z),θ2(z), ≠0
Преобразуем уравнение к виду:
X(t)4=3872,33+480225,65 Zt+25821,38 13t+12753370,7 13t Zt-9174,5567 14t-2707877,914t Zt+ e(t)
S2=3004881155-6=613241
Sθ0(z)2=613241*30987,27=19002664985 Sθ0(z)=137850,1541
Sθ1(z)2=613241*16989763,63=10418820434195,50 Sθ1(z)=3227819,765
Sθ2(z)2=613241*907385,732=556446176055,15 Sθ2(z)=745953,1996
t(θ0(z)) =480225,646/137850,1541= 3,483679
t(θ1(z)) = 12753370,7/3227819,765= 3,951079
t(θ1(z)) = -2707877,9/745953,1996= -3,63009
tкр(95%;49) = 2.0076
|t(θ0(z))| > tкр => данный параметр значим;
|t(θ1(z))| >tкр => данный параметр значим.
|t(θ2(z))| >tкр => данный параметр значим.
Все параметры значимы, что говорит о том, что различие соответствующих параметров кусочных моделей также являются значимыми. Гипотеза о структурной стабильности отвергается и ряд X2(t) (среднемесячные удои молока) является структурно нестабильным. Следовательно, отдаем предпочтение кусочной модели.
Выводы:
После проведение первичного статистического анализа были получены следующие результаты:
Для временного ряда X1(t) (месячный уровень осадков): в среднем в месяц на острове выпадало 30,3236 мм осадков. Отклонение от среднего составляет 4,1989 мм.
Для временного ряда X2(t) (среднемесячные удои молока): в среднем в месяц на острове выпадало 7,169 галлонов. Отклонение от среднего составляет 1,534галлона.
В качестве моделей временных рядов были выбраны аддитивные.
Проверив временные ряды на наличие неслучайных компонент с помощью критериев, мы выявили:
временной ряд осадков не содержит неслучайных компонент
временной ряд удоев содержит неслучайные компоненты – трендовую и сезонную.
Наилучшей трендовой моделью, описывающей временной ряд удоев является:
Применение критерия Дарбина-Уотсона показало, что в остатках рядов удоев наблюдается положительная автокорреляция.
Было доказано наличие автокорреляции в остатках, причем r(1) > 0.
В ходе своих наблюдений Робинзон заметил, что удои резко сократились в некоторый момент времени. Он пришел к выводу, что необходимо построить новое пастбище для своих коз, и поэтому огородил новую местность. Это изменение привело к резкому скачку в удоях, что отразилось на временном ряде и вызвало структурные изменения.
С помощью теста Чоу мы выявили, что во временном ряде удоев присутствуют структурные изменения в точке t*=40, поэтому необходимо применять кусочную модель:
С помощью подхода Гуйарати определили, что параметры значимы, а, следовательно, ряд среднемесячных удоев молока структурно нестабилен, поэтому предпочтение отдается кусочной модели.