Wednesday 6 December 2017

Modele liniowo autoregresywno ruchome średnie


glarma: uogólnione liniowe autoregresywne średnie ruchome modele z. Numeryczna tolerancja rozpoznawania liczb, które są mniejsze od określonej tolerancji, jako zero. Modele dla glamy są określone symbolicznie. Typowy model ma postać y (odpowiedź), X (wyrażenia), gdzie y jest wektorem liczby lub wektora odpowiedzi czynników, X to seria terminów, która określa liniowy predyktor odpowiedzi. Należy zauważyć, że pierwsza kolumna X powinna być wektorem 1s jako przecięcie modelu. Cztery wstępne parametry, które należy oszacować, łączy się w delta (beta, phi, theta, alfa). gdzie alfa jest parametrem opcjonalnym w celu uwzględnienia ujemnego modelu dwumianowego. Zauważ, że w funkcji glm. nb z pakietu MASS. ten parametr nazywany jest theta. W przypadku rozkładów Poissona i ujemnych algorytmów dwumianowych łącze logowania jest obecnie używane. W przypadku odpowiedzi dwumianowych logit jest obecnie używany. Generowane liniowe autoregresywne średnie ruchome modele są obliczane w następujący sposób. Linearny predykat odpowiedzi to log (mut) Wt transponuje (Xt) beta przesunięcie Zt. Nieskończona średnia ruchoma z liniowego predykatora to suma Zt (pozostałości gammai (t-i)). Ta nieskończona średnia ruchoma jest obliczana przy użyciu autoregresywnych średnich ruchów Zt phi1 (Z (t-1) e (t-1)). fip (Z e (t-p)) theta1 e. thetaq e gdzie p i q są kolejnością phi i theta, a niezerowe opóźnienia wektorów phi i theta mogą być określone przez użytkownika za pomocą argumentów phiLag i thetaLag. Istnieją dwa typy reszt, które mogą być użyte w każdej rekursji, resztki Pearson'a lub wynikowe reszty, a ponadto dla rozkładu dwumianowego można użyć pozostałości tożsamości. Nieskończona średnia ruchoma, Zt. zależy od rodzaju resztek użytych, podobnie jak końcowe parametry uzyskane z filtra. Standaryzacja dawnych obserwowanych kwot jest konieczna, aby uniknąć niestabilności, dlatego użytkownik powinien wybrać odpowiedni typ resztek w zależności od sytuacji. Metoda szacowania parametrów realizowanych w funkcji ma na celu maksymalizację prawdopodobieństwa logowania metodą iteracyjną, począwszy od odpowiednio dobranych wartości początkowych dla parametrów. Począwszy od wartości początkowych delta hat (0) dla wektora aktualizacji parametrów uzyskuje się przy użyciu pierwszej pochodnej delta (k1) delta (k) Omega (deltak) log (deltak), gdzie Omega (delta hat (k)) jest odpowiednio dobrana macierz. Iteracje trwają nadal na poziomie gt gt do osiągnięcia zbieżności lub liczba iteracji k osiąga określony przez użytkownika górny limit maksimum iteracji, w którym to przypadku się zatrzyma. Kryterium konwergencji zastosowane w naszym wdrożeniu opiera się na eta. maksymalne wartości bezwzględne pierwszych pochodnych. Kiedy eta jest mniejsza niż określona przez użytkownika gradacja wartości, iteracje są zatrzymane. Istnieją dwie metody optymalizacji prawdopodobieństwa, oceny Newtona-Raphona i Fishera. Użyta metoda jest określona metodą argumentu. Należy zauważyć, że jeśli początkowa wartość parametrów nie jest dobrana dobrze, optymalizacja prawdopodobieństwa może się nie zbliżać. Konieczne jest zachowanie ostrożności przy dopasowywaniu specyfikacji ARMA, ponieważ nie można zidentyfikować parametrów AR i MA, jeśli zamówienia p i q są zbyt duże. Brak algorytmów ujawnia się w algorytmie, aby zoptymalizować prawdopodobieństwo, że nie będzie on zbiegać się, i że hesjan jest pojedynczo sprawdzać ostrzeżenia i kody błędów konwergencji. Podsumowanie funkcji (tj. Summary. glarma) można wykorzystać do uzyskania lub wydrukowania podsumowania wyników. Ogólny rodzaj akcesora ma coef (tj. Coef. glarma), logLik (tj. LogLik. glarma), zamontowany (tj. Equip. glarma), resztki (tj. Residuals. glarma), noże (tj. Nobs. glarma), model. frame. frame. glarma) i extractAIC (tj. extractAIC. glarma) można wykorzystać do wyodrębnienia różnych przydatnych właściwości wartości zwracanej przez glarmę. glarma zwraca obiekt klasy glarma z komponentami: autoregresywna Średnia ruchoma ARMA (p, q) Modele do analizy serii czasowej - część 3 Jest to trzeci i ostatni post w mini serii w modelach ARMA (Autoregressive Moving Average) dla serii czasowych analiza. W poprzednich artykułach przedstawiliśmy modele autoregresji i modele Moving Average. Teraz nadszedł czas na połączenie ich w celu stworzenia bardziej wyrafinowanego modelu. Ostatecznie doprowadzi to do modeli ARIMA i GARCH, które umożliwią nam przewidywanie zwrotu aktywów i prognozy zmienności. Modele te będą stanowiły podstawę sygnałów handlowych i technik zarządzania ryzykiem. Jeśli przeczytałeś część 1 i 2, zobaczysz, że mamy tendencję do śledzenia wzoru do analizy modelu serii czasowej. Powtórz to krótko tutaj: Uzasadnienie - Dlaczego jesteśmy zainteresowani tym konkretnym modelem Definicja - definicja matematyczna w celu zmniejszenia dwuznaczności. Correlogram - Wykreślenie próbki korelgramu w celu wizualizacji zachowania modelu. Symulacja i dopasowanie - dopasowanie modelu do symulacji, w celu zapewnienia prawidłowego zrozumienia modelu. Prawdziwe dane finansowe - zastosuj model do rzeczywistych cen aktywów historycznych. Przewidywanie - prognozuj kolejne wartości do budowy sygnałów handlowych lub filtrów. Aby śledzić ten artykuł, warto zapoznać się z wcześniejszymi artykułami dotyczącymi analizy serii czasowych. Mogą się tu znaleźć. Kryterium informacyjne Bayesian W części 1 tego artykułu omówiliśmy Kryterium Informacyjne Akaike (Akaike Information Criterion - AICACA) w celu pomagania nam wybrać między osobnymi modelami najlepszych serii czasowych. Ścisłym narzędziem jest kryterium informacji bajeskiej (ang. Bayesian Information Criterion - BIC). Zasadniczo ma podobne zachowanie do AIC w tym, że penalizuje modele za zbyt wiele parametrów. Może to prowadzić do nadmiernego zużycia. Różnica między BIC a AIC polega na tym, że BIC jest bardziej rygorystyczny, a jego karanie dodatkowych parametrów. Kryterium informacji Bayesiego Jeśli przyjmiemy funkcję prawdopodobieństwa dla modelu statystycznego, który ma k parametry, a L zmaksymalizuje prawdopodobieństwo. to Bayesian Information Criterion podaje: Gdzie n jest liczbą punktów danych w serii czasowej. Będziemy używać AIC i BIC poniżej przy wyborze odpowiednich modeli ARMA (p, q). Test Ljung-Box W części 1 tego artykułu seria Rajan wspomniała w komentarzu Disqus, że test Ljung-Box był bardziej odpowiedni niż użycie Kryterium Informacyjnego Akaike Kryterium Informacyjnego Bayesian w celu określenia, czy model ARMA był odpowiedni do czasu seria. Test Ljung-Box jest klasycznym testem hipotezowym, który ma na celu zbadanie, czy zestaw autokorelacji dopasowanego modelu serii czasowej różni się istotnie od zera. Test nie testuje każdego przypadkowego opóźnienia losowego, ale raczej testuje losowość w grupie opóźnień. Badanie Ljung-Box Zdefiniujmy hipotezę zerową jako: Dane z serii czasowej w każdym opóźnieniu to i. i.d. Oznacza to, że korelacje pomiędzy wartościami serii populacji są zerowe. Zdefiniujmy alternatywną hipotezę: Dane z serii czasowych nie są i. i.d. i posiadają korelację szeregową. Obliczamy następującą statystykę testową. P: Gdzie n jest długością próbki serii czasowej, kapelusz k jest autokorelacją próbki w punkcie lag k, a h jest liczbą opóźnień w teście. Zasadą decyzyjną dotyczącą odrzucenia hipotezy zerowej jest sprawdzenie, czy Q gt chi2, dla rozkładu chi-kwadratowego z h stopniami swobody w 100 (1-alfa) th percentile. Chociaż szczegóły testu mogą wydawać się nieco skomplikowane, w rzeczywistości możemy użyć R, aby obliczyć test dla nas, upraszczając procedurę nieco. Średnia przemieszczania się z autogryzją (ARMA) Modele porządku p, q Teraz, gdy dyskutowaliśmy na temat BIC i testu Ljung-Box, byliśmy gotowi omówić nasz pierwszy model mieszany, a mianowicie Średnia ruchów autoregresji rzędu p, q lub ARMA (p, q). Do tej pory rozważaliśmy procesy autoregresji i przenoszenie średnich procesów. Poprzedni model traktuje własne zachowania w przeszłości jako dane wejściowe do modelu i jako takie próby przechwytywania efektów uczestnictwa w rynku, takich jak pęd i średni zwrotność w obrocie giełdowym. Ten ostatni model jest wykorzystywany do scharakteryzowania informacji szokowych w szeregu, takich jak ogłoszenie o zarabianiu niespodzianek lub niespodziewane zdarzenie (np. Wyciek oleju BP Deepwater Horizon). W związku z tym model ARiMR próbuje uchwycić oba te aspekty podczas modelowania serii czasowych finansowych. Zauważ, że model ARiMR nie uwzględnia klastrowania zmienności, kluczowego zjawiska empirycznego wielu finansowych serii czasowych. Nie jest to model warunkujący heteroseksualność. W tym celu musimy poczekać na modele ARCH i GARCH. Definicja Model ARMA (p, q) jest liniową kombinacją dwóch modeli liniowych, a zatem jest ciągle liniowy: Autoregresywny Średnia ruchoma Model wzoru p, q Model szeregowy czasowy, jest autoregresywnym średnim ruchem modelu rzędu p, q . ARMA (p, q), jeśli: begin xt alpha1 x alpha2 x ldots wt beta1 w beta2 w ldots betaq w end Gdzie jest biały hałas z E (wt) 0 i sigma2 wariancji. Jeśli weźmiemy pod uwagę Operatora Przesuwania Wstecznego. (patrz poprzedni artykuł), możemy następnie przepisać powyższe jako funkcję theta i phi: Z łatwością możemy zauważyć, że poprzez ustawienie p neq 0 i q0 odzyskamy model AR (p). Podobnie, jeśli ustawimy p 0 i q neq 0, odzyskamy model MA (q). Jedną z kluczowych cech modelu ARiM jest fakt, że w parametrach jest oszczędny i zbędny. Oznacza to, że model ARMA często wymaga mniej parametrów niż sam model AR (p) lub MA (q). Ponadto, jeśli przepisamy równanie w kontekście BSO, to wielomiany teta i phi mogą czasami mieć wspólny współczynnik, co prowadzi do prostszego modelu. Symulacje i korelogramy Podobnie jak w przypadku autoregresji i przeciętnych modeli, będziemy symulować różne serie ARMA, a następnie próbować dopasować modele ARMA do tych realizacji. Wykonujemy to dlatego, że chcemy zapewnić, że zrozumiemy procedurę dopasowania, w tym sposób obliczania przedziałów ufności dla modeli, a także zapewnić, że procedura rzeczywiście odzyskuje uzasadnione szacunki dla oryginalnych parametrów ARMA. W części 1 i 2 ręcznie skonstruowaliśmy serię AR i MA, narysując N próbek z rozkładu normalnego, a następnie opracowano specyficzny model szeregów czasowych przy użyciu opóźnień w tych próbkach. Istnieje jednak bardziej prosty sposób na symulowanie danych AR, MA, ARMA, a nawet ARIMA, po prostu przez zastosowanie metody arima. sim w R. Pozwala rozpocząć od najprostszego możliwego nietrywialnego modelu ARiMR, czyli ARiMR (1,1 ) Model. Oznacza to, że autoregresywny model porządku jeden w połączeniu z ruchomym średnim modelem kolejności. Taki model ma tylko dwie współczynniki, alfa i beta, które reprezentują pierwsze opóźnienia samego szeregu czasowego i szok białego szumu. Taki model jest określony przez: Przed symulacją musimy określić współczynniki. Przyjmijmy alpha 0.5 i beta -0.5: Wyjście jest następująco: Pozwala także wykreślić koreklogram: widać, że nie ma istotnej autokorelacji, którą należy spodziewać się z modelu ARMA (1,1). Na koniec spróbuj obliczyć współczynniki i ich standardowe błędy za pomocą funkcji arima: możemy obliczyć przedziały ufności dla każdego parametru za pomocą standardowych błędów: przedziały ufności zawierają prawdziwe wartości parametrów dla obu przypadków, ale należy zauważyć, że 95 przedziały ufności są bardzo szerokie (wynika to z dość dużych błędów standardowych). Pozwala teraz wypróbować model ARMA (2,2). Oznacza to model AR (2) połączony z modelem MA (2). Musimy określić cztery parametry tego modelu: alfa1, alfa2, beta1 i beta2. Pozwala zabrać alpha1 0.5, alpha2-0.25 beta10.5 i beta2-0.3: Wyjście naszego modelu ARMA (2,2) wygląda następująco: A odpowiadająca im autokorelacja: teraz możemy spróbować dopasować model ARMA (2,2) do dane: Możemy również obliczyć przedziały ufności dla każdego parametru: Zauważ, że przedziały ufności dla współczynników dla ruchomych składników średniej (beta1 i beta2) w rzeczywistości nie zawierają pierwotnej wartości parametru. Wskazuje to na niebezpieczeństwo próby dostosowania modeli do danych nawet wtedy, gdy znamy prawdziwe wartości parametrów. Jednak w celach handlowych potrzebujemy tylko siły predykcyjnej, która przekracza szansę i wytworzy wystarczająco dużo zysków powyżej kosztów transakcji, aby zyskać na zyskach długi bieg. Teraz, gdy widzimy kilka przykładów symulowanych modeli ARMA, potrzebujemy mechanizmu wyboru wartości p i q przy dopasowywaniu modeli do rzeczywistych danych finansowych. Wybór najlepszego modelu ARMA (p, q) Aby określić, która kolejność p, q modelu ARMA jest odpowiednia dla szeregu, musimy użyć AIC (lub BIC) w podzbiorze wartości dla p, q i następnie zastosuj test Ljung-Box, aby ustalić, czy zostało osiągnięte dobre dopasowanie, dla konkretnych wartości p, q. Aby pokazać tę metodę, najpierw będziemy symulować konkretny proces ARMA (p, q). Będziemy wtedy pętli wszystkie pary wartości p in i q in i obliczyć AIC. Wybieramy model z najniższym AIC, a następnie test Ljung-Box na resztkach, aby ustalić, czy osiągnęliśmy dobre wyniki. Zacznijmy od symulacji serii ARMA (3,2): teraz utworzymy obiekt, który pozwoli zachować najlepsze dopasowanie modelu i najniższą wartość AIC. Pętlę nad różnymi kombinacjami p, q i używamy bieżącego obiektu do przechowywania dopasowania modelu ARMA (i, j) dla zmiennych pętli i i j. Jeśli bieżący AIC jest mniejszy niż jakikolwiek wcześniej wyliczony AIC, ustawiamy końcowy AIC na tę bieżącą wartość i wybierz tę kolejność. Po zakończeniu pętli mamy kolejność modelu ARMA przechowywanego w final. order i ARIMA (p, d, q) dopasowują się (ze zintegrowanym składnikiem d ustawionym na 0) przechowywanej jako final. arma: Pozwala wyprowadzić AIC , rzędu i współczynników ARIMA: widać, że pierwotny porządek symulowanego modelu ARMA został odzyskany, a mianowicie z p3 i q2. Możemy sprecyzować corelogram pozostałości modelu, aby zobaczyć, czy wyglądają na realizację dyskretnego białego szumu (DWN): Corelogram rzeczywiście wygląda jak realizacja DWN. Wreszcie, wykonujemy test Ljung-Box o 20 opóźnień, aby to potwierdzić: Zauważ, że wartość p jest większa niż 0,05, co oznacza, że ​​reszty są niezależne na poziomie 95, a zatem model ARMA (3,2) zapewnia dobre dopasowanie modelu. Oczywiście tak powinno być w przypadku, gdy sam skomentowaliśmy dane. Jednak właśnie ta procedura zostanie użyta, gdy dopasujemy modele ARMA (p, q) do indeksu SampP500 w następnej sekcji. Dane finansowe Teraz, gdy przedstawiliśmy procedurę wyboru optymalnego modelu szeregowego dla serii symulowanych, stosujemy je do danych finansowych. W tym przykładzie po raz kolejny wybieramy SampP500 US Equity Index. Pozwala na pobieranie dziennych cen zamknięcia przy użyciu quantmod, a następnie utworzenie strumienia powrotnego: umożliwia wykonanie tej samej procedury dopasowania jak w symulowanych seriach ARMA (3,2) powyżej w dzienniku zwraca serie SampP500 przy użyciu modelu AIC: najlepszy model dopasowania ma zlecenie ARMA (3,3): Pozwala wyznaczyć resztki dopasowanego modelu do codziennego strumienia danych dziennika SampP500: Zauważ, że istnieją znaczne piki, zwłaszcza przy wyższych opóźnieniach. To wskazuje na słabe dopasowanie. Pozwala przeprowadzić test Ljung-Box, aby sprawdzić, czy mamy statystyczne dowody na to: jak podejrzewaliśmy, wartość p jest mniejsza niż 0,05 i jako taka nie możemy powiedzieć, że resztki są realizacją dyskretnego białego szumu. Stąd istnieje dodatkowa autokorelacja w resztach, której nie wyjaśniono w modelu ARMA (3,3). Następne etapy Jak omawialiśmy cały czas w tej serii artykułów, zobaczyliśmy dowody warunkowej heteroskompresji (klasteryzacja lotności) w serii SampP500, zwłaszcza w okresach około 2007-2008. Kiedy w serii artykułów użyjemy modelu GARCH, zobaczymy, jak wyeliminować te autokorelacje. W praktyce modele ARMA nigdy nie są właściwie przystosowane do zwrotu papierów wartościowych. Musimy wziąć pod uwagę warunkową heteroskompresję i używać kombinacji ARIMA i GARCH. Następny artykuł będzie rozpatrywać ARIMA i pokazać, jak zintegrowany składnik różni się od modelu ARMA, który rozważaliśmy w tym artykule. Tylko początek handlu ilościami.8.3 Modele autoregresji W modelu regresji wielorakiej prognozujemy zmienną zainteresowania przy użyciu liniowej kombinacji predykcyjnych. W modelu autoregresji prognozujemy zmienną odsetkową przy użyciu kombinacji liniowej przeszłych wartości zmiennej. Termin regresja automatyczna wskazuje, że jest to regresja zmiennej przeciwko sobie. Zatem autoregresywny model porządku p można zapisać, gdy c oznacza stały i et biały szum. To jest jak regresja wielokrotna, ale z opóźnionymi wartościami yt jako predykatami. Odnoszę się do tego jako model AR (p). Modele autoregresyjne są niezwykle elastyczne w obsłudze wielu różnych wzorców serii czasowych. Na rysunku 8.5 przedstawiono dwie serie z modelu AR (1) i modelu AR (2). Zmiana parametrów phi1, kropek, wyników fip w różnych wzorcach szeregów czasowych. Odchylenie terminu błędów et zmieni tylko skalę serii, a nie wzorce. Rysunek 8.5: Dwa przykłady danych z modeli autoregresji o różnych parametrach. Lewo: AR (1) z yt 18 -0.8y et. Po prawej: AR (2) z yt 8 ​​1.3y -0.7y et. W obu przypadkach, normalnie rozprowadzany jest biały szum o średniej zerowej i wariancji. W przypadku modelu AR (1): Gdy phi10, yt odpowiada białemu szumowi. Kiedy phi11 i c0, yt jest równoznaczne z losowym chodem. Kiedy phi11 i cne0, yt jest równoznaczne z przypadkowym chodem z dryftem Gdy phi1lt0, yt ma tendencję do oscylowania między wartościami dodatnimi i ujemnymi. Zwykle ograniczamy modele autoregresji do stacjonarnych danych, a następnie pewne ograniczenia wartości parametrów są wymagane. Dla modelu AR (1): -1 lt phi1 lt 1. Dla modelu AR (2): -1 lt phi2 lt1, phi1phi2 lt 1, phi2-phi1 lt 1. Gdy pge3 ograniczenia są znacznie bardziej skomplikowane. R uwzględnia te ograniczenia podczas szacowania modelu. Dokumentacja c jest stałym wektorem przesunięć, zawierającym n elementów. 934 i to macierze n - by-n dla każdego i. 934 i są matrycami autoregresywnymi. Istnieją matryce o autoregresji, a niektóre mogą być w całości złożone z zer. 949 t jest wektorem szeregowo niezwiązanych innowacji, wektory o długości n. W 949 t są wielowymiarowymi normalnymi wektorami losowymi z matrycą kowariancji 931. 920 j to macierze n - by-n dla każdego j. 920 j to średnie ruchome matryce. Są q średnie ruchome matryce, a niektóre mogą być w całości złożone z zer. 948 jest stałym wektorem liniowych współczynników trendu czasowego z n elementami. x t jest wektorem r - by-1 reprezentującym pojęcia egzogenne w każdym momencie t. r jest liczbą egzogennych serii. Terminy egzogeniczne to dane (lub inne nieopracowane dane wejściowe) w uzupełnieniu do serii czasów odpowiedzi y t. Każda egzogenna seria pojawia się we wszystkich równaniach odpowiedzi. Generalnie, szereg czasowy y t i x t są widoczne. Innymi słowy, jeśli masz dane, reprezentuje jedną lub obie te serie. Nie zawsze znasz offset c. Współczynnik trendu 948. współczynnik 946. matryce autoregresyjne 934 i. i średnie ruchome matryce 920 j. Zazwyczaj chcesz dopasować te parametry do swoich danych. Zobacz oszacowanie sposobów szacowania nieznanych parametrów. Innowacje 949 t nie są widoczne, przynajmniej w danych, chociaż mogą być obserwowalne w symulacjach. Ekonometria Toolboxx2122 umożliwia tworzenie i analizę modelu VAR (p) przy użyciu varm i powiązanych metod. Przedstawiciel Operatora Lag Przedstawiono równorzędną reprezentację liniowych równań autoregresji pod względem operatorów opóźnionych. Operator opóźnienia L przesuwa indeks czasowy o jeden: L y t y t 82111. Operator L m przesuwa indeks czasowy o m. L m t y t 8211 m. W postaci operatora opóźnienia staje się równanie modelu SVARMAX (p. Q) (x03A6 0 x2212 x2211 i 1 p x03A6 i L i) y t c x03B2 x t (x0398 0 x2211 j 1q x0398 j lj) x03B5 t. To równanie można zapisać jako x03A6 (L) y t c x03B2 x t x0398 (L) x03B5 t. Wybierz swój kraj

No comments:

Post a Comment