AR / MA, ARMA ACF - Pacf visualisaties Soos in vorige post. Ek het saam met outoregressiewe en bewegende gemiddelde simulasies. Om die korrektheid van skattings te toets deur ons simulasies, wat ons in diens ACF (Outokorrelasie) en pacf (gedeeltelike outokorrelasie) aan ons gebruik. Vir 'n ander orde van AR en MA, kry ons die verskillende visualisaties met hulle, soos: Eksponensiële dalende kurwe. Gedempte sinusgolwe. Positiewe en negatiewe spykers, ens Terwyl die ontleding en skryf van toetse vir dieselfde, ek het ook 'n paar keer om die data op Ilne en staafgrafieke visualiseer om 'n duideliker prentjie te kry: AR (1) proses AR (1) proses is die outoregressiewe simulasie met Om p 1, dit wil sê, met een waarde van phi. Ideaal AR (p) proses word deur: Om hierdie boots, te installeer statsample-tijdreeksen van hier af. ACF Vir AR (p), moet ACF n demping sinusgolf gee. Die patroon is grootliks afhanklik van die waarde en teken van phi parameters. Wanneer positiewe inhoud in phi koëffisiënte is meer, sal jy 'n sinusgolf beginspan te kry van positiewe kant, anders sal sinusgolf begin van negatiewe kant. Let op, die demping sinusgolf vanaf positiewe kant hier: en negatiewe kant hier. PACF pacf gee pen op lag 0 (waarde 1.0, verstek) en uit lag 1 tot k lag. Die voorbeeld hierbo, beskik AR (2) proses, want dit moet ons are te kry by lag 1-2 as: MA (1) proses MA (1) proses is die bewegende gemiddelde simulasie met orde q 1. dit wil sê, met een waarde van theta. Om dit te boots, gebruik masim metode van Statsample :: ARIMA :: ARIMA MA (Q) proses ACF PACF ARMA (p, q) proses ARMA (p, q) is n kombinasie van outoregressiewe en bewegende gemiddelde simulasies. Wanneer q 0. die proses staan bekend as as suiwer outoregressiewe proses wanneer p 0. die proses is suiwer bewegende gemiddelde. Die simulator van ARMA kan gevind word as armasim in Statsample :: ARIMA :: ARIMA. Vir ARMA (1, 1) proses, hier is die vergelykings van die visualisaties van R en hierdie kode, wat net my dag gemaak :) Cheers, - Ankur Goel Geplaas deur Ankur Goel 20 Julie ste. 2013 Recent Posts GitHub ReposA Correlogram verhaal in data-ontleding, ons gewoonlik begin met die beskrywende statistiese eienskappe van die steekproef data (bv bedoel, standaardafwyking, skeef, kurtose, empiriese verdeling, ens). Hierdie berekeninge is beslis nuttig, maar hulle het nie rekening vir die orde van die waarnemings in die voorbeeld van die data. Tydreeksanalise vereis dat ons aandag gee aan orde, en dus vereis 'n ander tipe van beskrywende statistiek: tydreekse beskrywende statistiek, of bloot correlogram ontleding. Die correlogram analise ondersoek die tyd-ruimtelike afhanklikheid binne die steekproefdata, en fokus op die empiriese motor-kovariansie, outokorrelasie, en verwante statistiese toetse. Ten slotte, die correlogram is 'n hoeksteen vir die identifisering van die model en model orde (s). Wat doen 'n plot vir motor korrelasie (ACF) en / of gedeeltelike outokorrelasie (PACF) vertel ons van die onderliggende proses dinamika Hierdie handleiding is 'n bietjie meer teoretiese as voor tutoriale in dieselfde reeks, maar ons sal ons bes doen om te ry die intuïsies huis vir jou. Agtergrond Eerste, ook begin met 'n definisie vir die outokorrelasie funksie, vereenvoudig dit, en ondersoek die teoretiese ACF vir 'n ARMA-tipe proses. Die gebruik van die MA (Q) outokorrelasie formule, kan ons die ARMA (p, q) outokorrelasie funksies vir hul MA verteenwoordiging bereken: outokorrelasie funksie (ACF) Per definisie, is die motor korrelasie vir lag k soos volg uitgedruk . Dit is om intense Sommige van julle mag dalk wonder waarom havent ons gebruik VAR of 'n toestand ruimte verteenwoordiging aan die notasies te vereenvoudig. Ek het 'n punt om te bly in die tydgebied en vermy enige nuwe idees of wiskunde truuks as hulle ons bedoelings nie hier sou dien: Impliseer die presiese AR / MA einde die gebruik van die ACF waardes deur hulself, wat is niks, maar die presiese. Intuïsie: Die ACF waardes kan beskou word as die koëffisiënt waardes van die ekwivalent MA model. Intuïsie: Die voorwaardelike variansie het geen versperring (effek) op die motor-korrelasie berekeninge. Intuïsie: Die langtermyn beteken ook nie enige versperring (effek) op die motor-korrelasies. Gedeeltelike outokorrelasie funksie (PACF) Teen hierdie tyd het ons gesien dat die identifisering van die model orde (MA of die AR) is nie-triviale vir nie-eenvoudige gevalle, dus moet ons 'n ander instrument gedeeltelike outokorrelasie funksie (PACF). Die gedeeltelike motor korrelasie funksie (PACF) speel 'n belangrike rol in die data-analise wat daarop gemik is die identifisering van die omvang van die lag in 'n outoregressiewe model. Die gebruik van hierdie funksie is ingestel as deel van die Box-Jenkins benadering tot tydreeks modelle, waardeur 'n mens kan bepaal die toepaslike lags p in 'n AR (p) model of in 'n uitgebreide ARIMA (p, d, q) model deur die plot die gedeeltelike motor korrelasie funksies. Eenvoudig gestel, die PACF vir lag k is die regressiekoëffisiënt vir die k-de term, soos hieronder getoon: Die PACF aanvaar die onderliggende model is 'n AR (k) en gebruik verskeie regressies om die laaste regressiekoëffisiënt bereken. Vinnige intuïsie: die PACF waardes kan beskou word (rofweg gesproke) as die koëffisiënt waardes van die ekwivalent AR model. Hoe is die PACF nuttig om ons Veronderstel ons het 'n AR (p) proses, dan is die PACF sal beduidende waardes het vir die eerste p loop, en sal daarna daal tot nul. Wat van die MA Die MA proses het nie-nul PACF waardes vir 'n (teoreties) oneindige aantal lags. Voorbeeld 4: MA (1) Die identifisering van die nommers van AR of MA terme in 'n ARIMA model ACF en PACF erwe: Na 'n tydreeks is stationarized deur breukmetodes, die volgende stap in pas 'n ARIMA model is om te bepaal of AR of MA terme is nodig om enige outokorrelasie wat in die differenced reeks bly reg te stel. Natuurlik, met sagteware soos Stat Graphics, jy kan net probeer om 'n paar verskillende kombinasies van terme en sien wat die beste werk. Maar daar is 'n meer sistematiese manier om dit te doen. Deur te kyk na die outokorrelasie funksie (ACF) en gedeeltelike outokorrelasie (PACF) erwe van die differenced reeks, kan jy voorlopig identifiseer die aantal AR en / of MA terme wat nodig is. Jy is reeds bekend met die ACF plot: dit is bloot 'n kolomgrafiek van die koëffisiënte van korrelasie tussen 'n tydreeks en loop op sigself. Die PACF plot is 'n plot van die gedeeltelike korrelasiekoëffisiënte tussen die reeks en loop op sigself. In die algemeen, die quotpartialquot korrelasie tussen twee veranderlikes is die bedrag van korrelasie tussen hulle wat nie verduidelik word deur hul onderlinge korrelasies met 'n spesifieke stel van ander veranderlikes. Byvoorbeeld, as ons agteruit n veranderlike Y op ander veranderlikes x1, x2, en X3, die gedeeltelike korrelasie tussen Y en X3 is die bedrag van korrelasie tussen Y en X3 wat nie verklaar word deur hul gemeenskaplike korrelasies met X1 en X2. Hierdie gedeeltelike korrelasie kan bereken word as die vierkantswortel van die vermindering in variansie wat bereik word deur die toevoeging van X3 om die regressie van Y op X1 en X2. 'N Gedeeltelike motor korrelasie is die bedrag van korrelasie tussen 'n veranderlike en 'n lag van homself wat nie verklaar word deur korrelasies glad laer-orde - lags. Die outokorrelasie van 'n tydreeks Y by lag 1 is die korrelasiekoëffisiënt tussen Y t en Y t - 1. wat is vermoedelik ook die korrelasie tussen Y t -1 en Y t -2. Maar as Y t is gekorreleer met Y t -1. en Y t -1 gelyk gekorreleer met Y t -2. dan moet ons ook verwag om korrelasie tussen Y t en Y t-2 vind. Trouens, die bedrag van die verband moet ons verwag by lag 2 is juis die vierkant van die lag-1 korrelasie. So, die korrelasie te lag 1 quotpropagatesquot te lag 2 en vermoedelik tot hoër-orde loop. Die gedeeltelike outokorrelasie op lag 2 is dus die verskil tussen die werklike korrelasie by lag 2 en die verwagte korrelasie te danke aan die voortplanting van korrelasie by lag 1. Hier is die outokorrelasie funksie (ACF) van die eenhede reeks, voordat enige breukmetodes uitgevoer: die outokorrelasies is belangrik vir 'n groot aantal lags - maar miskien is die outokorrelasies by lags 2 en bo is net te danke aan die verspreiding van die outokorrelasie op lag 1. dit word bevestig deur die PACF plot: Let daarop dat die PACF plot het 'n beduidende piek net by lag 1, wat beteken dat al die hoër-orde outokorrelasies effektief word verduidelik deur die lag-1 outokorrelasie. Die gedeeltelike outokorrelasies glad lags kan bereken word deur pas 'n reeks outoregressiewe modelle met 'n toenemende aantal lags. In die besonder, die gedeeltelike outokorrelasie op lag k is gelyk aan die geskatte AR (k) koëffisiënt in 'n outoregressiewe model met k terme - d. w.z. 'n meervoudige regressie model waarin Y agteruitgang op LAG (Y, 1), LAG (Y, 2), ens tot LAG (Y, k). Dus, deur blote inspeksie van die PACF jy kan bepaal hoeveel AR terme wat jy nodig het om te gebruik om die outokorrelasie patroon in 'n tydreeks te verduidelik: As die gedeeltelike outokorrelasie is betekenisvol by lag k en nie betekenisvol te eniger hoër orde loop - d. w.z. As die PACF quotcuts offquot by lag k --then dit dui daarop dat jy moet probeer pas 'n outoregressiewe model van orde k Die PACF van die eenhede reeks bied 'n uiterste voorbeeld van die afsnypunt verskynsel: dit het 'n baie groot piek op lag 1 en geen ander beduidende spykers, wat daarop dui dat in die afwesigheid van breukmetodes n AR (1) model moet gebruik word. Dit sal egter die AR (1) term in hierdie model uitdraai gelykstaande aan 'n eerste verskil te wees, want die geskatte AR (1) koëffisiënt (wat is die hoogte van die PACF pen op lag 1) byna presies gelyk aan 1 sal wees . Nou, die voorspelling vergelyking vir 'n AR (1) model vir 'n reeks Y met geen bestellings van breukmetodes is: As die AR (1) koëffisiënt 981 1 in die vergelyking gelyk aan 1 is, is dit gelykstaande aan die voorspelling dat die eerste verskil Y konstant - dit wil sê Dit is gelykstaande aan die vergelyking van die ewekansige loop model met groei: Die PACF van die eenhede reeks is om ons te vertel dat as ons dit nie verskil nie, dan moet ons 'n AR (1) model wat sal uitdraai gelykstaande aan neem om te pas 'n eerste verskil. Met ander woorde, is dit om ons te vertel dat die eenhede regtig 'n bevel breukmetodes word stationarized nodig. AR en MA handtekeninge: As die PACF vertoon 'n skerp donker terwyl die ACF verval stadiger (dws beduidende spykers by 'n hoër lags), sê ons dat die stationarized reeks vertoon 'n quotAR handtekening, quot betekenis dat die outokorrelasie patroon makliker kan verduidelik deur die byvoeging van AR terme as deur die byvoeging MA terme. Jy sal waarskynlik vind dat 'n handtekening AR algemeen geassosieer word met positiewe outokorrelasie op lag 1 - d. w.z. Dit is geneig om op te staan in 'n reeks wat effens onder differenced. Die rede hiervoor is dat 'n AR termyn kan optree soos 'n quotpartial differencequot in die vooruitskatting vergelyking. Byvoorbeeld, in 'n AR (1) model, die AR termyn dade soos 'n eerste verskil indien die outoregressiewe koëffisiënt gelyk aan 1, dit doen niks as die outoregressiewe koëffisiënt nul, en dit werk soos 'n gedeeltelike verskil as die koëffisiënt tussen 0 en 1. Dus, as die reeks effens underdifferenced - dit wil sê indien die nie-stationaire patroon van positiewe outokorrelasie het nie heeltemal uitgeskakel word, sal dit quotask forquot n gedeeltelike verskil deur die vertoon van 'n AR handtekening. Dus, het ons die volgende reël vir die bepaling van wanneer om AR terme voeg: Reël 6: As die PACF van die differenced reeks vertoon 'n skerp donker en / of die lag-1 outokorrelasie positief --i. e. As die reeks verskyn effens quotunderdifferencedquot - dan oorweeg om 'n AR termyn na die model. Die lag waarteen die PACF sny is die aangeduide getal AR terme. In beginsel kan enige outokorrelasie patroon van 'n stationarized reeks verwyder word deur die byvoeging van voldoende outoregressiewe terme (lags van die stationarized reeks) om die voorspelling vergelyking, en die PACF vertel jou hoeveel sulke terme waarskynlik nodig wees. Dit is egter nie altyd die maklikste manier om 'n gegewe patroon van outokorrelasie te verduidelik: soms is dit meer doeltreffend te MA terme (lags van die voorspelling foute) plaas toe te voeg. Die outokorrelasie funksie (ACF) speel dieselfde rol vir MA terme wat die PACF speel vir AR terme - dit wil sê, die ACF vertel jou hoeveel MA terme is waarskynlik nodig wees om die oorblywende outokorrelasie van die differenced reeks te verwyder. As die outokorrelasie is betekenisvol by lag k maar nie op enige hoër lags - d. w.z. As die ACF quotcuts offquot by lag k-- dit dui daarop dat presies k MA terme gebruik moet word in die voorspelling vergelyking. In laasgenoemde geval, sê ons dat die stationarized reeks vertoon 'n quotMA handtekening, quot wat beteken dat die outokorrelasie patroon makliker kan verklaar word deur die toevoeging van MA terme as deur die byvoeging van AR terme. 'N MA handtekening word algemeen geassosieer met negatiewe outokorrelasie op lag 1 - d. w.z. Dit is geneig om op te staan in 'n reeks wat oor differenced effens is. Die rede hiervoor is dat 'n MA termyn quotpartially 'n bevel van breukmetodes kan cancelquot in die vooruitskatting vergelyking. Om dit te sien, onthou dat 'n ARIMA (0,1,1) model sonder konstante is gelykstaande aan 'n Eenvoudige Eksponensiële Smoothing model. Die vooruitskatting vergelyking vir hierdie model is waar die MA (1) koëffisiënt 952 1 stem ooreen met die hoeveelheid 1-945 in die SES model. As 952 1 gelyk is aan 1 is, kom dit ooreen met 'n SES model met 945 0, wat net 'n KONSTANTE model omdat die voorspelling nooit opgedateer. Dit beteken dat wanneer 952 1 gelyk is aan 1 is, is dit eintlik kanselleer die breukmetodes operasie wat gewoonlik in staat stel om die SES voorspel weer anker homself op die laaste waarneming. Aan die ander kant, as die bewegende gemiddelde koëffisiënt gelyk aan 0 is, hierdie model verminder tot 'n ewekansige loop model - d. w.z. dit laat die breukmetodes werking alleen. Dus, as 952 1 is iets groter as 0, is dit asof ons gedeeltelik 'n bevel van breukmetodes kanselleer. As die reeks is reeds effens meer as differenced - d. w.z. As negatiewe outokorrelasie is ingestel - dan sal dit quotask forquot n verskil maak aan gedeeltelik gekanselleer word deur die vertoon van 'n MA handtekening. (Baie arm-swaai aan die gang is hier 'n strenger verduideliking van hierdie effek is gevind in die wiskundige struktuur van ARIMA Models opdragstuk.) Vandaar die volgende addisionele reël: Reël 7: As die ACF van die differenced reeks vertoon 'n skerp donker en / of die lag-1 outokorrelasie negatief --ie As die reeks verskyn effens quotoverdifferencedquot - dan oorweeg om 'n MA termyn na die model. Die lag waarteen die ACF sny is die aangeduide getal MA terme. 'N Model vir die eenhede reeks - ARIMA (2,1,0): Voorheen het ons vasgestel dat die eenhede reeks nodig (ten minste) een einde van nonseasonal breukmetodes word stationarized. Na die neem van 'n nonseasonal verskil - d. w.z. pas 'n ARIMA (0,1,0) model met 'n konstante - die ACF en PACF erwe lyk: Let daarop dat (a) die korrelasie te lag 1 is beduidende en positiewe, en (b) die PACF toon 'n skerper quotcutoffquot as die ACF. In die besonder, die PACF het slegs twee beduidende spykers, terwyl die ACF het vier. So, volgens Reël 7 hierbo, die differenced reeks vertoon 'n AR (2) handtekening. As ons dus stel aan die orde van die AR termyn tot 2 - d. w.z. pas 'n ARIMA (2,1,0) model - ons kry die volgende ACF en PACF erwe vir die residue: Die outokorrelasie op die kritieke lags - naamlik lags 1 en 2 - is uitgeskakel, en daar is geen merkbare patroon in hoër-orde loop. Die tydreekse plot van die residue toon 'n effens kommerwekkende neiging om weg van die gemiddelde dwaal: Die opsomming ontleding verslag toon dat die model nietemin voer baie goed in die tydperk validering, sowel AR koëffisiënte is beduidend verskillend van nul, en die standaard afwyking van die residue is verminder 1,54371-1,4215 (byna 10) deur die byvoeging van die AR terme. Verder is daar geen teken van 'n quotunit rootquot omdat die som van die AR koëffisiënte (0.2522540.195572) is nie naby aan 1. (Eenheid wortels word op meer besonderhede hieronder.) In die geheel gesien, blyk dit 'n goeie model wees . Die (ongetransformeerde) voorspellings vir die model toon 'n lineêre opwaartse neiging geprojekteer in die toekoms: die tendens in die lang termyn voorspellings is te wyte aan die feit dat die model sluit een nonseasonal verskil en 'n konstante term: hierdie model is basies 'n ewekansige loop met groei verfyn deur die toevoeging van twee outoregressiewe terme - dit wil sê twee lags van die differenced reeks. Die helling van die langtermyn-voorspellings (dit wil sê die gemiddelde toename van een tydperk na 'n ander) is gelyk aan die gemiddelde termyn in die model opsomming (0,467566). Die vooruitskatting vergelyking is: waar 956 is die konstante term in die model opsomming (0,258178), 981 1 is die AR (1) koëffisiënt (0,25224) en 981 2 is die AR (2) koëffisiënt (0,195572). Beteken teenoor konstante: In die algemeen, die quotmeanquot term in die opbrengs van 'n ARIMA model verwys na die gemiddeld van die differenced reeks (dit wil sê die gemiddelde tendens as die einde van breukmetodes is gelyk aan 1), terwyl die quotconstantquot is die konstante term wat verskyn op die regterkantste-kant van die voorspelling vergelyking. Die gemiddelde en konstante terme verwant deur die vergelyking: CONSTANT beteken: (1 minus die som van die AR koëffisiënte). In hierdie geval, ons het 0.258178 0.467566 Dienste (1 - ,25224-0,195572) alternatiewe model vir die eenhede reeks - ARIMA (0,2,1): Onthou dat wanneer ons begin om die eenhede reeks analiseer, was ons nie heeltemal seker van die korrekte volgorde van breukmetodes om te gebruik. Een orde van nonseasonal breukmetodes opgelewer die laagste standaardafwyking (en 'n patroon van ligte positiewe outokorrelasie), terwyl twee bestellings van nonseasonal breukmetodes opgelewer 'n meer stilstaande-soek tydreekse plot (maar met eerder sterk negatiewe outokorrelasie). Hier is beide die ACF en PACF van die reeks met twee nonseasonal verskille: Die enkele negatiewe pen op lag 1 in die ACF is 'n MA (1) handtekening, volgens Reël 8 hierbo. So, as ons 2 nonseasonal verskille te gebruik, sou ons ook wil 'n MA (1) termyn, opbrengs 'n ARIMA (0,2,1) model sluit. Volgens Reël 5, sal ons ook wil die konstante term te onderdruk. Hier is dan is die resultate van pas 'n ARIMA (0,2,1) model sonder konstante: Let daarop dat die beraamde wit geraas standaardafwyking (RMSE) is slegs 'n baie effens hoër vir hierdie model as die vorige een (1,46301 hier teenoor 1,45215 voorheen). Die vooruitskatting vergelyking vir hierdie model is: waar theta-1 is die MA (1) koëffisiënt. Onthou dat dit is soortgelyk aan 'n lineêre Eksponensiële Smoothing model, met die MA (1) koëffisiënt wat ooreenstem met die hoeveelheid 2 (1-alfa) in die LES model. Die MA (1) koëffisiënt van 0,76 in hierdie model stel voor dat 'n LES model met alfa in die omgewing van 0.72 ewe goed sou pas nie. Eintlik, wanneer 'n LES model om dieselfde data is toegerus, die optimale waarde van alfa blyk te wees om 0.61 wees, wat nie te ver nie. Hier is 'n model vergelyking verslag dat die resultate van pas die ARIMA (2,1,0) model met 'n konstante toon, die ARIMA (0,2,1) model sonder konstante, en die LES model: Die drie modelle uit te voer byna identies in die skatting tydperk, en die ARIMA (2,1,0) model met 'n konstante verskyn effens beter as die ander twee in die tydperk bekragtiging. Op grond van hierdie statistiese resultate alleen, sou dit moeilik wees om te kies tussen die drie modelle. Maar as ons plot die langtermyn voorspellings gemaak deur die ARIMA (0,2,1) model sonder konstante (wat in wese dieselfde as dié van die LES model is), sien ons 'n beduidende verskil van dié van die vorige model: die voorspellings het 'n bietjie minder van 'n opwaartse neiging as dié van die vorige model - omdat die plaaslike tendens naby die einde van die reeks is 'n bietjie minder as die gemiddelde tendens oor die hele reeks - maar die vertrouensintervalle verbreed baie vinniger. Die model met twee bestellings van breukmetodes aanvaar dat die tendens in die reeks is-time wisselende, dus is dit van mening dat die verre toekoms baie meer onseker as werk die model met slegs een einde van breukmetodes wees. Watter model moet ons kies Dit hang af van die aannames ons is gemaklik maak met betrekking tot die konstantheid van die tendens in die data. Die model met slegs een einde van breukmetodes veronderstel 'n konstante gemiddelde tendens - dit is in wese 'n fyn gestem ewekansige loop model met groei - en dit maak dus relatief konserwatiewe tendens projeksies. Dit is ook redelik optimisties oor die akkuraatheid waarmee dit meer as een tydperk wat voorlê kan voorspel. Die model met twee bestellings van breukmetodes neem 'n tyd wat wissel plaaslike tendens - dit is in wese 'n lineêre eksponensiële gladstryking model - en sy tendens projeksies is ietwat meer meer wisselvallige. As 'n algemene reël in hierdie soort situasie, sou ek aanbeveel die keuse van die model met die laer orde van breukmetodes, ander dinge min of meer gelyk. In die praktyk, ewekansige loop of eenvoudige eksponensiële-glad modelle lyk dikwels beter as lineêre eksponensiële gladstryking modelle werk. Gemengde modelle: In die meeste gevalle, die beste model blyk 'n model wat óf net AR terme of net MA terme gebruik, hoewel dit in sommige gevalle 'n quotmixedquot model met beide AR en MA terme kan die beste geskik is om die data te voorsien. Daar moet egter sorg uitgeoefen toe pas gemengde modelle. Dit is moontlik vir 'n AR termyn en 'n MA termyn aan elke ander effekte te kanselleer. selfs al het beide kan betekenisvolle rol in die model verskyn (soos beoordeel deur die t-statistiek van hul koëffisiënte). So, byvoorbeeld, veronderstel dat die quotcorrectquot model vir 'n tydreeks is 'n ARIMA (0,1,1) model, maar in plaas daarvan jy pas 'n ARIMA (1,1,2) model - d. w.z. jy sluit een addisionele AR termyn en een addisionele MA termyn. Toe die bykomende terme kan eindig verskyn betekenisvolle rol in die model, maar intern kan hulle net werk teen mekaar. Die gevolglike parameterberaming mag dubbelsinnig wees, en die parameter beraming proses kan baie (bv meer as 10) iterasies om saam te kom neem. Vandaar: Reël 8: Dit is moontlik vir 'n AR termyn en 'n MA termyn aan elke ander effekte te kanselleer, so as 'n gemengde AR-MA model lyk die data te pas, ook 'n model met een minder AR termyn en een minder MA termyn probeer --particularly as die parameter ramings in die oorspronklike model vereis meer as 10 iterasies om saam te kom. Om hierdie rede, kan ARIMA modelle nie geïdentifiseer word deur quotbackward stepwisequot benadering wat beide AR en MA terme insluit. Met ander woorde, kan jy nie begin deur die insluiting van 'n paar terme van elke soort en dan gooi die kinders wie se beraamde koëffisiënte is nie betekenisvol nie. In plaas daarvan, jy gewoonlik volg 'n quotforward stepwisequot benadering, en voeg terme van een soort of die ander, soos aangedui deur die voorkoms van die ACF en PACF erwe. Eenheid wortels: As 'n reeks is erg onder - of overdifferenced - d. w.z. As 'n geheel orde van breukmetodes moet bygevoeg of gekanselleer word, is dit dikwels te kenne gegee deur 'n quotunit rootquot in die geskatte AR of MA koëffisiënte van die model. 'N AR (1) model word gesê dat 'n eenheid wortel hê as die beraamde AR (1) koëffisiënt is byna presies gelyk aan 1. (Deur quotexactly gelyk quot ek regtig beteken nie beduidend verskil van. In terme van die koëffisiënte vaandel fout. ) Wanneer dit gebeur, beteken dit dat die AR (1) term word juis 'n eerste verskil, in welke geval jy die AR (1) termyn moet verwyder en voeg 'n bevel breukmetodes plaas naboots. (Dit is presies wat sal gebeur as jy 'n AR (1) model op die ongedifferensiëerde EENHEDE reeks toegerus, soos vroeër opgemerk.) In 'n hoër-orde AR model, 'n eenheid wortel bestaan in die AR deel van die model as die som van die AR koëffisiënte is presies gelyk aan 1. In hierdie geval, moet jy die einde van die AR termyn te verminder deur 1 en voeg 'n bevel van breukmetodes. 'N tyd-reeks met 'n eenheid wortel in die AR koëffisiënte is stationaire --i. e. dit het 'n hoër orde van breukmetodes. Reël 9: As daar 'n eenheid wortel in die AR deel van die model - d. w.z. As die som van die AR koëffisiënte is byna presies 1 - moet jy die aantal AR terme verminder deur een en die orde van breukmetodes verhoog deur een. Net so, is 'n MA (1) model het 'n eenheid wortel hê as die beraamde MA (1) koëffisiënt is presies gelyk aan 1. Wanneer dit gebeur, beteken dit dat die MA (1) term presies kansellasie van 'n eerste verskil, in welke geval, moet jy die MA verwyder (1) termyn en ook aan die orde van breukmetodes verminder deur een. In 'n hoër-orde MA model, 'n eenheid wortel bestaan as die som van die MA koëffisiënte is presies gelyk aan 1. Reël 10: As daar 'n eenheid wortel in die MA deel van die model - d. w.z. As die som van die MA koëffisiënte is byna presies 1 - moet jy die aantal MA terme verminder deur een en die orde van breukmetodes verminder deur een. Byvoorbeeld, as jy pas 'n lineêre eksponensiële gladstryking model ( 'n ARIMA (0,2,2) model) wanneer 'n eenvoudige eksponensiële gladstryking model ( 'n ARIMA (0,1,1) model) voldoende sou gewees het, jy mag vind dat die som van die twee MA koëffisiënte is byna gelyk aan 1. deur die vermindering van die MA orde en die orde van breukmetodes deur een elk, jy die meer gepaste SES model te verkry. 'N voorspelling model met 'n eenheid wortel in die geskatte MA koëffisiënte word gesê noninvertible te wees. Dit beteken dat die residue van die model nie kan beskou word as skattings van die quottruequot ewekansige geluid wat gegenereer die tydreeks. Nog 'n simptoom van 'n eenheid wortel is dat die voorspellings van die model kan quotblow upquot of andersins vreemd optree. As die tyd reeks plot van die langer termyn voorspellings van die model lyk vreemd, moet jy die beraamde koëffisiënte van jou model te gaan vir die teenwoordigheid van 'n eenheid wortel. Reël 11: As die langtermyn voorspellings verskyn wisselvallige of onstabiel is, kan daar 'n eenheid wortel in die AR of MA koëffisiënte wees. Nie een van hierdie probleme ontstaan met die twee modelle hier toegerus, want ons was versigtig om te begin met geloofwaardige bestellings van breukmetodes en toepaslike nommers van AR en MA koëffisiënte deur die bestudering van die ACF en PACF modelle. Meer gedetailleerde bespreking van eenheid wortels en kansellasie effekte tussen AR en MA terme kan gevind word in die wiskundige struktuur van ARIMA Models handout.2.1 bewegende gemiddelde modelle (MA modelle) tydreeksmodelle bekend as ARIMA modelle kan outoregressiewe terme en / of bewegende gemiddelde sluit terme. In Week 1, het ons geleer 'n outoregressiewe term in 'n tydreeks model vir die veranderlike x t is 'n vertraagde waarde van x t. Byvoorbeeld, 'n lag 1 outoregressiewe termyn is x t-1 (vermenigvuldig met 'n koëffisiënt). Hierdie les definieer bewegende gemiddelde terme. 'N bewegende gemiddelde termyn in 'n tydreeks model is 'n verlede fout (vermenigvuldig met 'n koëffisiënt). Laat (WT omslaan N (0, sigma2w)), wat beteken dat die w t is identies, onafhanklik versprei, elk met 'n normaalverdeling met gemiddelde 0 en dieselfde afwyking. Die 1 ste orde bewegende gemiddelde model, aangedui deur MA (1) is (xt mu wt theta1w) Die 2de orde bewegende gemiddelde model, aangedui deur MA (2) is (xt mu wt theta1w theta2w) Die Q de orde bewegende gemiddelde model , aangedui deur MA (Q) is (xt mu wt theta1w theta2w kolle thetaqw) Nota. Baie handboeke en sagteware programme definieer die model met negatiewe tekens voor die terme. Dit nie die geval verander die algemene teoretiese eienskappe van die model, hoewel dit flip die algebraïese tekens van beraamde koëffisiënt waardes en (unsquared) terme in formules vir ACFs en afwykings. Jy moet jou sagteware kyk om te kontroleer of negatiewe of positiewe tekens is gebruik om korrek te skryf die beraamde model. R gebruik positiewe tekens in sy onderliggende model, soos ons hier doen. Teoretiese Eienskappe van 'n tydreeks met 'n MA (1) Model Let daarop dat die enigste nie-nul waarde in die teoretiese ACF is vir lag 1. Alle ander outokorrelasies is 0. So 'n monster ACF met 'n beduidende outokorrelasie net by lag 1 is 'n aanduiding van 'n moontlike MA (1) model. Vir belangstellende studente, bewyse van hierdie eienskappe is 'n bylae tot hierdie opdragstuk. Voorbeeld 1 Veronderstel dat 'n MA (1) model is x t 10 w t 0,7 w t-1. waar (WT omslaan N (0,1)). So het die koëffisiënt 1 0.7. Die teoretiese ACF gegee word deur 'n plot van hierdie volg ACF. Die plot net aangedui is die teoretiese ACF vir 'n MA (1) met 1 0.7. In die praktyk, 'n monster gewoond gewoonlik verskaf so 'n duidelike patroon. Die gebruik van R, gesimuleerde ons N 100 monster waardes gebruik te maak van die model x t 10 w t 0,7 w t-1 waar w t IID N (0,1). Vir hierdie simulasie, 'n tydreeks plot van die steekproefdata volg. Ons kan nie sê baie van hierdie plot. Die monster ACF vir die gesimuleerde data volg. Ons sien 'n skerp styging in lag 1 gevolg deur die algemeen nie-beduidende waardes vir lags afgelope 1. Let daarop dat die monster ACF kom nie ooreen met die teoretiese patroon van die onderliggende MA (1), en dit is dat al outokorrelasies vir lags afgelope 1 sal wees 0 . 'n ander voorbeeld sou 'n effens verskillende monster ACF hieronder getoon, maar sal waarskynlik dieselfde breë funksies. Theroretical Eienskappe van 'n tydreeks met 'n MA (2) model vir die MA (2) model, teoretiese eienskappe is soos volg: Let daarop dat die enigste nie-nul waardes in die teoretiese ACF is vir lags 1 en 2. outokorrelasies vir hoër lags is 0 . So, 'n monster ACF met 'n beduidende outokorrelasies by lags 1 en 2, maar nie-beduidende outokorrelasies vir hoër lags dui op 'n moontlike MA (2) model. IID N (0,1). Die koëffisiënte is 1 0.5 en 2 0.3. Want dit is 'n MA (2), sal die teoretiese ACF nul waardes het net by lags 1 en 2. Waardes van die twee nie-nul outokorrelasies is 'n plot van die teoretiese ACF volg. Soos byna altyd die geval is, monster data gewoond te tree heeltemal so perfek as teorie. Ons gesimuleerde N 150 monster waardes vir die model x t 10 w t 0,5 w t-1 0,3 w t-2. waar w t IID N (0,1). Die tydreekse plot van die data volg. Soos met die tydreeks plot vir die MA (1) voorbeeld van die data, kan nie vir jou sê baie daaruit. Die monster ACF vir die gesimuleerde data volg. Die patroon is tipies vir situasies waar 'n MA (2) model nuttig kan wees. Daar is twee statisties beduidende spykers by lags 1 en 2, gevolg deur nie-beduidende waardes vir ander lags. Let daarop dat as gevolg van steekproeffout, die monster ACF nie die teoretiese patroon presies ooreenstem. ACF vir Algemene MA (Q) Models n eiendom van MA (Q) modelle in die algemeen is dat daar nie-nul outokorrelasies vir die eerste Q lags en outokorrelasies 0 vir alle lags GT q. Nie-uniekheid van verband tussen waardes van 1 en (rho1) in MA (1) Model. In die MA (1) model, vir enige waarde van 1. die wedersydse 01/01 gee dieselfde waarde vir so 'n voorbeeld, gebruik 0,5 vir 1. en gebruik dan 1 / (0,5) 2 vir 1. Jy sal kry (rho1) 0.4 in beide gevalle. Om 'n teoretiese beperking genoem inverteerbaarheid bevredig. Ons beperk MA (1) modelle om waardes met absolute waarde minder as 1. In die voorbeeld net gegee, 1 0.5 sal 'n toelaatbare parameter waarde wees nie, terwyl 1 1 / 0.5 2 nie. Inverteerbaarheid van MA modelle 'n MA-model word gesê omkeerbare te wees indien dit algebraïes gelykstaande aan 'n konvergerende oneindige orde AR model. Bevestig deur die, bedoel ons dat die AR koëffisiënte daal tot 0 as ons terug beweeg in die tyd. Inverteerbaarheid is 'n beperking geprogrammeer in die tyd reeks sagteware wat gebruik word om die koëffisiënte van modelle te skat met MA terme. Dit is nie iets wat ons gaan vir die data-analise. Fig. Fig. Fig. Fig. Fig. Fig. Fig.
No comments:
Post a Comment