Wednesday 11 October 2017

Rmse Mobile Media


implementazione foglio di calcolo di destagionalizzazione e di livellamento esponenziale Si è semplice da eseguire destagionalizzazione e adatto ai modelli di livellamento esponenziale utilizzando Excel. Le immagini dello schermo e grafici qui sotto sono tratte da un foglio di calcolo che è stato istituito per illustrare destagionalizzazione moltiplicativa e livellamento esponenziale lineare sui seguenti dati di vendita trimestrali fuoribordo Marine: Per ottenere una copia del file foglio di calcolo in sé, clicca qui. La versione di livellamento esponenziale lineare che verrà utilizzato qui per scopi di dimostrazione è versione Brown8217s, solo perché può essere implementato con una singola colonna di formule e c'è solo uno smoothing costante per ottimizzare. Di solito è meglio utilizzare la versione Holt8217s che ha costanti di livellamento separati per il livello e tendenza. Il ricavato processo di previsione come segue: (i) prima i dati sono destagionalizzati (ii) allora le previsioni vengono generati per i dati destagionalizzati tramite livellamento esponenziale lineare e (iii) infine le previsioni destagionalizzati sono quotreseasonalizedquot per ottenere le previsioni per la serie originale . Il processo di registrazione stagionale avviene nelle colonne D attraverso G. Il primo passo nella regolazione stagionale è quello di calcolare una media mobile centrata (eseguita qui nella colonna D). Questo può essere fatto prendendo la media di due medie a livello di un anno che sono compensate da un periodo rispetto all'altro. (Una combinazione di due compensato medie piuttosto che è necessario un unico media a fini di centraggio quando il numero di stagioni è ancora.) Il passo successivo è quello di calcolare il rapporto di movimento --i. e media. i dati originali diviso per la media mobile in ogni periodo - che viene eseguita qui nella colonna E. (Questo è anche chiamato la componente quottrend-cyclequot del modello, nella misura in cui gli effetti di tendenza e di business del ciclo potrebbero essere considerati tutto ciò che rimane dopo una media di più di un intero anni di dati. ovviamente, i cambiamenti mese per mese, che non sono a causa della stagionalità potrebbe essere determinato da molti altri fattori, ma la media di 12 mesi leviga su di loro in gran parte). il Indice stagionale stimato per ogni stagione viene calcolato prima media di tutti i rapporti di quella particolare stagione, che è fatto in cellule G3-G6 utilizzando una formula AVERAGEIF. I rapporti medi sono quindi riscalati modo che sommano a esattamente 100 volte il numero di periodi in una stagione, o 400 in questo caso, che è fatto in cellule H3-H6. Sotto nella colonna F, formule VLOOKUP sono usati per inserire il valore di indice stagionale appropriata in ogni riga della tabella di dati, secondo il trimestre che rappresenta. La centrato media mobile e dati destagionalizzati finire per assomigliare questo: Si noti che la media mobile si presenta tipicamente come una versione più agevole della serie destagionalizzata, ed è più corto su entrambe le estremità. Un altro foglio di lavoro nello stesso file di Excel mostra l'applicazione del modello di livellamento esponenziale lineare ai dati destagionalizzati, a partire nella colonna G. Un valore per il livellamento costante (alpha) viene inserito sopra la colonna del tempo (qui, nella cella H9) e per comodità è assegnato il nome di intervallo quotAlpha. quot (il nome viene assegnato utilizzando il comando quotInsertNameCreatequot.) il modello LES viene inizializzato impostando i primi due previsioni pari al primo valore effettivo della serie destagionalizzate. La formula usata qui per la previsione LES è il singolo-equazione forma ricorsiva di modello Brown8217s: Questa formula viene immessa nella cella corrispondente al terzo periodo (qui, H15 cellulare) e copiato giù di lì. Si noti che il LES previsioni per il periodo attuale si riferisce alle due osservazioni precedenti e le due errori di previsione precedenti, nonché al valore di alfa. Così, la formula di previsione nella riga 15 si riferisce solo ai dati che erano disponibili nella riga 14 e precedenti. (Naturalmente, se volessimo usare semplice invece di livellamento esponenziale lineare, potremmo sostituire la formula SES qui invece. Potremmo anche utilizzare Holt8217s piuttosto che il modello Brown8217s LES, che richiederebbe altre due colonne di formule per calcolare il livello e la tendenza che vengono utilizzati nella previsione.) gli errori vengono calcolati nella colonna successiva (qui, colonna J) sottraendo le previsioni dai valori reali. L'errore quadratico medio radice è calcolato come la radice quadrata della varianza degli errori più il quadrato della media. (Questo segue dall'identità matematica:. MSE varianza (errori) (media (errori)) 2) Per il calcolo della media e la varianza degli errori in questa formula, i primi due periodi sono esclusi in quanto il modello in realtà non inizia previsione fino il terzo periodo (riga 15 sul foglio di calcolo). Il valore ottimale di alfa può essere trovata o modificando manualmente alfa fino a trovare la RMSE minimo, oppure è possibile utilizzare il quotSolverquot per eseguire una minimizzazione esatto. Il valore di alfa che il Risolutore ha trovato è mostrata qui (alpha0.471). Di solito è una buona idea per tracciare gli errori del modello (in unità trasformate) e anche per calcolare e tracciare le autocorrelazioni a ritardi fino a una stagione. Ecco un grafico serie storica degli errori (destagionalizzati): I autocorrelazioni di errore sono calcolati utilizzando la funzione CORRELAZIONE () per calcolare le correlazioni degli errori con se stessi ritardato da uno o più periodi - i dettagli sono riportati nel modello foglio di calcolo . Ecco un grafico delle autocorrelazioni degli errori ai primi cinque GAL: I autocorrelazioni a ritardi da 1 a 3 sono molto vicini allo zero, ma il picco in ritardo 4 (il cui valore è di 0,35) è un po 'fastidioso - suggerisce che il processo di aggiustamento stagionale non è stato del tutto efficace. Tuttavia, in realtà è solo marginalmente significativa. 95 bande di significatività per testare se autocorrelazioni sono significativamente diversi da zero sono approssimativamente più-o-meno 2SQRT (n-k), dove n è la dimensione del campione e k è il ritardo. Qui n è 38 e k varia da 1 a 5, quindi la radice quadrata di-n-minus-k è di circa 6 per tutti loro, e quindi i limiti per testare la significatività statistica delle deviazioni da zero sono circa plus - o-meno 26, o 0,33. Se si varia il valore di alfa mano in questo modello Excel, è possibile osservare l'effetto sulla serie e trame autocorrelazione degli errori, nonché sull'errore radice-quadratico medio, che verrà illustrato di seguito. Nella parte inferiore del foglio di calcolo, la formula di previsione è quotbootstrappedquot verso il futuro, semplicemente sostituendo le previsioni per i valori effettivi nel punto in cui i dati effettivi si esaurisce - i. e. dove inizia quotthe futurequot. (In altre parole, in ogni cella in cui si avrebbe un valore di dati futuro, viene inserito un riferimento di cella che punta alla previsione fatta per quel periodo.) Tutte le altre formule sono semplicemente copiati dall'alto: Si noti che gli errori di previsioni futuro sono tutti calcolati a zero. Questo non significa che gli errori effettivi saranno pari a zero, ma piuttosto riflette semplicemente il fatto che ai fini della previsione assumiamo che i dati futuri sarà uguale previsioni in media. Le previsioni LES ne derivano per i dati destagionalizzati assomigliano a questo: Con questo particolare valore di alfa, che è ottimale per le previsioni di un periodo a venire, la tendenza proiettata è leggermente verso l'alto, riflettendo la tendenza locale che è stato osservato nel corso degli ultimi 2 anni o giù di lì. Per altri valori di alfa, una proiezione tendenza molto differente potrebbe essere ottenuta. Di solito è una buona idea per vedere cosa succede alla proiezione tendenza a lungo termine, quando alfa è vario, perché il valore che è meglio per la previsione a breve termine non sarà necessariamente il miglior valore per predire il futuro più lontano. Ad esempio, qui è il risultato che si ottiene se il valore di alfa è impostato manualmente 0.25: La tendenza prevista a lungo termine è ora negativo piuttosto che positivo con un valore inferiore di alfa, il modello sta mettendo più peso sui dati più vecchi in la sua stima del livello attuale e la tendenza, e le sue previsioni a lungo termine riflettono la tendenza al ribasso osservata nel corso degli ultimi 5 anni, piuttosto che la più recente tendenza al rialzo. Questo grafico anche illustra chiaramente come il modello con un valore minore di alfa è più lento a rispondere alle quotturning pointsquot nei dati e quindi tende a fare un errore dello stesso segno per molti periodi di fila. I suoi errori di previsione 1-step-ahead sono più grandi, in media, rispetto a quelli ottenuti prima (RMSE del 34,4 invece di 27,4) e fortemente autocorrelato positivamente. Il lag-1 autocorrelazione di 0,56 supera notevolmente il valore di 0,33 sopra calcolato per una deviazione statisticamente significativa da zero. In alternativa al gomito giù il valore di alfa al fine di introdurre più conservatrice in previsioni a lungo termine, un fattore quottrend dampeningquot è talvolta aggiunta al modello per rendere la tendenza prevista appiattirsi dopo alcuni periodi. Il passo finale nella costruzione del modello di previsione è quello di quotreasonalizequot le previsioni LES moltiplicandoli per gli opportuni indici stagionali. Così, le previsioni reseasonalized nella colonna I sono semplicemente il prodotto degli indici stagionali in colonna F e le previsioni LES destagionalizzati nella colonna H. E 'relativamente facile calcolare gli intervalli di confidenza per le previsioni one-step-avanti fatti da questo modello: prima calcolare l'RMSE (errore di root-mean-squared, che è solo la radice quadrata del MSE) e poi calcolare un intervallo di confidenza per la destagionalizzato previsione aggiungendo e sottraendo due volte RMSE. (In generale, un intervallo di 95 confidenza per una previsione di un periodo in anticipo è pari a circa il punto di previsione più-o-meno-due volte la deviazione standard stimata dei errori di previsione, assumendo che la distribuzione di errore è approssimativamente normale e la dimensione del campione è abbastanza grande, diciamo, 20 o più. Qui, il RMSE piuttosto che la deviazione standard del campione degli errori è la migliore stima della deviazione standard degli errori di previsione in futuro, perché ci vuole pregiudizi e variazioni casuali in considerazione.) i limiti di confidenza per la previsione delle variazioni stagionali sono poi reseasonalized. insieme con le previsioni, moltiplicandoli dagli opportuni indici stagionali. In questo caso il RMSE è pari a 27,4 e la previsione destagionalizzato per il primo periodo futuro (Dec-93) è 273,2. in modo che il destagionalizzato 95 intervallo di confidenza è 273,2-227,4 218,4 a 328,0 273.2227.4. Moltiplicando questi limiti per Decembers indice stagionale di 68.61. otteniamo inferiori e superiori limiti di fiducia dei 149,8 e 225,0 intorno al punto di previsione Dic-93 di 187,4. limiti di confidenza per le previsioni più di un periodo a venire saranno generalmente allargano le previsioni aumenta all'orizzonte, a causa dell'incertezza circa il livello e la tendenza, così come i fattori stagionali, ma è difficile da calcolare loro, in generale, con metodi analitici. (Il modo appropriato per calcolare i limiti di confidenza per le previsioni del LES è quello di utilizzare la teoria ARIMA, ma l'incertezza negli indici di stagione è un altro discorso.) Se si desidera un intervallo di confidenza realistico per una previsione più di un periodo avanti, prendendo tutte le fonti di errore di conto, la cosa migliore è quella di utilizzare metodi empirici: per esempio, per ottenere un intervallo di confidenza per un 2-passo avanti previsione, si potrebbe creare un'altra colonna sul foglio di calcolo per calcolare una previsione 2-step-in anticipo per ogni periodo ( dal bootstrap previsione one-step-ahead). Poi calcolare la RMSE degli errori di previsione 2-step-avanti e utilizzare questo come base per una sicurezza 2-step-avanti interval. Moving modelli medi e esponenziale Come primo passo per andare oltre i modelli medi, modelli random walk, e modelli trend lineare, i modelli non stagionali e le tendenze possono essere estrapolati utilizzando un modello a media mobile o levigante. L'assunto di base dietro media e modelli di livellamento è che la serie temporale è localmente stazionario con una media lentamente variabile. Quindi, prendiamo una media mobile (locale) per stimare il valore corrente della media e poi utilizzarla come la previsione per il prossimo futuro. Questo può essere considerato come un compromesso tra il modello media e la deriva modello random walk-senza-. La stessa strategia può essere utilizzata per stimare e estrapolare una tendenza locale. Una media mobile è spesso chiamato una versione quotsmoothedquot della serie originale, perché la media a breve termine ha l'effetto di appianare i dossi nella serie originale. Regolando il grado di lisciatura (la larghezza della media mobile), possiamo sperare di colpire un qualche tipo di equilibrio ottimale tra le prestazioni dei modelli medi e random walk. Il tipo più semplice di modello di media è il. Semplice (equamente ponderate) Media mobile: Le previsioni per il valore di Y al tempo t1 che viene fatta al tempo t è pari alla media semplice dei più recenti osservazioni m: (Qui e altrove mi utilizzerà il simbolo 8220Y-hat8221 di stare per una previsione di serie temporali Y fatta quanto prima prima possibile da un dato modello.) Questa media è centrato periodo t - (m1) 2, il che implica che la stima della media locale tenderà a restare indietro il vero valore della media locale circa (m1) 2 periodi. Così, diciamo l'età media dei dati nella media mobile semplice (m1) 2 rispetto al periodo per il quale è calcolata la previsione: questa è la quantità di tempo per cui previsioni tenderanno a restare indietro ruotando punti nei dati . Ad esempio, se si sta una media degli ultimi 5 valori, le previsioni saranno circa 3 periodi in ritardo nel rispondere a punti di svolta. Si noti che se m1, il modello di media mobile semplice (SMA) è equivalente al modello random walk (senza crescita). Se m è molto grande (paragonabile alla lunghezza del periodo di stima), il modello SMA è equivalente al modello medio. Come con qualsiasi parametro di un modello di previsione, è consuetudine per regolare il valore di k per ottenere la migliore quotfitquot ai dati, cioè i più piccoli errori di previsione in media. Ecco un esempio di una serie che sembra mostrare fluttuazioni casuali intorno a una media lentamente variabile. Innanzitutto, proviamo per adattarsi con un modello casuale, che è equivalente a una media mobile semplice di 1 termine: Il modello random walk risponde molto velocemente alle variazioni della serie, ma così facendo raccoglie gran parte del quotnoisequot nel dati (le fluttuazioni casuali) e il quotsignalquot (media locale). Se invece cerchiamo una semplice media mobile di 5 termini, si ottiene un insieme più agevole dall'aspetto delle previsioni: Il 5-termine mobile semplice rese medie in modo significativo gli errori più piccoli rispetto al modello random walk in questo caso. L'età media dei dati di questa previsione è 3 ((51) 2), in modo che tende a ritardo punti di svolta da circa tre periodi. (Per esempio, una flessione sembra essersi verificato in periodo di 21, ma le previsioni non girare intorno fino a diversi periodi più tardi.) Si noti che le previsioni a lungo termine dal modello SMA sono una retta orizzontale, proprio come nel random walk modello. Pertanto, il modello SMA presuppone che vi sia alcuna tendenza nei dati. Tuttavia, mentre le previsioni del modello random walk sono semplicemente uguale all'ultimo valore osservato, le previsioni del modello di SMA sono pari ad una media ponderata dei valori ultimi. I limiti di confidenza calcolato dai Statgraphics per le previsioni a lungo termine della media mobile semplice non ottengono più ampio con l'aumento della previsione all'orizzonte. Questo ovviamente non è corretto Purtroppo, non vi è alcuna teoria statistica di fondo che ci dice come gli intervalli di confidenza deve ampliare per questo modello. Tuttavia, non è troppo difficile da calcolare le stime empiriche dei limiti di confidenza per le previsioni di più lungo orizzonte. Ad esempio, è possibile impostare un foglio di calcolo in cui il modello SMA sarebbe stato utilizzato per prevedere 2 passi avanti, 3 passi avanti, ecc all'interno del campione di dati storici. È quindi possibile calcolare le deviazioni standard campione degli errori in ogni orizzonte di previsione, e quindi la costruzione di intervalli di confidenza per le previsioni a lungo termine aggiungendo e sottraendo multipli della deviazione standard appropriato. Se cerchiamo una media del 9 termine semplice movimento, otteniamo le previsioni ancora più fluide e più di un effetto ritardo: L'età media è ora 5 punti ((91) 2). Se prendiamo una media mobile 19-termine, l'età media aumenta a 10: Si noti che, in effetti, le previsioni sono ora in ritardo punti di svolta da circa 10 periodi. Quale quantità di smoothing è meglio per questa serie Ecco una tabella che mette a confronto le loro statistiche di errore, anche compreso in media 3-termine: Modello C, la media mobile a 5-termine, i rendimenti il ​​valore più basso di RMSE da un piccolo margine su 3 - term e 9 termine medie, e le loro altre statistiche sono quasi identici. Così, tra i modelli con le statistiche di errore molto simili, possiamo scegliere se avremmo preferito un po 'più di risposta o un po' più scorrevolezza nelle previsioni. (Torna a inizio pagina.) Browns semplice esponenziale (media mobile esponenziale ponderata) Il modello a media mobile semplice di cui sopra ha la proprietà indesiderabile che tratta le ultime osservazioni k ugualmente e completamente ignora tutte le osservazioni che precedono. Intuitivamente, dati passati devono essere attualizzati in modo più graduale - per esempio, il più recente osservazione dovrebbe avere un peso poco più di 2 più recente, e la 2 più recente dovrebbe ottenere un po 'più peso che la 3 più recente, e presto. Il modello semplice di livellamento esponenziale (SES) realizza questo. Diamo 945 denotano una constantquot quotsmoothing (un numero compreso tra 0 e 1). Un modo per scrivere il modello è quello di definire una serie L che rappresenta il livello attuale (cioè il valore medio locale) della serie come stimato dai dati fino ad oggi. Il valore di L al momento t è calcolata in modo ricorsivo dal proprio valore precedente in questo modo: Così, il valore livellato corrente è una interpolazione tra il valore livellato precedente e l'osservazione corrente, dove 945 controlla la vicinanza del valore interpolato al più recente osservazione. Le previsioni per il prossimo periodo è semplicemente il valore livellato corrente: Equivalentemente, possiamo esprimere la prossima previsione direttamente in termini di precedenti previsioni e osservazioni precedenti, in una delle seguenti versioni equivalenti. Nella prima versione, la previsione è una interpolazione tra precedente meteorologiche e precedente osservazione: Nella seconda versione, la prossima previsione è ottenuta regolando la previsione precedente nella direzione dell'errore precedente di una quantità frazionaria 945. è l'errore al tempo t. Nella terza versione, la previsione è di un (cioè scontato) media mobile esponenziale ponderata con fattore di sconto 1- 945: La versione di interpolazione della formula di previsione è il più semplice da usare se si implementa il modello su un foglio di calcolo: si inserisce in un singola cellula e contiene i riferimenti di cella che puntano alla previsione precedente, l'osservazione precedente, e la cella in cui è memorizzato il valore di 945. Si noti che se 945 1, il modello SES è equivalente ad un modello random walk (senza crescita). Se 945 0, il modello SES è equivalente al modello medio, assumendo che il primo valore livellato è impostata uguale alla media. (Torna a inizio pagina). L'età media dei dati nelle previsioni semplice esponenziale-levigante è di 1 945 relativo al periodo per il quale è calcolata la previsione. (Questo non dovrebbe essere ovvio, ma può essere facilmente dimostrare valutando una serie infinita.) Quindi, la semplice previsione media mobile tende a restare indietro punti di svolta da circa 1 945 periodi. Ad esempio, quando 945 0.5 il ritardo è di 2 periodi in cui 945 0.2 il ritardo è di 5 periodi in cui 945 0.1 il ritardo è di 10 periodi, e così via. Per una data età media (cioè quantità di ritardo), il semplice livellamento esponenziale (SES) previsione è un po 'superiore alla previsione media mobile semplice (SMA) perché pone relativamente più peso sulla più recente --i. e osservazione. è leggermente più quotresponsivequot ai cambiamenti che si verificano nel recente passato. Per esempio, un modello di SMA con 9 termini e un modello di SES con 945 0,2 entrambi hanno un'età media di 5 per i dati nelle loro previsioni, ma il modello SES mette più peso sugli ultimi 3 valori di quanto non faccia il modello SMA e al contempo doesn8217t interamente 8220forget8221 sui valori più di 9 periodi vecchi, come mostrato in questo grafico: un altro importante vantaggio del modello SES sul modello SMA è che il modello SES utilizza un parametro smoothing che è continuamente variabile, in modo che possa facilmente ottimizzato utilizzando un algoritmo quotsolverquot per minimizzare l'errore quadratico medio. Il valore ottimale di 945 nel modello SES a questa serie risulta essere 0,2961, come illustrato di seguito: L'età media dei dati in questa previsione è 10.2961 3.4 periodi, che è simile a quella di una media 6 termine mobile semplice. Le previsioni a lungo termine dal modello SES sono una linea retta orizzontale. come nel modello SMA e il modello random walk senza crescita. Si noti tuttavia che gli intervalli di confidenza calcolati da Statgraphics ora divergono in modo ragionevole dall'aspetto, e che sono sostanzialmente più stretto gli intervalli di confidenza per il modello random walk. Il modello di SES presuppone che la serie è un po 'predictablequot quotmore di quanto non faccia il modello random walk. Un modello SES è in realtà un caso particolare di un modello ARIMA. così la teoria statistica dei modelli ARIMA fornisce una solida base per il calcolo intervalli di confidenza per il modello SES. In particolare, un modello SES è un modello ARIMA con una differenza nonseasonal, un MA (1) termine, e nessun termine costante. altrimenti noto come un modello quotARIMA (0,1,1) senza constantquot. Il MA (1) coefficiente nel modello ARIMA corrisponde alla quantità 1- 945 nel modello SES. Ad esempio, se si adatta un modello ARIMA (0,1,1) senza costante alla serie analizzate qui, il MA stimato (1) coefficiente risulta essere 0,7029, che è quasi esattamente un meno 0,2961. È possibile aggiungere l'assunzione di una tendenza non-zero costante lineare per un modello SES. Per fare questo, basta specificare un modello ARIMA con una differenza non stagionale e di un (1) termine MA con una costante, cioè un (0,1,1) modello ARIMA con costante. Le previsioni a lungo termine avranno quindi una tendenza che è uguale alla tendenza medio rilevato nel corso dell'intero periodo di stima. Non si può fare questo in collaborazione con destagionalizzazione, perché le opzioni di destagionalizzazione sono disattivati ​​quando il tipo di modello è impostato su ARIMA. Tuttavia, è possibile aggiungere una costante a lungo termine tendenza esponenziale ad un semplice modello di livellamento esponenziale (con o senza regolazione stagionale) utilizzando l'opzione di regolazione inflazione nella procedura di previsione. Il tasso appropriato quotinflationquot (crescita percentuale) per periodo può essere stimato come il coefficiente di pendenza in un modello trend lineare montato i dati in combinazione con una trasformazione logaritmo naturale, oppure può essere basata su altri, informazione indipendente per quanto riguarda le prospettive di crescita a lungo termine . (Ritorna all'inizio pagina.) Browns lineari (cioè doppie) modelli esponenziale La SMA e modelli di SES per scontato che non vi è alcuna tendenza di alcun tipo nei dati (che di solito è OK, o almeno non troppo male per 1- previsioni passo avanti quando i dati sono relativamente rumoroso), e possono essere modificati per includere un trend lineare costante come indicato sopra. Che dire di tendenze a breve termine Se una serie mostra un tasso variabile di crescita o un andamento ciclico che si distingue chiaramente contro il rumore, e se vi è la necessità di prevedere più di 1 periodo a venire, allora la stima di una tendenza locale potrebbe anche essere un problema. Il semplice modello di livellamento esponenziale può essere generalizzata per ottenere un modello lineare di livellamento esponenziale (LES) che calcola le stime locali sia a livello e di tendenza. Il modello di tendenza tempo-variante più semplice è Browns lineare modello di livellamento esponenziale, che utilizza due diverse serie levigato che sono centrate in diversi punti nel tempo. La formula di previsione si basa su un'estrapolazione di una linea attraverso i due centri. (Una versione più sofisticata di questo modello, Holt8217s, è discusso qui di seguito.) La forma algebrica di Brown8217s lineare modello di livellamento esponenziale, come quello del semplice modello di livellamento esponenziale, può essere espresso in una serie di forme diverse ma equivalenti. La forma quotstandardquot di questo modello è di solito espressa come segue: Sia S denotano la serie singolarmente-levigata ottenuta applicando semplice livellamento esponenziale di serie Y. Cioè, il valore di S al periodo t è dato da: (Ricordiamo che, in semplice livellamento esponenziale, questo sarebbe il tempo per Y al periodo t1) Allora che Squot denotano la serie doppiamente levigata ottenuta applicando semplice livellamento esponenziale (utilizzando lo stesso 945) per serie S:. Infine, le previsioni per Y tk. per qualsiasi kgt1, è data da: Questo produce e 1 0 (vale a dire imbrogliare un po ', e lasciare che la prima previsione uguale l'attuale prima osservazione), ed e 2 Y 2 8211 Y 1. dopo di che le previsioni sono generati usando l'equazione di cui sopra. Questo produce gli stessi valori stimati come la formula basata su S e S se questi ultimi sono stati avviati utilizzando S 1 S 1 Y 1. Questa versione del modello è usato nella pagina successiva che illustra una combinazione di livellamento esponenziale con regolazione stagionale. modello Holt8217s lineare esponenziale Brown8217s LES calcola stime locali di livello e l'andamento lisciando i dati recenti, ma il fatto che lo fa con un singolo parametro smoothing pone un vincolo sui modelli di dati che è in grado di adattarsi: il livello e tendenza non sono autorizzati a variare a tassi indipendenti. modello Holt8217s LES risolve questo problema includendo due costanti di lisciatura, uno per il livello e uno per la tendenza. In ogni momento t, come nel modello Brown8217s, il c'è una stima L t del livello locale e una T t stima della tendenza locale. Qui vengono calcolati ricorsivamente dal valore di Y osservata al tempo t e le stime precedenti del livello e l'andamento di due equazioni che si applicano livellamento esponenziale separatamente. Se il livello stimato e tendenza al tempo t-1 sono L t82091 e T t-1. rispettivamente, la previsione per Y tshy che sarebbe stato fatto al tempo t-1 è uguale a L t-1 T t-1. Quando si osserva il valore effettivo, la stima aggiornata del livello è calcolata in modo ricorsivo interpolando tra Y tshy e le sue previsioni, L t-1 T t-1, con pesi di 945 e 945. 1- La variazione del livello stimato, vale a dire L t 8209 L t82091. può essere interpretato come una misura rumorosa della tendenza al tempo t. La stima aggiornata del trend viene poi calcolata in modo ricorsivo interpolando tra L t 8209 L t82091 e la stima precedente del trend, T t-1. utilizzando pesi di 946 e 1-946: L'interpretazione del trend-smoothing costante 946 è analoga a quella del livello-levigatura costante 945. Modelli con piccoli valori di 946 assume che la tendenza cambia solo molto lentamente nel tempo, mentre i modelli con grande 946 supporre che sta cambiando più rapidamente. Un modello con un grande 946 ritiene che il lontano futuro è molto incerto, perché gli errori in trend-stima diventano molto importanti quando la previsione più di un periodo avanti. (Torna a inizio pagina.) Il livellamento costanti di 945 e 946 può essere stimato nel modo consueto minimizzando la media errore delle previsioni 1-step-ahead quadrato. Quando questo fatto in Statgraphics, le stime risultano essere 945 0,3048 e 946 0.008. Il valore molto piccolo di 946 significa che il modello assume molto poco cambiamento di tendenza da un periodo all'altro, in modo sostanzialmente questo modello sta cercando di stimare un trend di lungo periodo. Per analogia con la nozione di età media dei dati utilizzati nella stima del livello locale della serie, l'età media dei dati che viene utilizzato per stimare la tendenza locale è proporzionale a 1 946, anche se non esattamente uguale ad esso . In questo caso risulta essere 10,006 125. Questo isn8217t un numero molto preciso in quanto la precisione della stima di 946 isn8217t realmente 3 decimali, ma è dello stesso ordine generale di grandezza della dimensione del campione di 100, così questo modello è una media di più di un bel po 'di storia nella stima del trend. La trama meteo seguente mostra che il modello LES stima un leggermente maggiore tendenza locale alla fine della serie rispetto alla tendenza costante stimata nel modello SEStrend. Inoltre, il valore stimato di 945 è quasi identica a quella ottenuta inserendo il modello SES con o senza tendenza, quindi questo è quasi lo stesso modello. Ora, queste sembrano le previsioni ragionevoli per un modello che dovrebbe essere stimare un trend locale Se si 8220eyeball8221 questa trama, sembra che la tendenza locale si è trasformato in basso alla fine della serie Quello che è successo I parametri di questo modello sono stati stimati minimizzando l'errore quadratico delle previsioni 1-step-ahead, non le previsioni a lungo termine, nel qual caso la tendenza doesn8217t fare un sacco di differenza. Se tutti si sta guardando sono errori 1-step-avanti, non si è visto il quadro più ampio delle tendenze sopra (diciamo) 10 o 20 periodi. Al fine di ottenere questo modello più in sintonia con la nostra bulbo oculare estrapolazione dei dati, siamo in grado di regolare manualmente la tendenza-smoothing costante in modo che utilizzi una base più breve per la stima di tendenza. Ad esempio, se si sceglie di impostare 946 0.1, quindi l'età media dei dati utilizzati nella stima la tendenza locale è di 10 periodi, il che significa che ci sono in media il trend negli ultimi 20 periodi che o giù di lì. Here8217s quello che la trama del tempo si presenta come se impostiamo 946 0.1, mantenendo 945 0.3. Questo sembra intuitivamente ragionevole a questa serie, anche se probabilmente è pericoloso estrapolare questa tendenza eventuali più di 10 periodi in futuro. Che dire le statistiche di errore Ecco un confronto modello per i due modelli sopra indicati, nonché tre modelli SES. Il valore ottimale di 945.per modello SES è di circa 0,3, ma risultati simili (con leggermente più o meno reattività, rispettivamente) sono ottenute con 0,5 e 0,2. exp lineare (A) Holts. levigatura con alfa e beta 0,3048 0.008 (B) Holts exp lineare. levigatura con alpha 0.3 e beta 0.1 (C) livellamento esponenziale semplice con alfa 0,5 (D) livellamento esponenziale semplice con alpha 0.3 (E) livellamento esponenziale semplice con alpha 0.2 Le loro statistiche sono quasi identiche, quindi abbiamo davvero can8217t fare la scelta sulla base di errori di previsione 1-step-avanti all'interno del campione di dati. Dobbiamo ripiegare su altre considerazioni. Se crediamo fermamente che ha senso basare la stima attuale tendenza su quanto è successo negli ultimi 20 periodi o giù di lì, siamo in grado di fare un caso per il modello LES con 945 0,3 e 946 0.1. Se vogliamo essere agnostici sul fatto che vi è una tendenza locale, poi uno dei modelli SES potrebbe essere più facile da spiegare e darebbe anche altre previsioni middle-of-the-road per i prossimi 5 o 10 periodi. (Ritorna all'inizio pagina.) Quale tipo di trend-estrapolazione è meglio: L'evidenza empirica orizzontale o lineare suggerisce che, se sono già stati adeguati i dati (se necessario) per l'inflazione, allora può essere imprudente per estrapolare lineare a breve termine tendenze molto lontano nel futuro. Le tendenze evidenti oggi possono rallentare in futuro, dovuta a cause diverse quali obsolescenza dei prodotti, l'aumento della concorrenza, e flessioni cicliche o periodi di ripresa in un settore. Per questo motivo, semplice livellamento esponenziale spesso si comporta meglio out-of-sample che altrimenti potrebbero essere previsto, nonostante la sua quotnaivequot estrapolazione di tendenza orizzontale. modifiche di tendenza smorzato del modello di livellamento esponenziale lineare sono spesso utilizzati in pratica per introdurre una nota di conservatorismo nelle sue proiezioni di tendenza. Il modello LES smorzata-tendenza può essere implementato come un caso particolare di un modello ARIMA, in particolare, un modello (1,1,2) ARIMA. E 'possibile calcolare gli intervalli di confidenza intorno previsioni a lungo termine prodotte da modelli di livellamento esponenziale, considerandoli come casi speciali di modelli ARIMA. (Attenzione: non tutto il software calcola correttamente intervalli di confidenza per questi modelli.) La larghezza degli intervalli di confidenza dipende (i) l'errore RMS del modello, (ii) il tipo di levigatura (semplice o lineare) (iii) il valore (s) della costante di smoothing (s) e (iv) il numero di periodi avanti si prevedono. In generale, gli intervalli distribuite più veloce come 945 diventa più grande nel modello SES e si propagano molto più velocemente quando lineare piuttosto che semplice lisciatura viene utilizzato. Questo argomento è discusso ulteriormente nella sezione modelli ARIMA delle note. (Torna a inizio pagina.) Predictive Analytics con Microsoft Excel: Lavorare con Time stagionale serie in questo capitolo semplici medie stagionali medie mobili e medie mobili centrate di regressione lineare con Coded vettori semplici Stagionale esponenziale di Holt-Winters Modelli Matters ottenere in modo incrementale più complicata quando si dispone di un that8217s serie temporali caratterizzati in parte dalla stagionalità: la tendenza del suo livello di salire e scendere in conformità con il passare delle stagioni. Usiamo la stagione termine in un senso più generale rispetto al suo significato di tutti i giorni dei year8217s quattro stagioni. Nel contesto di analisi predittiva, una stagione può essere un giorno se i modelli si ripetono ogni settimana, o un anno in termini di cicli elettorali presidenziali, o qualsiasi cosa in mezzo. Un turno di otto ore in un ospedale può rappresentare una stagione. Questo capitolo prende in esame il modo di scomporre una serie tempo in modo che si può vedere come la sua stagionalità opera a parte la sua tendenza (se presente). Come ci si potrebbe aspettare dal materiale nei capitoli 3 e 4, diversi approcci sono a vostra disposizione. Semplici medie stagionali L'uso di semplici medie stagionali per modellare una serie storica a volte in grado di fornire un modello abbastanza greggio per i dati. Ma l'approccio presta attenzione alle stagioni nel set di dati, e può facilmente essere molto più preciso come una tecnica di previsione di livellamento esponenziale semplice quando la stagionalità è pronunciata. Certamente serve come un'utile introduzione ad alcune delle procedure utilizzate con serie storiche che sono sia stagionali e trend, in modo da avere uno sguardo l'esempio in Figura 5.1. Figura 5.1 Con un modello orizzontale, medie semplici risultato in previsioni che non sono altro che mezzi di stagione. I dati e grafico illustrati nella Figura 5.1 rappresentano il numero medio di visite quotidiane a un sito web che si rivolge ai fan della National Football League. Ogni osservazione nella colonna D rappresenta il numero medio di visite al giorno in ciascuno dei quattro quarti in un arco di tempo di cinque anni. Identificare un andamento stagionale Si può dire dalle medie della gamma G2: G5 che un effetto trimestrale netto è in corso. Il maggior numero medio di visite si verifica in autunno e in inverno, quando le principali 16 partite e playoff sono in programma. Gli interessi, come misurato da colpi medi giornalieri, diminuisce durante i mesi primaverili ed estivi. Le medie sono facili da calcolare se o non ti trovi bene con formule di matrice. Per ottenere la media di tutti e cinque i casi di quartiere 1, per esempio, è possibile utilizzare questa formula matrice in cella G2 di Figura 5.1: Array-immetterlo con CtrlShiftEnter. In alternativa, è possibile utilizzare la funzione AVERAGEIF (), che è possibile inserire in modo normale, premendo il tasto Invio. In generale, preferisco l'approccio di matrice formula perché mi dà possibilità di un maggiore controllo sulle funzioni e criteri coinvolte. La serie di dati sulle carte nautiche comprende etichette di dati che mostrano che quarto ciascun punto di dati appartiene. Il grafico fa eco il messaggio delle medie in G2: G5: Quarti 1 e 4 volte ottenere la maggior parte dei colpi. There8217s chiaro stagionalità in questo insieme di dati. Calcolo rilevamenti stagionali Dopo you8217ve deciso che una serie temporale ha una componente stagionale, you8217d desidera quantificare l'entità dell'effetto. Le medie illustrati nella Figura 5.2 rappresentano come il metodo semplice media va su questo compito. Figura 5.2 Combina la grande media con le medie stagionali per ottenere gli indici stagionali. Nella Figura 5.2. si ottiene additivi indici stagionali nella gamma G10: G13 sottraendo il grande media in G7 cellulare da ogni media stagionale in G2: G5. Il risultato è la 8220effect8221 di essere in quarti 1, quella di essere in quarti 2, e così via. Se un dato mese è nel Quartiere 1, ci si aspetta di avere 99.65 colpi più medi giornalieri del Grand media di 140.35 visite al giorno. Questa informazione si dà un senso di quanto sia importante essere in una data stagione. Supponiamo che il proprietario del sito web in questione e che si desidera vendere spazi pubblicitari su di esso. Si può sicuramente chiedere un prezzo più alto di inserzionisti nel corso del primo e del quarto trimestre che durante il secondo e terzo. Più precisamente, si può probabilmente pagare due volte tanto durante il primo trimestre che durante il secondo o il terzo. Con gli indici stagionali in mano, you8217re anche in grado di calcolare le regolazioni stagionali. Ad esempio, ancora in Figura 5.2. i valori destagionalizzati per ogni trimestre del 2005 appaiono in G16: G19. They8217re calcolato sottraendo l'indice dalla misurazione trimestrali associati. Tradizionalmente, l'indice stagionale termine si riferisce all'aumento o alla diminuzione del livello di un that8217s serie associati a ogni stagione. L'effetto stagionale sinonimo termine è apparso in letteratura negli ultimi anni. Perché you8217ll vedere entrambi i termini, I8217ve entrambi usati in questo libro. It8217s un piccolo problema solo tenere a mente che i due termini hanno lo stesso significato. Si noti che nel normale corso degli eventi dal 2001 al 2005, ci si aspetta risultati del secondo quarter8217s a restare indietro i primi quarter8217s risultati per 133,6 (vale a dire, 99.65 meno 821.133,95). Ma sia nel 2004 e nel 2005, i risultati destagionalizzati per il secondo trimestre superiori a quelli del primo trimestre. Questo risultato potrebbe anche richiedere di chiedere che cosa è cambiato negli ultimi due anni che inverte il rapporto tra i risultati destagionalizzati per i primi due trimestri. (. Ho don8217t perseguire tale questione qui mi portarla fino a suggerire che spesso vuole avere uno sguardo ad entrambe le e le figure destagionalizzati osservati.) Previsione da semplici medie stagionali: No Trend Anche se il metodo di medie semplici is8212as ho detto earlier8212crude, può essere molto più preciso e più sofisticata alternativa di livellamento esponenziale, in particolare quando gli effetti stagionali sono pronunciate e affidabile. Quando la serie ora è untrended, come è il caso con l'esempio di questa sezione ha discusso, le semplici previsioni stagionali non sono altro che le medie stagionali. Quando la serie non è in trend verso l'alto o verso il basso, la migliore stima del valore per la prossima stagione è che season8217s media storica. Vedere la Figura 5.3. Figura 5.3 Combina la grande media con le medie stagionali per ottenere gli indici stagionali. Nel grafico in Figura 5.3. la linea tratteggiata rappresenta le previsioni di semplice lisciatura. Le due linee continue rappresentano le osservazioni stagionali reali e le medie stagionali. Si noti che le medie stagionali traccia le osservazioni reali di stagione abbastanza closely8212much più da vicino di quanto non facciano le previsioni levigate. Si può vedere quanto più da vicino dalle due RMSEs nelle celle F23 e H23. Il RMSE per le medie stagionali è solo un po 'più di un terzo del RMSE per le previsioni levigate. È possibile gesso che fino alla dimensione degli effetti stagionali e la loro consistenza: supponga, ad esempio, che la differenza tra il primo e il secondo quarto medi erano 35,0 anziché 133,6 (che è la differenza tra cellule G2 e G3 in figura 5.2). Poi, in un contesto di livellamento, il valore effettivo Quarter 1 sarebbe una migliore predittore del valore in quarti 2 rispetto a quanto avviene con questa serie di tempo. E livellamento esponenziale può contare pesantemente sul valore della corrente osservazione per la sua previsione del periodo successivo. Se la costante livellamento è fissato a 1,0, livellamento esponenziale decide di na239ve previsione e la previsione è sempre uguale alla prima vera e propria. Il fatto che la dimensione di ogni oscillazione stagionale è così consistente da un trimestre all'altro significa che le semplici medie stagionali sono previsioni attendibili: No osservazione trimestrale effettivo si discosta molto lontano dalla media complessiva di stagione. Semplici medie stagionali con Trend L'uso di semplici medie stagionali con una serie trend ha alcuni svantaggi reali, e I8217m tentati di suggerire che lo ignoriamo e passare ad argomenti più carnoso. Ma it8217s possibile che you8217ll incorrere in situazioni in cui qualcuno ha usato questo metodo e poi won8217t male a conoscere sia come funziona e perché ci sono scelte migliori. Qualsiasi metodo di trattare con stagionalità in una serie trend deve affrontare il problema fondamentale di districare l'effetto della tendenza da quello della stagionalità. Stagionalità tende a oscurare tendenza, e viceversa. Vedere la Figura 5.4. Figura 5.4 La presenza di tendenza complica il calcolo degli effetti stagionali. Il fatto che l'andamento della serie è verso l'alto nel corso del tempo significa che semplicemente una media di ciascuna osservazioni season8217s, come è stato fatto nel caso no-tendenza, confonde la tendenza generale con la variazione stagionale. L'idea usuale è di spiegare la tendenza separatamente dagli effetti stagionali. Si potrebbe quantificare la tendenza e sottrarre i suoi effetti a partire dai dati osservati. Il risultato è una serie untrended che mantiene la variazione stagionale. Potrebbe essere gestito nello stesso modo come illustrato in precedenza in questo capitolo. Calcolando la media per ogni modo Year One di detrend i dati (e altre modalità saranno senza dubbio accadere a voi) è quello di calcolare la tendenza basata sulle medie annuali piuttosto che i dati trimestrali. L'idea è che la media annuale è insensibile agli effetti stagionali. Cioè, se si sottrae a year8217s media dal valore per ciascuno dei suoi quartieri, la somma (e quindi la media) dei quattro effetti trimestrali è proprio zero. Così un trend calcolato utilizzando le medie annuali non è influenzato dalle variazioni stagionali. Questo calcolo viene visualizzato nella Figura 5.5. Figura 5.5 Questo metodo ora impone di regressione lineare sulle semplici medie. Il primo passo per l'eliminazione del trend dei dati è quello di ottenere i colpi medi giornalieri per ogni anno. That8217s fatto nella gamma H3: H7 in Figura 5.5. La formula nella cella H3, per esempio, è MEDIA (D3: D6). Calcolo del Trend Sulla base annuale Mezzi Con le medie annuali in mano, you8217re in grado di calcolare il trend. That8217s gestita utilizzando LINEST () nell'intervallo I3: J7, utilizzando questa formula di matrice: Se don8217t valori x alimentazione come secondo argomento di REGR. LIN (). Excel fornisce valori x di default per voi. Le impostazioni predefinite sono semplicemente gli interi consecutivi a partire con 1 e termina con il numero di valori y che si chiama per nel primo argomento. In questo esempio, i valori x di default sono identici a quelli indicati sul foglio di lavoro in G3: G7, così si potrebbe usare LINEST (H3:. H7 TRUE). Questa formula utilizza due valori predefiniti, per i valori x e la costante, rappresentati dai tre virgole consecutive. Il punto di questo esercizio è quello di quantificare la tendenza di anno in anno, e REGR. LIN () che fa per voi nella cella I3. Quella cella contiene il coefficiente di regressione per i valori x. Moltiplicare 106.08 per 1 poi 2 poi da 3, 4, e 5 e aggiungere a ogni risultato l'intercetta delle 84.63. Sebbene che si ottiene previsioni annuali, il punto importante per questa procedura è il valore del coefficiente 106.08, che quantifica la tendenza annuale. Il passo che ho appena discusso è la fonte dei miei dubbi circa l'intero approccio che questa sezione descrive. In genere ha un piccolo numero di comprende periods8212in questo esempio, that8217s years8212to correre attraverso la regressione. Risultati Regression8217s tendono ad essere terribilmente instabile quando, come nella fattispecie, they8217re basato su un piccolo numero di osservazioni. E tuttavia questa procedura si basa su questi risultati pesantemente al fine di detrend la serie storica. Dividere proporzionalmente Il metodo semplici-medie di trattare con un trend, stagionale serie come questa Trend Attraverso stagioni continua dividendo la tendenza per il numero di periodi nel periodo comprendente per ottenere un andamento per periodo. Qui, il numero di periodi all'anno è four8212we8217re lavorando con data8212so trimestrale dividiamo 106.08 per 4 per stimare l'andamento per trimestre a 26,5. La procedura utilizza questa tendenza periodico sottraendo dal risultato medio periodica. Lo scopo è quello di eliminare l'effetto del trend annuale dagli effetti stagionali. Prima, però, abbiamo bisogno di calcolare il risultato medio in tutti i cinque anni per il periodo 1, per il periodo 2 e così via. Per fare questo, aiuta a riorganizzare l'elenco dei successi trimestrali attuali, mostrato nel range D3: D22 di Figura 5.5. in una matrice di cinque anni da quattro quarti, mostrato nella gamma G11: J15. Si noti che i valori di quella matrice corrispondono all'elenco nella colonna D. Con i dati disposti in quel modo, it8217s facile calcolare il valore medio trimestrale attraverso i cinque anni nel set di dati. That8217s fatto nella gamma G18: J18. L'effetto della tendenza restituito da REGR. LIN () compare nella gamma G19: J19. Il valore di partenza per ogni anno è la hit medie giornaliere osservato per il primo trimestre, quindi facciamo alcuna regolazione per il primo trimestre. Una pena quarter8217s di tendenza, o 26,5, viene sottratto dal secondo quarter8217s significa successi, ottenendo un valore del secondo trimestre aggiustato di 329,9 (vedi H21 cellulare, Figura 5.5). Due pena quarters8217 di tendenza, 2 215 26,5 o 53 in I19 delle cellule, viene sottratta dal terzo quarter8217s mezzo per ottenere un valore terzo trimestre rettificato di 282,6 in I21 delle cellule. E allo stesso modo per il quarto trimestre, sottraendo i tre quarti di tendenza da 454,4 a 374,8 ottenere in J21 cellulare. Tenete presente che se il trend fosse verso il basso piuttosto che in alto, come in questo esempio, è necessario aggiungere il valore di tendenza periodica ai mezzi periodiche osservate invece di sottrarre esso. Convertire i mezzi di stagione regolata per stagionali Effetti Per la logica di questo metodo, i valori indicati nelle righe 20.821.121 di Figura 5.5 sono i risultati medi trimestrali per ciascuno dei quattro quarti, con l'effetto della tendenza al rialzo generale nel set di dati rimossi. (Righe 20 e 21 vengono uniti nelle colonne G attraverso J.) Con la loro tendenza fuori del modo, siamo in grado di convertire tali dati le stime degli effetti stagionali. il risultato di essere nel primo trimestre, nel secondo trimestre, e così via. Per ottenere questi effetti, iniziare calcolando la media generale dei mezzi trimestrali rettificati. Che grande media aggiustata appare in I23 delle cellule. L'analisi continua in Figura 5.6. Figura 5.6 Gli effetti trimestrali, o gli indici, sono utilizzati per destagionalizzare le trimestrali osservate. Figura 5.6 ripete gli aggiustamenti trimestrali e la grande media aggiustata dalla parte inferiore della figura 5.5. Essi sono combinati per determinare gli indici trimestrali (che si può anche pensare di effetti come stagionale). Ad esempio, la formula nella cella D8 è il seguente: Si restituisce 821133,2. That8217s l'effetto di essere nel secondo trimestre, nei 224 confronti del grande media: Per quanto riguarda il grande media, possiamo aspettarci un risultato che appartiene al secondo trimestre al di sotto della media generale del 33,2 unità. Applicando gli effetti stagionali per i trimestrali osservate per ricapitolare: Finora, we8217ve quantificato il trend annuale dei dati tramite regressione e diviso questa tendenza per 4 per proporzionare a un valore trimestrale. Raccogliendo in Figura 5.6. abbiamo regolato la media per ogni trimestre (in C3: F3) sottraendo le tendenze proporzionali in C4: F4. Il risultato è una stima Detrended della media per ciascun trimestre, indipendentemente anno in cui trimestre avviene, in C5: F5. Abbiamo sottratto il grande media aggiustata, in G5 delle cellule, dalla regolata significa trimestrale C5: F5. Che converte ogni quarter8217s significa per una misura dell'effetto di ciascun trimestre rispetto al grande media aggiustata. Quelli sono gli indici stagionali o effetti in C8: F8. Successivo togliamo gli effetti stagionali dalle trimestrali osservate. Come mostrato nella Figura 5.6. lo fa sottraendo gli indici trimestrali C8: F8 dai valori corrispondenti C12: F16. E il modo più semplice per farlo è quello di entrare in questa formula nella cella C20: Nota il simbolo del dollaro unico prima del 8 nel riferimento a C8. That8217s un riferimento misto: in parte relativa e assoluta in parte. Il segno del dollaro ancora il riferimento alla ottava fila, ma la parte di colonna di riferimento è libero di variare. Pertanto, dopo che quest'ultimo formula viene immessa nella cella C20, è possibile fare clic sulla maniglia di selezione cell8217s (il piccolo quadrato nell'angolo in basso a destra di una cella selezionata) e trascinare a destra nella cella F20. Gli indirizzi regolare mentre si trascina a destra e si finisce con i valori, con gli effetti stagionali rimossi, per l'anno 2001 in C20: F20. Selezionare tale intervallo di quattro celle e utilizzano gestire molteplici selection8217s, ora in F20, per trascinare giù nella fila 24. Così facendo riempie il resto della matrice. It8217s importante tenere a mente che we8217re regolando i valori trimestrali originali per gli effetti stagionali. Qualunque sia la tendenza esisteva in valori originali è ancora lì, and8212in teoria, a least8212remains lì dopo we8217ve fatto le regolazioni per gli effetti stagionali. Abbiamo rimosso una tendenza, sì, ma solo dagli effetti stagionali. Così, quando sottraiamo i (Detrended) effetti stagionali dalle osservazioni trimestrali originali, il risultato è le osservazioni originali con la tendenza, ma senza gli effetti stagionali. Ho tracciato quei valori destagionalizzati nella Figura 5.6. Confronto che grafico per il grafico in Figura 5.4. Si noti in figura 5.6 che sebbene i valori destagionalizzati non giacciono precisamente su una linea retta, gran parte l'effetto stagionale è stato rimosso. Regredendo le trimestrali destagionalizzati sui periodi di tempo Il passo successivo è quello di creare le previsioni dal destagionalizzati, trend dei dati in Figura 5.6. celle C20: F24, ea questo punto si hanno diverse alternative a disposizione. È possibile utilizzare il metodo di differenziazione in combinazione con semplice livellamento esponenziale che è stato discusso nel capitolo 3, 8220Working con una tendenza Tempo Series.8221 Si potrebbe anche usare l'approccio Holt8217s per lisciare serie trend, discusso sia in Capitolo 3 e Capitolo 4, 8220Initializing Forecasts.8221 Entrambi metodi che mettono in grado di creare una previsione one-step-avanti, per cui si dovrebbe aggiungere l'indice di stagione corrispondente. Un altro approccio, che I8217ll usare qui, prima mette i dati di trend attraverso un'altra istanza di regressione lineare e poi aggiunge l'indice di stagione. Vedere la Figura 5.7. Figura 5.7 La prima vera previsione è in fila 25. Figura 5.7 restituisce i mezzi trimestrali destagionalizzate dalla disposizione tabellare in C20: F24 di Figura 5.6 alla disposizione lista nella gamma C5: C24 di Figura 5.7. Potremmo usare LINEST () in combinazione con i dati in B5: C24 in Figura 5.7 per calcolare intercetta e coefficiente di regressione equation8217s quindi, possiamo moltiplicare il coefficiente per ogni valore della colonna B, e aggiungere l'intercetta a ciascun prodotto, per creare le previsioni in colonna D. Ma anche se LINEST () restituisce informazioni utili diverso da quello del coefficiente e intercetta, TREND () è un modo più veloce per ottenere le previsioni, e lo uso in Figura 5.7. Il D5 gamma: D24 contiene le previsioni che derivano da una regressione dei dati trimestrali destagionalizzati a C5: C24 sui numeri periodo in B5: B24. La formula di matrice utilizzata in D5: D24 è questo: quell'insieme di risultati riflette l'effetto della tendenza al rialzo generale nelle serie temporali. Poiché i valori che TREND () è la previsione di essere stato destagionalizzato, resta da aggiungere gli effetti stagionali, noto anche come gli indici stagionali, torna in alla previsione trend. Aggiungendo gli indici stagionali indietro negli indici stagionali, calcolati in Figura 5.6. sono forniti in Figura 5.7. prima nella C2 gamma: F2 e poi ripetutamente nella E5 gamma: E8, E9: E12, e così via. Le previsioni reseasonalized sono collocati in F5: F24 con l'aggiunta di effetti stagionali in colonna E le previsioni di tendenza nella colonna D. Per ottenere le previsioni del one-step-avanti in F25 cella di Figura 5.7. il valore di t per il periodo successivo va in B25 cellule. La seguente formula viene immessa nella cella D25: Si incarica di Excel per calcolare l'equazione di regressione che prevede valori nella gamma C5: C24 da quelli in B5: B24, e applicare tale equazione per il nuovo valore x in B25 delle cellule. L'indice di stagione appropriata viene inserito nella cella E25, e la somma di D25 e E25 è posto in F25 come il primo vero previsione della serie storica trend e stagionale. You8217ll trovare l'intero set di trimestrali destagionalizzate e le previsioni tracciate nella Figura 5.8. Figura 5.8 Gli effetti stagionali vengono restituiti alle previsioni. Valutare medie semplici L'approccio a che fare con una serie temporale stagionale, discusso in diverse sezioni precedenti, ha qualche appello intuitivo. L'idea di base sembra semplice: calcolare un trend annuale regredendo medie annue contro un provvedimento di periodi di tempo. Dividere la tendenza annuale tra i periodi entro l'anno. Sottrarre la tendenza ripartito dagli effetti periodici per ottenere effetti registrati. Sottrarre gli effetti rettificato dalle misure reali per destagionalizzare le serie storiche. Creare le previsioni della serie destagionalizzati, e aggiungere gli effetti stagionali regolati indietro. Il mio punto di vista è che diversi problemi indeboliscono l'approccio, e non mi hanno incluso in questo libro, tranne che si rischia di incontrare e di conseguenza dovrebbe essere familiare con esso. E fornisce un trampolino di lancio utile per discutere qualche concetto e le procedure si trovano in altri approcci più forti. In primo luogo, there8217s la questione (di cui mi sono lamentato in precedenza in questo capitolo) per quanto riguarda la dimensione del campione molto piccolo per la regressione delle medie annuali su numeri interi consecutivi che identificano ogni anno. Anche con un solo predittore, da un minimo di 10 osservazioni è veramente raschiando il fondo del barile. Per lo meno si dovrebbe guardare la R risultante 2 rettificato per il ritiro e probabilmente ricalcolare l'errore standard della stima di conseguenza. It8217s vero che il più forte la correlazione tra la popolazione, il più piccolo è il campione si può ottenere via con. Ma lavorare con i quarti entro anni, you8217re fortuna di trovare ben 10 years8217 vale la pena di osservazioni trimestrali consecutive, ciascuna misurata nello stesso modo in tutta quel lasso di tempo. I8217m non convinto che la risposta al modello up-and-down problematico trovare entro un anno (si veda il grafico in figura 5.4) è quello di mediare i picchi e le valli e ottenere una stima tendenza dai mezzi annuali. it8217s Certamente una risposta a questo problema, ma, come you8217ll vedere, there8217s un metodo molto più forte di segregare gli effetti stagionali da una tendenza di fondo, che rappresentano per entrambi, e la previsione di conseguenza. I8217ll coprire tale metodo seguito in questo capitolo, nella 8220Linear regressione con la sezione Coded Vectors8221. Inoltre, there8217s alcun fondamento, in teoria, per la distribuzione del trend annuale in modo uniforme tra i periodi che compongono l'anno. It8217s vero che la regressione lineare fa qualcosa di simile quando pone le sue previsioni su una linea retta. Ma there8217s un enorme divario tra fare un presupposto fondamentale perché il modello can8217t analitica altrimenti trattare i dati, e accettando un risultato imperfetto cui flaws8212errors nel forecasts8212can essere misurati e valutati. Detto questo, let8217s passare all'uso di medie mobili, invece di medie semplici come un modo di trattare con la stagionalità.

No comments:

Post a Comment