Moving Average Random Walking
Verschieben von durchschnittlichen und exponentiellen Glättungsmodellen. Ein erster Schritt, um über mittlere Modelle hinauszugehen, zufällige Wandermodelle und lineare Trendmodelle, Nicht-Sektionsmuster und Trends können mit einem gleitenden Durchschnitt oder Glättungsmodul extrapoliert werden. Die grundlegende Annahme hinter Mittelwertbildung und Glättung von Modellen ist Dass die Zeitreihe lokal stationär mit einem langsam variierenden Mittel ist. Daher nehmen wir einen bewegten lokalen Durchschnitt, um den aktuellen Wert des Mittelwertes zu schätzen und dann das als Prognose für die nahe Zukunft zu verwenden. Dies kann als Kompromiss zwischen dem mittleren Modell betrachtet werden Und das zufällige Spaziergang ohne Drift-Modell Die gleiche Strategie kann verwendet werden, um einen lokalen Trend abzuschätzen und zu extrapolieren. Ein gleitender Durchschnitt wird oft als geglättete Version der ursprünglichen Serie bezeichnet, weil die kurzfristige Mittelung die Wirkung hat, die Beulen zu glätten In der ursprünglichen Serie Durch die Anpassung der Grad der Glättung der Breite des gleitenden Durchschnitts, können wir hoffen, eine Art von optimalen Gleichgewicht zwischen der Leistung der mittleren und zufälligen Walk-Modelle Die einfachste Art von Mittelwert-Modell ist die. Simple gleich gewichtet Moving Average Die Prognose für den Wert von Y zum Zeitpunkt t 1, der zum Zeitpunkt t gemacht wird, entspricht dem einfachen Durchschnitt der letzten m Beobachtungen. Hier und anderswo verwende ich das Symbol Y-Hut, um für eine Prognose der Zeitreihe Y zu stehen, die am frühestmöglichen früheren Datum durch ein gegebenes Modell gemacht wurde. Dieser Durchschnitt ist in der Periode & lgr; m 1 2 zentriert, was bedeutet, dass die Schätzung von Das lokale Mittel neigt dazu, hinter dem wahren Wert des lokalen Mittels um etwa m 1 2 Perioden zu liegen. So sagen wir, dass das Durchschnittsalter der Daten im einfachen gleitenden Durchschnitt m 1 2 relativ zu dem Zeitraum ist, für den die Prognose berechnet wird Dies ist die Zeitspanne, mit der die Prognosen dazu neigen, hinter den Wendepunkten in den Daten zu liegen. Zum Beispiel, wenn Sie die letzten 5 Werte mittelschätzen, werden die Prognosen etwa 3 Perioden spät in Reaktion auf Wendepunkte sein. Beachten Sie, dass wenn m 1, Das einfache gleitende durchschnittliche SMA-Modell entspricht dem zufälligen Walk-Modell ohne Wachstum Wenn m sehr groß ist, vergleichbar mit der Länge der Schätzperiode ist das SMA-Modell gleichbedeutend mit dem mittleren Modell Wie bei jedem Parameter eines Prognosemodells ist es üblich Um den Wert von k anzupassen, um die bestmögliche Anpassung an die Daten zu erhalten, dh die kleinsten Prognosefehler im Durchschnitt. Hierbei handelt es sich um ein Beispiel für eine Serie, die zufällige Schwankungen um ein langsam variierendes Mittel zeigt. Zuerst versuchen wir es zu versuchen Passt es mit einem zufälligen Spaziergang Modell, das entspricht einem einfachen gleitenden Durchschnitt von 1 Term. Die zufällige Spaziergang Modell reagiert sehr schnell auf Änderungen in der Serie, aber in diesem Fall nimmt es viel von dem Rauschen in den Daten die zufälligen Schwankungen als Gut wie das Signal das lokale Mittel Wenn wir stattdessen versuchen, einen einfachen gleitenden Durchschnitt von 5 Begriffen, erhalten wir eine glattere aussehende Menge von Prognosen. Die 5-Term einfache gleitenden Durchschnitt liefert deutlich kleinere Fehler als die zufällige Walk-Modell in diesem Fall Der Durchschnitt Alter der Daten in dieser Prognose ist 3 5 1 2, so dass es dazu neigt, hinter Wendepunkte um etwa drei Perioden zurückzugehen. Zum Beispiel scheint ein Abschwung in der Periode 21 aufgetreten zu sein, aber die Prognosen drehen sich nicht um einige Zeit später. Notice, dass die Langzeitprognosen aus dem SMA-Modell eine horizontale Gerade sind, genauso wie im zufälligen Spaziergangmodell. Das SMA-Modell geht davon aus, dass es keinen Trend in den Daten gibt. Allerdings sind die Prognosen aus dem zufälligen Walk-Modell Die Prognosen des SMA-Modells sind gleich einem gewichteten Durchschnitt der letzten Werte. Die von Statgraphics für die Langzeitprognosen des einfachen gleitenden Durchschnittes berechneten Konfidenzgrenzen werden nicht größer, wenn der Prognosehorizont zunimmt Das ist offensichtlich nicht richtig Leider gibt es keine zugrunde liegende statistische Theorie, die uns sagt, wie sich die Konfidenzintervalle für dieses Modell erweitern sollten. Allerdings ist es nicht zu schwer, empirische Schätzungen der Vertrauensgrenzen für die längerfristigen Prognosen zu berechnen. Sie könnten eine Kalkulationstabelle einrichten, in der das SMA-Modell verwendet werden würde, um 2 Schritte voraus, 3 Schritte voraus, etc. innerhalb der historischen Datenprobe zu prognostizieren. Sie konnten dann die Beispiel-Standardabweichungen der Fehler bei jedem Prognosehorizont berechnen und dann Vertrauen aufbauen Intervalle für längerfristige Prognosen durch Hinzufügen und Subtrahieren von Vielfachen der entsprechenden Standardabweichung. Wenn wir einen 9-fach einfach gleitenden Durchschnitt versuchen, bekommen wir noch glattere Prognosen und mehr von einem nacheilenden Effekt. Das Durchschnittsalter beträgt nun 5 Perioden 9 1 2 Wenn wir einen 19-fachen gleitenden Durchschnitt nehmen, steigt das Durchschnittsalter auf 10.Notice, dass die Prognosen nun hinter den Wendepunkten um etwa 10 Perioden zurückbleiben. Welches Maß an Glättung ist am besten für diese Serie Hier ist eine Tabelle, die vergleicht Ihre Fehlerstatistik, auch ein 3-Term-Durchschnitt. Model C, der 5-fache gleitende Durchschnitt, ergibt den niedrigsten Wert von RMSE um eine kleine Marge über die 3-Term und 9-Term-Mittelwerte, und ihre anderen Statistiken sind fast identisch Also, unter Modellen mit sehr ähnlichen Fehlerstatistiken, können wir wählen, ob wir lieber ein wenig mehr Reaktionsfähigkeit oder ein wenig mehr Glätte in den Prognosen zurück zum Anfang der Seite. Brown s Einfache Exponential Glättung exponentiell gewichteten gleitenden Durchschnitt. Das einfache gleitende durchschnittliche Modell Oben beschrieben hat die unerwünschte Eigenschaft, dass es die letzten k Beobachtungen gleichermaßen behandelt und alle vorherigen Beobachtungen vollständig ignoriert. Intuitiv sollten die vergangenen Daten in einer allmählicheren Weise diskontiert werden - zum Beispiel sollte die jüngste Beobachtung ein bisschen mehr Gewicht als das zweitbeste erhalten Jüngsten, und die 2. jüngsten sollte ein wenig mehr Gewicht als die 3. letzte, und so weiter Die einfache exponentielle Glättung SES-Modell erreicht dies. Let bezeichnen eine Glättung Konstante eine Zahl zwischen 0 und 1 Eine Möglichkeit, das Modell zu schreiben ist zu Definieren eine Reihe L, die die aktuelle Ebene repräsentiert, dh der mittlere Mittelwert der Reihe, wie sie von den Daten bis zur Gegenwart geschätzt wird. Der Wert von L zum Zeitpunkt t wird rekursiv von seinem eigenen vorherigen Wert wie dieser berechnet. Damit ist der aktuelle geglättete Wert ein Interpolation zwischen dem vorherigen geglätteten Wert und der aktuellen Beobachtung, bei der die Nähe des interpolierten Wertes auf die aktuellste Beobachtung kontrolliert wird. Die Prognose für die nächste Periode ist einfach der aktuelle geglättete Wert. Gleichzeitig können wir die nächste Prognose direkt in der Vergangenheit ausdrücken Prognosen und vorherige Beobachtungen in einer der folgenden gleichwertigen Versionen In der ersten Version ist die Prognose eine Interpolation zwischen vorheriger Prognose und vorheriger Beobachtung. In der zweiten Version wird die nächste Prognose durch Anpassung der bisherigen Prognose in Richtung der vorherigen erhalten Fehler durch einen Bruchteil. Ist der Fehler zum Zeitpunkt t gemacht In der dritten Version ist die Prognose ein exponentiell gewichteter, dh ermäßigter gleitender Durchschnitt mit Rabattfaktor 1.Die Interpolationsversion der Prognoseformel ist die einfachste zu verwenden, wenn du die implementierst Modell auf einer Tabellenkalkulation passt es in eine einzelne Zelle und enthält Zelle Referenzen, die auf die vorherige Prognose, die vorherige Beobachtung und die Zelle, wo der Wert von gespeichert ist. Hinweis, dass wenn 1, ist das SES-Modell gleichbedeutend mit einem zufälligen Spaziergang Modell ohne Wachstum Wenn 0, entspricht das SES-Modell dem Mittelmodell, vorausgesetzt, dass der erste geglättete Wert gleich dem mittleren Rücksprung auf der Oberseite gesetzt ist. Das Durchschnittsalter der Daten in der einfach-exponentiellen Glättungsprognose ist 1 relativ zu Die Periode, für die die Prognose berechnet wird, soll nicht offensichtlich sein, aber es lässt sich leicht durch die Auswertung einer unendlichen Reihe zeigen. Die einfache gleitende Durchschnittsprognose neigt dazu, hinter Wendepunkten um etwa 1 Perioden zurückzukehren. Zum Beispiel, wenn 0 5 Die Verzögerung beträgt 2 Perioden, wenn 0 2 die Verzögerung 5 Perioden beträgt, wenn 0 1 die Verzögerung 10 Perioden und so weiter ist. Für ein gegebenes Durchschnittsalter, dh eine Verzögerung, ist die einfache exponentielle Glättung der SES-Prognose dem überlegenen gleitenden Durchschnitt etwas überlegen SMA-Prognose, weil es relativ viel Gewicht auf die jüngste Beobachtung - es ist etwas mehr reagiert auf Veränderungen in der jüngsten Vergangenheit Zum Beispiel ein SMA-Modell mit 9 Begriffe und ein SES-Modell mit 0 2 haben beide ein Durchschnittsalter von 5 für die Daten in ihren Prognosen, aber das SES-Modell legt mehr Gewicht auf die letzten 3 Werte als das SMA-Modell und gleichzeitig ist es nicht ganz vergessen, Werte mehr als 9 Perioden alt, wie in dieser Tabelle gezeigt Wichtiger Vorteil des SES-Modells gegenüber dem SMA-Modell ist, dass das SES-Modell einen Glättungsparameter verwendet, der stufenlos variabel ist, so dass er durch den Einsatz eines Solver-Algorithmus leicht optimiert werden kann, um den mittleren quadratischen Fehler zu minimieren. Der optimale Wert im SES-Modell dafür Die Serie erweist sich als 0 2961, wie hier gezeigt. Das Durchschnittsalter der Daten in dieser Prognose beträgt 1 0 2961 3 4 Perioden, was ähnlich ist wie bei einem 6-fach einfach gleitenden Durchschnitt. Die langfristigen Prognosen aus der SES-Modell sind eine horizontale Gerade wie im SMA-Modell und das zufällige Spaziergangmodell ohne Wachstum. Allerdings ist zu beachten, dass die von Statgraphics berechneten Konfidenzintervalle in einer vernünftig aussehenden Weise abweichen und dass sie wesentlich schmaler sind als die Konfidenzintervalle für die Zufälliges Spaziergang Modell Das SES-Modell geht davon aus, dass die Serie etwas vorhersehbarer ist als das zufällige Spaziergangmodell. Ein SES-Modell ist eigentlich ein Spezialfall eines ARIMA-Modells, so dass die statistische Theorie der ARIMA-Modelle eine fundierte Grundlage für die Berechnung von Konfidenzintervallen für die SES-Modell Insbesondere ist ein SES-Modell ein ARIMA-Modell mit einer nicht-seasonalen Differenz, einem MA 1-Term und keinem konstanten Term, der sonst als ARIMA-0,1,1-Modell ohne Konstante bekannt ist. Der MA 1 - Koeffizient im ARIMA-Modell entspricht dem Menge 1 im SES-Modell Wenn Sie beispielsweise ein ARIMA-0,1,1-Modell ohne Konstante an die hier analysierte Baureihe anpassen, erweist sich der geschätzte MA 1 - Koeffizient auf 0 7029, was fast genau ein minus 0 2961 ist. Es ist möglich, die Annahme eines nicht-null konstanten linearen Trends zu einem SES-Modell hinzuzufügen. Dazu geben Sie einfach ein ARIMA-Modell mit einer nicht-seasonalen Differenz und einem MA 1-Term mit einer Konstante, dh einem ARIMA 0,1,1-Modell an Mit konstanten Die langfristigen Prognosen haben dann einen Trend, der gleich der durchschnittlichen Tendenz ist, die über die gesamte Schätzperiode beobachtet wird. Sie können dies nicht in Verbindung mit saisonaler Anpassung tun, da die saisonalen Anpassungsoptionen deaktiviert sind, wenn der Modelltyp auf ARIMA gesetzt ist Allerdings können Sie einen konstanten, langfristigen exponentiellen Trend zu einem einfachen exponentiellen Glättungsmodell mit oder ohne saisonale Anpassung hinzufügen, indem Sie die Inflationsanpassungsoption im Prognoseverfahren verwenden. Die entsprechende Inflationsrate pro Wachstumsrate pro Periode kann als Steilheitskoeffizient in a bezeichnet werden Lineares Trendmodell, das an die Daten in Verbindung mit einer natürlichen Logarithmus-Transformation angepasst ist, oder es kann auf anderen, unabhängigen Informationen über langfristige Wachstumsaussichten basieren. Zurück zum Seitenanfang. Brown s Linear ie doppelte exponentielle Glättung. Die SMA Modelle und SES Modelle gehen davon aus, dass es in den Daten, die in der Regel ok oder zumindest nicht zu schlecht sind, keine Tendenz gibt, wenn die Daten relativ laut sind, und sie können modifiziert werden, um einen konstanten linearen Trend zu integrieren Wie oben gezeigt Was ist mit kurzfristigen Trends Wenn eine Serie eine unterschiedliche Wachstumsrate oder ein zyklisches Muster zeigt, das sich deutlich gegen den Lärm auszeichnet, und wenn es notwendig ist, mehr als einen Zeitraum voraus zu prognostizieren, dann die Schätzung eines lokalen Trends Könnte auch ein Problem sein Das einfache exponentielle Glättungsmodell kann verallgemeinert werden, um ein lineares exponentielles Glättungs-LES-Modell zu erhalten, das lokale Schätzungen von Level und Trend berechnet. Das einfachste zeitvariable Trendmodell ist das lineare, exponentielle Glättungsmodell von Brown, das zwei verschiedene verwendet Geglättete Serien, die zu verschiedenen Zeitpunkten zentriert sind Die Prognoseformel basiert auf einer Extrapolation einer Linie durch die beiden Zentren Eine ausgefeiltere Version dieses Modells, Holt s, wird unten diskutiert. Die algebraische Form von Brown s lineares exponentielles Glättungsmodell , Wie die des einfachen exponentiellen Glättungsmodells, kann in einer Anzahl von verschiedenen, aber äquivalenten Formen ausgedrückt werden. Die Standardform dieses Modells wird gewöhnlich wie folgt ausgedrückt. Sei S die einfach geglättete Reihe, die durch Anwendung einer einfachen exponentiellen Glättung der Reihe Y erhalten wird Ist der Wert von S in der Periode t gegeben durch. Erinnern Sie sich, dass unter einfacher exponentieller Glättung dies die Prognose für Y in der Periode t 1 sein würde. Dann sei S die doppelt geglättete Reihe, die durch Anwendung einer einfachen exponentiellen Glättung unter Verwendung derselben zu der Reihe S erhalten wird. Zunächst ist die Prognose für Y tk für irgendwelche K & sub1 ;, ist gegeben durch. Dies ergibt e 1 0, dh ein wenig zu betrügen, und die erste Prognose gleich der tatsächlichen ersten Beobachtung und e 2 Y 2 Y 1, wonach Prognosen unter Verwendung der obigen Gleichung erzeugt werden, ergibt die gleichen angepassten Werte Als die auf S und S basierende Formel, wenn diese mit S 1 S 1 Y 1 gestartet wurden Diese Version des Modells wird auf der nächsten Seite verwendet, die eine Kombination von exponentieller Glättung mit saisonaler Anpassung veranschaulicht. Holt s Linear Exponential Smoothing. Brown S LES-Modell berechnet lokale Schätzungen von Level und Trend durch Glättung der jüngsten Daten, aber die Tatsache, dass es tut dies mit einem einzigen Glättungsparameter stellt eine Einschränkung auf die Datenmuster, dass es in der Lage ist, die Ebene und Trend sind nicht erlaubt, variieren Bei unabhängigen Raten Holt s LES Modell adressiert dieses Problem durch die Einbeziehung von zwei Glättungskonstanten, eine für die Ebene und eine für den Trend Zu jeder Zeit t, wie in Browns Modell, gibt es eine Schätzung L t der lokalen Ebene und eine Schätzung T t der lokalen Tendenz Hier werden sie rekursiv aus dem Wert von Y, der zum Zeitpunkt t beobachtet wurde, und den vorherigen Schätzungen des Niveaus und des Tendenzes durch zwei Gleichungen berechnet, die eine exponentielle Glättung für sie separat anwenden. Wenn das geschätzte Niveau und der Trend zur Zeit t - 1 sind L t 1 bzw. T t-1, so ist die Prognose für Y t, die zum Zeitpunkt t-1 gemacht worden wäre, gleich L t-1 T t-1 Wenn der Istwert beobachtet wird, wird die aktualisierte Schätzung von Wird der Pegel rekursiv durch Interpolation zwischen Y t und seiner Prognose L t-1 T t-1 unter Verwendung von Gewichten von und 1 berechnet. Die Änderung des geschätzten Pegels, nämlich L t L t 1, kann als eine laute Messung von interpretiert werden Der Trend zum Zeitpunkt t Die aktualisierte Schätzung des Trends wird dann rekursiv durch Interpolation zwischen L t L t 1 und der vorherigen Schätzung des Trends T t-1 unter Verwendung von Gewichten von und 1 berechnet. Die Interpretation der Trend-Glättungskonstante ist Analog zu dem der Pegel-Glättung Konstante Modelle mit kleinen Werten davon ausgehen, dass sich der Trend nur sehr langsam im Laufe der Zeit ändert, während Modelle mit größeren davon ausgehen, dass es sich schneller ändert Ein Modell mit einem großen glaubt, dass die ferne Zukunft sehr unsicher ist, Denn Fehler bei der Trendschätzung werden bei der Prognose von mehr als einer Periode bei der Vorhersage sehr wichtig. Zum Anfang der Seite. Die Glättungskonstanten und können auf die übliche Weise geschätzt werden, indem der mittlere quadratische Fehler der 1-Schritt-Prognose minimiert wird In Statgraphics, die Schätzungen erweisen sich als 0 3048 und 0 008 Der sehr kleine Wert der Mittel, dass das Modell eine sehr geringe Veränderung im Trend von einer Periode zum nächsten annimmt, so grundsätzlich versucht dieses Modell, einen langfristigen Trend abzuschätzen In Analogie zum Begriff des Durchschnittsalters der Daten, die bei der Schätzung der lokalen Ebene der Serie verwendet wird, ist das Durchschnittsalter der Daten, die bei der Schätzung des lokalen Trends verwendet wird, proportional zu 1, wenn auch nicht genau gleich Dieser Fall entpuppt sich 1 0 006 125 Dies ist eine sehr genaue Zahl, da die Genauigkeit der Schätzung von isn t wirklich 3 Dezimalstellen, aber es ist von der gleichen allgemeinen Größenordnung wie die Stichprobengröße von 100, so Dieses Modell ist durchschnittlich über eine ganze Menge Geschichte bei der Schätzung der Trend Die Prognose-Plot unten zeigt, dass das LES-Modell schätzt einen etwas größeren lokalen Trend am Ende der Serie als die konstante Tendenz im SES Trend-Modell geschätzt Auch der geschätzte Wert Von ist fast identisch mit dem, der durch die Montage des SES-Modells mit oder ohne Trend erhalten wird, also ist das fast das gleiche Modell. Jetzt sehen diese wie vernünftige Prognosen für ein Modell aus, das angeblich einen lokalen Trend schätzen soll Handlung, es sieht so aus, als ob der lokale Trend am Ende der Serie nach unten gegangen ist Was passiert ist Die Parameter dieses Modells wurden durch Minimierung des quadratischen Fehlers von 1-Schritt-Prognosen, nicht längerfristigen Prognosen, in denen geschätzt Fall der Trend macht nicht viel Unterschied Wenn alles, was Sie suchen, sind 1-Schritt-vor-Fehler, sehen Sie nicht das größere Bild der Trends über sagen, 10 oder 20 Perioden Um dieses Modell mehr im Einklang mit unserem Augapfel-Extrapolation der Daten, können wir die Trend-Glättung konstant manuell anpassen, so dass es eine kürzere Grundlinie für Trendschätzung verwendet. Wenn wir z. B. 0 1 setzen wollen, dann ist das Durchschnittsalter der Daten, die bei der Schätzung des lokalen Trends verwendet werden 10 Perioden, was bedeutet, dass wir durchschnittlich den Trend über die letzten 20 Perioden oder so Hier ist, was die Prognose Handlung aussieht, wenn wir 0 1 setzen, während halten 0 3 Dies sieht intuitiv vernünftig für diese Serie, obwohl es wahrscheinlich gefährlich zu extrapolieren ist Dieser Trend mehr als 10 Perioden in der Zukunft. Was über die Fehlerstatistiken Hier ist ein Modellvergleich für die beiden oben gezeigten Modelle sowie drei SES-Modelle Der optimale Wert des SES-Modells beträgt ca. 0 3, aber ähnliche Ergebnisse mit etwas Mehr oder weniger Ansprechverhalten werden mit 0 5 und 0 2 erhalten. Eine Holt s lineare Exp-Glättung mit alpha 0 3048 und beta 0 008. B Holt s lineare exp Glättung mit alpha 0 3 und beta 0 1. C Einfache exponentielle Glättung mit Alpha 0 5. D Einfache exponentielle Glättung mit alpha 0 3. E Einfache exponentielle Glättung mit alpha 0 2.Die Statistik ist nahezu identisch, so dass wir die Wahl nicht auf der Basis von 1-Schritt-Prognosefehlern innerhalb der Daten treffen können Beispiel Wir müssen auf andere Überlegungen zurückgreifen Wenn wir stark davon überzeugt sind, dass es sinnvoll ist, die aktuelle Trendschätzung auf das, was in den letzten 20 Perioden passiert ist, zu stützen, so können wir einen Fall für das LES-Modell mit 0 3 und 0 1 machen Wenn wir agnostisch darüber sein wollen, ob es einen lokalen Trend gibt, dann könnte eines der SES-Modelle leichter zu erklären sein und würde auch mehr Mittelwert der Prognosen für die nächsten 5 oder 10 Perioden geben. Zurück zum Seitenanfang. Welche Art der Trend-Extrapolation ist am besten horizontal oder linear Empirische Evidenz deutet darauf hin, dass, wenn die Daten bereits angepasst wurden, wenn nötig für die Inflation, dann kann es unvorstellbar sein, kurzfristige lineare Trends sehr weit in die Zukunft zu extrapolieren Trends offensichtlich heute können In der Zukunft aufgrund unterschiedlicher Ursachen wie Produktveralterung, zunehmender Konkurrenz und zyklischer Abschwünge oder Aufschwüngen in einer Branche zu senken. Aus diesem Grund führt die einfache exponentielle Glättung oftmals zu einem besseren Out-of-Sample, als es sonst zu erwarten wäre, trotz des naiven horizontalen Trends Extrapolation Gedämpfte Trendmodifikationen des linearen exponentiellen Glättungsmodells werden auch in der Praxis häufig verwendet, um eine Note des Konservatismus in seine Trendprojektionen einzuführen. Das gedämpfte LES-Modell kann als Spezialfall eines ARIMA-Modells, insbesondere eines ARIMA 1, implementiert werden , 1,2-Modell. Es ist möglich, Konfidenzintervalle um Langzeitprognosen zu ermitteln, die durch exponentielle Glättungsmodelle erzeugt werden, indem man sie als Sonderfälle von ARIMA-Modellen betrachtet. Vorsicht nicht alle Software berechnet Konfidenzintervalle für diese Modelle richtig Die Breite der Konfidenzintervalle Hängt von dem RMS-Fehler des Modells ab, ii die Art der Glättung einfach oder linear iii der Wert s der Glättungskonstante s und iv die Anzahl der vorausschauenden Perioden, die Sie prognostizieren Im Allgemeinen breiten sich die Intervalle schneller aus, SES-Modell und sie breiten sich viel schneller aus, wenn lineare und nicht einfache Glättung verwendet wird. Dieses Thema wird im ARIMA-Modell-Abschnitt der Notizen weiter unten diskutiert. Zurück zum Seitenanfang. Der eindimensionale zufällige Walk. Michael Fowler, UVa Physics 6 8 07.Flip eine Münze, nehmen Sie einen Schritt. Die eindimensionale zufällige Spaziergang ist wie folgt konstruiert Sie gehen entlang einer Linie, jedes Tempo ist die gleiche Länge Vor jedem Schritt, drehen Sie eine Münze Wenn es s Köpfe, nehmen Sie einen Schritt vorwärts Wenn Es s Schwänze, Sie nehmen einen Schritt zurück Die Münze ist unvoreingenommen, so dass die Chancen der Köpfe oder Schwänze gleich sind. Das Problem ist, die Wahrscheinlichkeit der Landung an einem bestimmten Ort nach einer bestimmten Anzahl von Schritten zu finden, und insbesondere zu Finden Sie, wie weit Sie im Durchschnitt sind, von wo aus Sie begonnen haben. Der zufällige Spaziergang ist zentral für die statistische Physik. Es ist wichtig, vorauszusagen, wie schnell ein Gas in ein anderes diffundieren wird, wie schnell die Hitze sich in einem soliden ausbreitet, wie große Druckschwankungen werden In einem kleinen Container sein, und viele andere statistische Phänomene Einstein benutzte es, um die Größe der Atome aus der Brown'schen Bewegung zu finden. Die Wahrscheinlichkeit der Landung an einem bestimmten Ort nach n Steps. Let s beginnen mit Spaziergang von ein paar Schritte, jede Einheit Länge, und suche nach einem Muster. Wir definieren die Wahrscheinlichkeitsfunktion f N n als die Wahrscheinlichkeit, dass in einem Spaziergang von N Schritten der Einheitslänge, zufällig vorwärts oder rückwärts entlang der Linie, beginnend bei 0, wir am Punkt n. Since wir Muss irgendwo enden, die Summe dieser Wahrscheinlichkeiten über n muss gleich sein 1. Wir werden nur ungleiche Wahrscheinlichkeiten auflisten. Für einen Schritt ohne Stufen f 0 0 1. Es ist vielleicht hilfreich bei der Feststellung der Wahrscheinlichkeiten, die Münz-Flip-Sequenzen aufzuzählen Was zu einem bestimmten Ort führt Für einen dreistufigen Spaziergang wird HHH bei 3, HHT, HTH und THH landen bei 1, und für die negativen Zahlen nur umgekehrt H und T Es gibt insgesamt 2 3 8 verschiedene Drei-Schritt Spaziergänge, so dass die Wahrscheinlichkeiten der verschiedenen Landungsplätze f 3 3 1 8 nur ein Spaziergang, f 3 1 3 8 drei mögliche Wanderungen, f 3 1 3 8, f 3 3 1 8.Für einen vierstufigen Spaziergang, jede Konfiguration Von H s und T s hat eine Wahrscheinlichkeit von 4 1 16.So f 4 4 1 16, da nur ein Spaziergang HHHH bringt uns dort. f 4 2 vier verschiedene Spaziergänge, HHHT, HHTH, HTHH und THHH, Ende bei 2.f 4 0 3 8, von HHTT, HTHT, THHT, THTH, TTHH und HTTH. Probabilities und Pascal s Triangle. Wenn wir herausfassen, die 1 2 N gibt es ein Muster in diesen Wahrscheinlichkeiten. Dies ist Pascal s Triangle jeder Eintrag ist die Summe Von den beiden diagonal oben Diese Zahlen sind in Wirklichkeit die Koeffizienten, die in der Binomialexpansion von ab N erscheinen. Beispielsweise spiegelt die Zeile für 2 5 f 5 n die Binomialkoeffizienten wider. Um zu sehen, wie sich diese Binomialkoeffizienten auf unseren zufälligen Spaziergang beziehen, Wir schreiben. und darüber nachdenken als die Summe aller Produkte, die geschrieben werden können, indem Sie einen Begriff aus jeder Klammer Es gibt 2 5 32 solcher Begriffe wählen eine von zwei von jedem der fünf Klammern, so dass der Koeffizient von 3 b 2 Muss die Anzahl dieser 32 Begriffe sein, die nur 3 und 2 bs haben. Aber das ist dasselbe wie die Anzahl der verschiedenen Sequenzen, die durch Umordnen von HHHTT geschrieben werden können, also ist es klar, dass die zufälligen Wanderwahrscheinlichkeiten und die Binomialkoeffizienten die sind Gleiche Sätze von Zahlen, außer dass die Wahrscheinlichkeiten natürlich durch 32 geteilt werden müssen, damit sie sich zu eins addieren. Finden Sie die Wahrscheinlichkeiten mit der Faktorfunktion. Die effiziente Methode, diese Koeffizienten zu berechnen, besteht darin, die faktorische Funktion zu verwenden Angenommen, wir haben fünf verschiedene Objekte , A, B, C, D, E Wie viele verschiedene Sequenzen können wir finden ABCDE, ABDCE, BDCAE, etc Nun, das erste Mitglied der Sequenz könnte eine der fünf Die nächste ist eine der verbleibenden vier, etc Also, Die Gesamtzahl der verschiedenen Sequenzen ist 54321, was fünf faktoriell und geschrieben heißt 5. Aber wie viele verschiedene Sequenzen können wir mit HHHTT machen. Mit anderen Worten, wenn wir alle 5 aufschreiben, die s 120 von ihnen sind, wie viele würden wirklich anders sein Da die beiden Ts identisch sind, können wir nicht in der Lage sein, voneinander getrennte Sequenzen zu erzählen, in denen sie geschaltet worden sind, so dass wir uns von 120 Sequenzen auf 60 abschneiden. Aber die drei Hs sind auch identisch, und wenn sie dort anders waren Wäre 3 6 verschiedene Möglichkeiten, sie zu arrangieren Da sie identisch sind, kommen alle sechs Wege aus demselben heraus, also müssen wir die 60 von 6 teilen und geben nur 10 verschiedene Sequenzen von 3 H s und 2 T s. Dieses gleiche Argument Arbeitet für eine beliebige Anzahl von H s und T s Die Gesamtzahl der verschiedenen Sequenzen von m H s und n T s ist mnmn, wobei die beiden Faktorien im Nenner aus der Tatsache stammen, dass die Umwandlung der H s unter sich und die T s unter Selbst, gibt die gleiche Sequenz zurück. Es ist auch erwähnenswert, dass in dem fünfstufigen Spaziergang, der bei 1 endet, der Wahrscheinlichkeit 10 2 5 hat, der vierte Schritt entweder bei 0 oder 2 sein muss, der auf Pascal's Triangle blickt, das sehen wir Die Wahrscheinlichkeit eines vierstufigen Spazierganges, der bei 0 endet, ist 6 2 4 und der Ende bei 2 ist 4 2 4 In jedem Fall ist die Wahrscheinlichkeit des nächsten Schrittes auf 1, so dass die Gesamtwahrscheinlichkeit, 1 in fünf Schritten zu erreichen, ist 6 24 4 24 Also die Eigenschaft von Pascal s Dreieck, dass jeder Eintrag ist die Summe der beiden diagonal oben ist im Einklang mit unseren Wahrscheinlichkeiten. Bild der Wahrscheinlichkeitsverteilung. Es ist es wert, diese Wahrscheinlichkeitsverteilung zu visualisieren, um etwas für den zufälligen Spaziergang zu erhalten Für 5 Schritte, es sieht aus wie. Legen Sie jetzt einen längeren Weg Nach 100 Schritten, was ist die Wahrscheinlichkeit der Landung auf der ganzen Zahl n. This wird passieren, wenn die Anzahl der Vorwärtsschritte die Anzahl der Rückwärtsschritte durch n überschreitet, was ein negatives sein könnte Number. Hinweis, dass im allgemeinen Fall, wenn die Gesamtzahl der Schritte N ist sogar, sind beide sogar oder beide ungerade, so n die Differenz zwischen ihnen, ist sogar, und ähnlich ungerade N bedeutet ungerade n. Die Gesamtzahl der Pfade endet An dem besonderen Punkt n von den Köpfen und Schwänze Argument oben, ist. Um die tatsächliche Wahrscheinlichkeit zu beenden auf n nach 100 Schritten zu finden, müssen wir wissen, welche Fraktion aller möglichen Pfade enden n Da die Münze Wurf ist rein zufällig, wir Nehmen Sie alle möglichen Pfade sind gleich wahrscheinlich Die Gesamtzahl der möglichen 100-Schritt-Spaziergänge ist. Wir haben Excel verwendet, um das Verhältnis Anzahl der Pfade zu beenden, die mit n Gesamtzahl der Pfade für Pfade von 100 zufälligen Schritten endet, und finden Die Wahrscheinlichkeit, bei dem Ursprung zurückzukehren, erweist sich um etwa 8, da etwa die Wahrscheinlichkeit ist, zwei Stufen nach links oder rechts zu landen. Die Wahrscheinlichkeit, dass man höchstens zehn Schritte von Anfang an landet, ist besser als 70, die der Landung mehr als zwanzig Schritte weit unten 5. Hinweis Es ist einfach, diese Grafik selbst mit Excel zu machen. Nur schreiben Sie -100 in A1, dann A1 2 in A2, dann FACT 100 FACT 50 - A1 2 FACT 50 A1 2 2 -100 in B1, ziehen an Kopiere diese Formeln in Zeile 101 Dann markiere die beiden Spalten, klicke auf ChartWizard, etc. Es lohnt sich auch, diese logarithmisch zu plotten, um eine klarere Vorstellung davon zu bekommen, wie die Wahrscheinlichkeiten weit weg vom Zentrum fallen. Das sieht so aus wie ein Parabel und es ist gut, um genau zu sein, der Logarithmus der Wahrscheinlichkeitsverteilung tendiert zu einer Parabel, wenn N groß wird, vorausgesetzt, daß n viel kleiner als N ist und in der Tat ist dies die wichtige Grenze in der statistischen Physik. Das natürliche Protokoll der Wahrscheinlichkeit Um den Pfad bei n zu beenden, neigt zu nn C n 2 200, wo die Konstante C die Wahrscheinlichkeit ist, den Pfad genau dort zu beenden, wo er angefangen hat. Dies bedeutet, dass die Wahrscheinlichkeit P n selbst gegeben ist. Dies wird als Gaußsche Wahrscheinlichkeitsverteilung bezeichnet Wichtig ist, wie schnell es fällt, sobald der Abstand von der Mitte der Verteilung 10 übersteigt. Ein Tropfen eines vertikalen Raumes ist ein Faktor von 100. Ableitung des Ergebnisses von Stirling s Formula. Dieses fortgeschrittenere Material ist nicht in der Physik enthalten. 152. Für große N kann die exponentielle Abhängigkeit von n 2 mathematisch mit Stirling s Formel abgeleitet werden. Diese Formel folgt aus. Für einen Spaziergang von N Schritten ist die Gesamtzahl der Pfade, die mit n enden. Um die Wahrscheinlichkeit P n zu finden, nahmen wir einen dieser Wege, wir teilen uns die Anzahl aller möglichen Wege, die 2 N. Applying Stirling s Formel ist. Bei der Verwendung von kleinem x wird die rechte Seite gerade. Wir können sogar den multiplikativen Faktor für die große N Grenze n viel weniger als N mit einer genaueren Version von Stirling s Formel erhalten, dies gibt. For N 100, das gibt P 0 0 08, innerhalb 1, wie wir bei Excel gefunden haben Die Normalisierung kann in der Grenze mit dem Standardergebnis für das Gaußsche Integral überprüft werden, wobei man bedenkt, dass P n nur ungleich Null ist, wenn N n gerade ist. So, wie weit weg sollten Sie Erwarten Sie zu beenden. Seit sind vorwärts und rückwärts Schritte gleichermaßen wahrscheinlich zu allen Zeiten, die erwartete durchschnittliche Endposition muss wieder an der Herkunft sein Die interessante Frage ist, wie weit weg von der Herkunft, im Durchschnitt können wir erwarten, zu landen, unabhängig von der Richtung Um die Richtung loszuwerden, berechnen wir den Erwartungswert des Quadrats der Landeentfernung vom Ursprung, den mittleren quadratischen Abstand, dann nehmen sie seine Quadratwurzel. Dies ist die Wurzel mittlere quadratische oder rms-Distanz. Zum Beispiel unter Berücksichtigung der Wahrscheinlichkeiten Für den fünfstufigen Spaziergang von der obigen Figur, und addieren zusammen 5 mit 5, etc finden wir den Erwartungswert von n 2 ist 2 1 32 5 2 2 5 32 3 2 2 10 32 1 2 160 32 5.Das ist, Die rms Abstand von der Herkunft nach 5 Schritten ist in der Tat. Die Wurzel mittleren quadratischen Abstand von der Herkunft nach einem zufälligen Spaziergang von n Einheit Schritte ist nA ordentliche Weise zu beweisen, diese für eine beliebige Anzahl von Schritten ist es, die Idee einer zufälligen einzuführen Variable Wenn x 1 eine solche Variable ist, dauert es den Wert 1 oder 1 mit gleicher Wahrscheinlichkeit jedes Mal, wenn wir es überprüfen Mit anderen Worten, wenn Sie mich fragen Was ist der Wert von x 1 Ich spieße eine Münze und antworte 1 wenn es s Köpfe, 1 wenn es s Schwänze Auf der anderen Seite, wenn Sie mich fragen Was ist der Wert von x 1 2 Ich kann sofort sagen, 1 ohne zu stören, um eine Münze zu kippen Wir verwenden Klammern, um Mittelwerte, die Erwartungswerte so x 1 0 zu bezeichnen Für eine unvoreingenommene Münze, x 1 2 1.Der Endpunkt eines zufälligen Spaziergang von n Schritten kann als Summe von n solcher Variablen geschrieben werden. Der Erwartungswert des Quadrats der Pfadlänge ist dann. On Quadrierung der Begriff im Inneren, wir Erhalten n 2 Ausdrücke n von diesen sind wie x 1 2 und so muss gleich 1 Alle anderen sind wie x 1 x 2 Aber das ist das Produkt von zwei verschiedenen Münzenwürfen und hat Wert 1 für HH und TT, 1 für HT und TH also im Durchschnitt auf Null, und so können wir alle Begriffe wegwerfen, die zwei verschiedene zufällige Variablen haben. Daraus folgt, dass die RMS-Abweichung n im allgemeinen Fall ist. Dichte Schwankungen in einem kleinen Volumen von Gas. Supput haben wir Eine kleine Schachtel mit N Molekülen des Gases Wir nehmen an, dass jede Wechselwirkung zwischen den Molekülen vernachlässigbar ist, sie hüpfen im Inneren des Kastens unabhängig. Wenn wir irgendwann eine Trennwand in die genaue Mitte der Schachtel stecken, erwarten wir im Durchschnitt 50 zu finden Der Moleküle in der rechten Hälfte der Box sein. Die Frage ist, wie nahe bei 50 Wie viel Abweichung sind wir wahrscheinlich zu sehen ist 51 sehr unwahrscheinlich. Seit die N Moleküle bewegen sich über die Box in einer zufälligen Weise, wir Kann jedem Molekül eine zufällige Variable yn zuordnen, wobei yn 1, wenn das n-te Molekül in der rechten Handhälfte ist, yn 0, wenn das n-te Molekül in der linken Hälfte des Kastens liegt und die Werte 1 und 0 gleich sind Wahrscheinlich Die Gesamtzahl der Moleküle NR in der rechten Hälfte der Box ist dann. This Summe von N zufällige Variablen sieht viel wie die zufällige Spaziergang In der Tat sind die beiden gleich Definieren Sie eine zufällige Variable xn by. Since yn nimmt die Werte 0 und 1 mit gleicher Wahrscheinlichkeit, xn nimmt die Werte 1 und 1 mit gleicher Wahrscheinlichkeit an, so dass xn identisch mit unserer zufälligen Spaziergang ist. Einstufige Variable oben Daher ist die Summe eines N-Schritt-zufälligen Spaziergangs die Abweichung von der Anzahl von Moleküle in der Hälfte des Behälters aus N 2 Daher ist aus unserer zufälligen Walk-Analyse oben der Erwartungswert dieser Abweichung N. Wenn zum Beispiel der Container 100 Moleküle hält, können wir bei jeder Messung eine zehnprozentige Abweichung erwarten Abweichung in der Dichte können wir erwarten, in einem Behälter zu sehen, der groß genug ist, um zu sehen, gefüllt mit Luftmolekülen bei normalem atmosphärischem Druck. Nehmen wir einen Würfel mit Seite 1 Millimeter Das enthält ungefähr 10 16 Moleküle. Daher schwankt die Zahl auf der rechten Seite in Zeit um einen Auftragsbetrag 10 16 10 8 Dies ist eine ziemlich große Zahl, aber als Bruchteil der Gesamtzahl ist es nur 1 Teil in 10 8. Die Wahrscheinlichkeit größerer Schwankungen ist unglaublich klein Die Wahrscheinlichkeit einer Abweichung von m Aus dem Mittelwert N 2 ist. So die Wahrscheinlichkeit einer Schwankung von 1 Teil in 10.000.000, die wäre 10 N ist von Ordnung oder etwa 10 -85 Überprüfen Sie das Gas jede trillionth einer Sekunde für das Alter des Universums würde nicht bekommen Sie schauen, um das zu sehen. Das ist der Grund, weshalb die Gase auf der gewöhnlichen menschlichen Skala so glatt und kontinuierlich erscheinen. Die kinetischen Effekte manifestieren sich nicht in beobachtbaren Dichte - oder Druckschwankungen, ein Grund dafür, dass die Atomtheorie so lange akzeptiert wurde. Modellierung und Prognoseaufgabe. Aus der Dropdown-Liste Vorhersagemodelltyp wählen Sie Unobservierte Komponenten. Optional Um unabhängige Variablen in das Modell aufzunehmen, erweitern Sie die Überschrift Regressionseffekte und wählen Sie das Kontrollkästchen Unabhängige Variablen einschließen. Zuordnen Sie die Variablen, die Sie in das Modell aufnehmen möchten, in die Variable Unabhängige Variablen. Um eine unregelmäßige Komponente hinzuzufügen, erweitern Sie die Überschrift "Unregelmäßige Komponente" und " Wähle das Kontrollkästchen Eine unregelmäßige Komponente einbeziehen Eine unregelmäßige Komponente ist standardmäßig enthalten. Die unregelmäßige Komponente entspricht dem Gesamt-Zufallsfehler im Modell. Die Anfangsvarianz ist der Wert, der als Anfangswert während des Parameterschätzvorgangs verwendet wird. Um diesen Wert zu ändern, wählen Sie Geben Sie eine Varianz an und geben Sie einen anderen Wert ein. Um diesen Wert als Anfangsvarianz beizubehalten, wählen Sie Fixvarianzwert aus. Um eine Trendkomponente hinzuzufügen, erweitern Sie die Trendkomponentenüberschrift Die Ebenenkomponente und die Slopekomponente kombinieren, um die Trendkomponente für das Modell zu definieren Wenn Sie angeben Sowohl eine Level - als auch eine Slope-Komponente, dann wird ein lokal linearer Trend erhalten. Wenn Sie die Slope-Komponente weglassen, wird eine lokale Ebene verwendet. Um eine Level-Komponente in das Modell aufzunehmen, markieren Sie das Kontrollkästchen Level-Level-Ebene einschließen. Die Level-Komponente ist enthalten Standardmäßig können Sie festlegen, ob die Anfangsvarianz, die standardmäßig 0 ist, geändert werden soll und ob sie auf Pegelpausen überprüft werden soll. Um eine Slope-Komponente in das Modell aufzunehmen, markieren Sie das Kontrollkästchen "Slope-Komponente einschließen". Dann können Sie festlegen, Anfangsvarianz, die standardmäßig 0 ist. Optional Um eine saisonale Komponente einzuschließen, muss die Saisonlänge größer sein als eine Erweitern Sie die Überschrift der Saisonkomponente und wählen Sie das Kontrollkästchen Eine saisonale Komponente einschließen Geben Sie die Art der Saisonkomponente an. Eine saisonale Komponente kann eine von zwei Typen sein, die dummy oder trigonometrisch sind. Sie können auch angeben Ob die ursprüngliche Varianz geändert werden soll, die standardmäßig 0 ist. Optional Um eine Zykluskomponente einzuschließen, erweitern Sie die Zykluskomponentenüberschrift und wählen das Kontrollkästchen Zykluskomponente einschließen Sie können diese Optionen festlegen. Um eine anfängliche Zyklusperiode anzugeben, die während des Parameterschätzvorgangs verwendet werden soll, wählen Sie das Kontrollkästchen Zyklusperiode angeben Anfangswert in der Box Dieser Wert muss eine Ganzzahl größer als 2 sein. Standardmäßig ist der Anfangswert 3. Um einen anfänglichen Dämpfungsfaktor anzugeben, der während des Parameterschätzvorgangs verwendet werden soll, markieren Sie das Kontrollkästchen Dämpfungsfaktor festlegen und geben dann die Initiale an Wert in der Box Sie können einen beliebigen Wert zwischen 0 und 1 ohne 0 angeben, aber einschließlich 1 Standardmäßig ist der Anfangswert 0 01. Um einen Anfangswert für den Störungsvarianzparameter anzugeben, den die Aufgabe während des Parameterschätzvorgangs verwendet, wählen Sie die Option Variablenkontakt festlegen Dann den Anfangswert in der Box angeben Dieser Wert muss größer oder gleich 0 sein. Standardmäßig ist der Anfangswert 0.Wenn die Plotsüberschrift die Plots auswählen, um in die Ergebnisse einzutragen, können Sie aus einer Sorte wählen Von Restplots, geglätteten Komponentenschätzungen, gefilterten Komponentenschätzungen und Serienzerlegungs - und Prognoseplots.
Comments
Post a Comment