Im neu auf D3 und versuchen, einen gleitenden Durchschnitt der vorherigen und nächsten Werte auf meine Daten zu tun, um es zu glätten. Derzeit habe ich es mit den 2 vorherigen Werten den aktuellen Wert. Es funktioniert aber 1) wie würde ich auch die nächsten Werte, und 2) was, wenn ich wollte die 15 vorherigen und 15 nächsten Werte verwenden (es wäre verrückt, 30 individuelle Vars für die Speicherung aller von ihnen haben) Im verwendet werden Traditionellen Javascript aber verloren, wie man die Daten auf diese Weise in D3. Hoffe jemand kann mich aufklären, danke. Oder nur die Datenanalyse Code hier: Eine Bollinger Bands Komponente für D3-Charts In meinem letzten Artikel (on-line-Annotation Komponenten für D3-Diagramme), schuf ich eine Komponente, die berechnet und zeigt einen gleitenden Durchschnitt. Wie versprochen, lege ich jetzt meine Aufmerksamkeit auf Bollinger Bands. Die Komponente Im gehen zu schaffen wird wie folgt aussehen: Wie im Vorfeld, Im gehen zu betrügen, indem sie das Diagramm Toms in seinem Artikel auf OHLC und Candlestick Komponenten entwickelt. Und Im die Schaffung der Komponente nach Mike Bostocks Convention. Was sind Bollinger Bands Froh, dass Sie gefragt. In Kürze werden Bollinger Bands auf Finanzplänen verwendet, um die Preisvolatilität anzugeben. Wie Sie aus dem obigen Diagramm ersehen können, bestehen sie aus drei Komponenten: Die oberen und unteren Bänder sind einige Standardabweichungen vom gleitenden Durchschnitt entfernt - und es ist zu beachten, dass es hier um eine bewegte Standardabweichung ging. Aus dieser Definition können wir sehen, dass wir zwei Parameter für unsere Berechnungen benötigen - die gleitende durchschnittliche Periode. Für die üblicherweise ein Wert von 20 verwendet wird, und die Anzahl der Standardabweichungen. Die typischerweise 2. Bollinger Bands Component Heres der komplette Code für die Bollinger Bands Komponente - Ill gehen durch es unten und erklären, was los ist. Das ist eine anständige Menge an Code, so können Sie an der Spitze, indem Sie die Eigenschaften Ive auf dieser Komponente definiert - youll sehen, dass Ive gebrochen sie in Abschnitte, so dass wir nicht einen monolithischen Block der Deklarationen am Anfang der Datei. Zuerst haben wir die X-und Y-Skalen, die die Komponente braucht, wenn seine Arbeit aus, wo die Dinge zu zeichnen. Als nächstes haben wir die Felder, die wir benötigen, um unsere Berechnungen durchzuführen - das Feld, das auf dem Datenmodell, dem gleitenden Durchschnittszeitraum und der Anzahl der Standardabweichungen verwendet werden soll. Beachten Sie, dass standardmäßig die gleitende durchschnittliche Periode bis 20 und die Anzahl der Standardabweichungen auf 2, die typischen Werte für diese Felder. Schließlich haben wir eine Reihe von Eigenschaften, die CSS-Klassen für die verschiedenen Teile der Komponente definieren. Dies bietet dem Benutzer eine Menge an Anpassbarkeit, wenn es um Styling kommt, aber wir setzen Standardwerte, so dass der Benutzer nicht diese Eigenschaften angeben müssen. In der Komponentenfunktion erzeugen wir eine d3.svg. area, um den Bereich zwischen den oberen und unteren Bändern und drei d3.svg. line-Objekten darzustellen, die das obere Band, das untere Band und die gleitende mittlere Linie darstellen und ihre X-Werte setzen passend. Im mit dem Bereich Element, weil das ist eine wirklich schöne, integrierte Möglichkeit, den Bereich zwischen zwei Zeilen zu zeigen. Der beste Teil ist, seine wirklich einfach zu bedienen - wo ein Zeilenelement Sie Ihren Y-Wert setzen muss, ein Flächenelement hat zwei Y-Werte - und Im sehr viel dafür, das Leben für mich leicht zu machen. Im nächsten Abschnitt definieren wir zwei Funktionen, um den gleitenden Durchschnitt und die sich bewegende Standardabweichung zu berechnen. Beachten Sie, dass Bollinger-Bänder die Populationsversion der Standardabweichungsformel verwenden. Innerhalb der Auswahl. Jeder Block ist, wo wir unsere schweren Heben - Einstellung der Y-Werte unserer verschiedenen SVG-Elemente. Wir deklarieren eine leere Variable, bollingerData. Dann füllen wir es mit Daten - es ist eine Karte von Datum zu avg (gleitender Durchschnitt) und sd (Standardabweichung) für jedes Datenelement. Wir tun dies einmal, das ist massiv effizienter als es wäre, wenn wir alle diese Berechnungen auf der Flucht getan haben Auf der anderen Seite waren diese Mittel zu tun, diese Berechnungen jedes Mal, wenn die Komponente neu gezeichnet wird, wenn wir maximal effizient wed Cache dies wollte Informationen, aber das würde auch verlangen, dass wir überprüfen, dass die Daten nicht jedes Mal geändert, wenn wir brauchen, um neu zu zeichnen, die seine eigenen Probleme bringt. Der Rest der selection. each Block ist langwierig aber ziemlich einfach - waren nur die Einstellung der Y-Werte für unsere Bereich und Linie-Elemente auf der Grundlage der Daten in der bollingerData Karte. Schließlich fügen wir die areaBands hinzu. Zeile. LineLower und lineAverage SVG-Elemente auf den Pfad. Beachten Sie, dass wir nicht die gesamte Daten-Array auf diesen Elementen - Bollinger Bands in der Regel arent angezeigt, wenn theres nicht genug Daten, um die volle gleitende Durchschnitt zu berechnen, so dass wir bei Index movingAverage starten. Was die gewünschte Wirkung hat. Ive nicht gezeigt, die verschiedenen Rauset-Accessoren, weil theyre nicht besonders interessant, da theyre ziemlich viel alle gleich: Hinzufügen der Komponente auf die Tabelle OK, das ist die heikle Bit aus dem Weg, so jetzt können diese neue Bollinger Bands Komponente verwenden. Zuerst erstellen und konfigurieren wir unsere Komponente: Hier wurde nur gesagt, die Komponente über die X-und Y-Skalen, und sagen, dass die enge Eigenschaft auf dem Datenmodell zu verwenden. Die MovingAverage - und StandardDeviations-Eigenschaften sind optional (vor allem da wurden nur die Einstellung auf ihre Standardwerte hier, aber youd müssen sie, wenn Sie etwas Nicht-Standard wollte). Wir konnten auch eine der vier CSS-Eigenschaften setzen, die die Komponente enthüllt, aber ich habe gewählt, um sie hier wegzulassen und sie einfach mit ihren Standardwerten zu belassen. Mit dem getan, fügen wir die Komponente zum Diagramm hinzu: ProTip: Im, das diesen Code gerade vor den Code setzt, um die Diagrammdaten selbst anzuzeigen, damit die Bollinger Bänder im Hintergrund sind und die Diagrammdaten im Vordergrund. Offensichtlich ist der letzte Schritt, um die verschiedenen Abschnitte der Komponente Stil. Ive gewählt, um die Bollinger Bands in Grau anzuzeigen, also Im mit einem hellgrau für den Bereich zwischen den oberen und unteren Bands und ein dunkleres Grau für die Bands selbst (Sie könnten stattdessen Transparenz, um den Bereich leichter). Als beiseite, beachten Sie, dass Ive Strich-Breite: 0 auf dem Gebiet gesetzt, so dass es keine Grenzen zeigt. Ich habe dies aus zwei Gründen getan. Erstens, zeichnen über die obere und untere Grenzen sowieso, und zweitens wollen wir nicht eine linke oder rechte Grenze gezeigt werden - versuchen Sie entfernen diese Zeile und youll sehen, was ich meine. Alles zusammen, das ist das Ergebnis: Verbesserungen Im ziemlich glücklich mit dieser Komponente - es funktioniert wirklich gut und seine relativ effizient, programmgesteuert. Es gibt noch einige Verbesserungen, die wir tun konnten. Wenn Sie den Wikipedia-Eintrag auf Bollinger-Bands lesen, sehen Sie, dass eine einfache gleitende Durchschnittsberechnung verwendet wurde, aber dass andere Arten von Berechnungen manchmal verwendet werden, könnten wir unsere Komponente erweitern, um dem Benutzer die Wahl zu ermöglichen, indem er eine zusätzliche Eigenschaft wie. movingAverageType ( Exponentiell). Fazit In diesem Artikel habe ich die gleitende durchschnittliche Komponente, die ich in meinem vorherigen Artikel entwickelt und verwendet es als Grundlage für eine Bollinger Bands Komponente. Die neue Komponente ist sehr einfach zu konfigurieren und zu stylen. In der Praxis wird der gleitende Durchschnitt eine gute Schätzung des Mittelwerts der Zeitreihe liefern, wenn der Mittelwert konstant ist oder sich langsam ändert. Im Fall eines konstanten Mittelwertes wird der grßte Wert von m die besten Schätzungen des zugrunde liegenden Mittels liefern. Ein längerer Beobachtungszeitraum wird die Effekte der Variabilität ausmachen. Der Zweck der Bereitstellung eines kleineren m ist es, die Prognose auf eine Änderung in dem zugrunde liegenden Prozess zu ermöglichen. Um zu veranschaulichen, schlagen wir einen Datensatz vor, der Änderungen im zugrundeliegenden Mittel der Zeitreihen enthält. Die Abbildung zeigt die Zeitreihen für die Darstellung zusammen mit der mittleren Nachfrage, aus der die Serie generiert wurde. Der Mittelwert beginnt als eine Konstante bei 10. Ab dem Zeitpunkt 21 erhöht er sich um eine Einheit in jeder Periode, bis er zum Zeitpunkt 30 den Wert von 20 erreicht. Dann wird er wieder konstant. Die Daten werden simuliert, indem dem Mittelwert ein zufälliges Rauschen aus einer Normalverteilung mit Nullmittelwert und Standardabweichung 3 hinzugefügt wird. Die Ergebnisse der Simulation werden auf die nächste ganze Zahl gerundet. Die Tabelle zeigt die simulierten Beobachtungen für das Beispiel. Wenn wir die Tabelle verwenden, müssen wir bedenken, dass zu einem gegebenen Zeitpunkt nur die letzten Daten bekannt sind. Die Schätzwerte des Modellparameters, für drei verschiedene Werte von m, werden zusammen mit dem Mittelwert der Zeitreihen in der folgenden Abbildung gezeigt. Die Abbildung zeigt die gleitende durchschnittliche Schätzung des Mittelwerts zu jedem Zeitpunkt und nicht die Prognose. Die Prognosen würden die gleitenden Durchschnittskurven nach Perioden nach rechts verschieben. Eine Schlussfolgerung ergibt sich unmittelbar aus der Figur. Für alle drei Schätzungen liegt der gleitende Durchschnitt hinter dem linearen Trend, wobei die Verzögerung mit m zunimmt. Die Verzögerung ist der Abstand zwischen dem Modell und der Schätzung in der Zeitdimension. Wegen der Verzögerung unterschätzt der gleitende Durchschnitt die Beobachtungen, während der Mittelwert zunimmt. Die Vorspannung des Schätzers ist die Differenz zu einer bestimmten Zeit im Mittelwert des Modells und dem Mittelwert, der durch den gleitenden Durchschnitt vorhergesagt wird. Die Vorspannung, wenn der Mittelwert zunimmt, ist negativ. Bei einem abnehmenden Mittelwert ist die Vorspannung positiv. Die Verzögerung in der Zeit und die Bias in der Schätzung eingeführt sind Funktionen von m. Je größer der Wert von m. Desto größer ist die Größe der Verzögerung und der Vorspannung. Für eine stetig wachsende Serie mit Trend a. Die Werte der Verzögerung und der Vorspannung des Schätzers des Mittelwerts sind in den folgenden Gleichungen gegeben. Die Beispielkurven stimmen nicht mit diesen Gleichungen überein, da das Beispielmodell nicht kontinuierlich zunimmt, sondern als Konstante beginnt, sich in einen Trend ändert und dann wieder konstant wird. Auch die Beispielkurven sind vom Rauschen betroffen. Die gleitende Durchschnittsprognose der Perioden in die Zukunft wird durch die Verschiebung der Kurven nach rechts dargestellt. Die Verzögerung und die Vorspannung nehmen proportional zu. Die nachstehenden Gleichungen zeigen die Verzögerung und die Vorspannung von Prognoseperioden in die Zukunft im Vergleich zu den Modellparametern. Diese Formeln sind wiederum für eine Zeitreihe mit einem konstanten linearen Trend. Wir sollten dieses Ergebnis nicht überraschen. Der gleitende Durchschnittsschätzer basiert auf der Annahme eines konstanten Mittelwerts, und das Beispiel hat einen linearen Trend im Mittel während eines Teils des Studienzeitraums. Da Realzeitreihen den Annahmen eines Modells nur selten gehorchen, sollten wir auf solche Ergebnisse vorbereitet sein. Wir können auch aus der Figur schließen, dass die Variabilität des Rauschens den größten Effekt für kleinere m hat. Die Schätzung ist viel volatiler für den gleitenden Durchschnitt von 5 als der gleitende Durchschnitt von 20. Wir haben die widerstrebenden Wünsche, m zu erhöhen, um den Effekt der Variabilität aufgrund des Rauschens zu verringern und um m zu verringern, um die Prognose besser auf Veränderungen anzupassen Im Mittel. Der Fehler ist die Differenz zwischen den tatsächlichen Daten und dem prognostizierten Wert. Wenn die Zeitreihe wirklich ein konstanter Wert ist, ist der erwartete Wert des Fehlers Null und die Varianz des Fehlers besteht aus einem Term, der eine Funktion von und ein zweiter Term ist, der die Varianz des Rauschens ist. Der erste Term ist die Varianz des Mittelwertes mit einer Stichprobe von m Beobachtungen, vorausgesetzt, die Daten stammen aus einer Population mit einem konstanten Mittelwert. Dieser Begriff wird minimiert, indem man m so groß wie möglich macht. Ein großes m macht die Prognose auf eine Änderung der zugrunde liegenden Zeitreihen unempfänglich. Um die Prognose auf Veränderungen anzupassen, wollen wir m so klein wie möglich (1), aber dies erhöht die Fehlerabweichung. Praktische Voraussage erfordert einen Zwischenwert. Prognose mit Excel Das Prognose-Add-In implementiert die gleitenden Durchschnittsformeln. Das folgende Beispiel zeigt die Analyse des Add-In für die Beispieldaten in Spalte B. Die ersten 10 Beobachtungen sind mit -9 bis 0 indexiert. Im Vergleich zur obigen Tabelle werden die Periodenindizes um -10 verschoben. Die ersten zehn Beobachtungen liefern die Startwerte für die Schätzung und werden verwendet, um den gleitenden Durchschnitt für die Periode 0 zu berechnen. Die Spalte MA (10) zeigt die berechneten Bewegungsdurchschnitte. Der gleitende Mittelwert m ist in Zelle C3. Die Fore (1) Spalte (D) zeigt eine Prognose für einen Zeitraum in die Zukunft. Das Prognoseintervall ist in Zelle D3. Wenn das Prognoseintervall auf eine größere Zahl geändert wird, werden die Zahlen in der Spalte Vorwärts verschoben. Die Err (1) - Spalte (E) zeigt die Differenz zwischen der Beobachtung und der Prognose. Zum Beispiel ist die Beobachtung zum Zeitpunkt 1 6. Der prognostizierte Wert, der aus dem gleitenden Durchschnitt zum Zeitpunkt 0 gemacht wird, beträgt 11,1. Der Fehler ist dann -5.1. Die Standardabweichung und mittlere mittlere Abweichung (MAD) werden in den Zellen E6 bzw. E7 berechnet. Predictive Analytics mit Microsoft Excel: Arbeiten mit saisonalen Zeitreihen in diesem Kapitel Einfache saisonale Mittelwerte Bewegte Mittelwerte und zentrierte Bewegungsdurchschnitte Lineare Regression mit kodierten Vektoren Einfache saisonale Exponential Glättung Holt-Winters Modelle Matters erhalten inkrementell komplizierter, wenn Sie eine Zeitreihe, die zum Teil durch Saisonalität gekennzeichnet sind: die Tendenz der Höhe zu steigen und fallen in Übereinstimmung mit dem Ablauf der Jahreszeiten. Wir verwenden den Begriff Saison in einem allgemeineren Sinne als seine alltägliche Bedeutung des Jahres8217s vier Jahreszeiten. Im Rahmen der prädiktiven Analytik kann eine Jahreszeit ein Tag sein, wenn Muster wöchentlich oder ein Jahr in Bezug auf Präsidentschaftswahlzyklen oder nur irgendetwas dazwischen wiederholen. Eine achtstündige Schicht in einem Krankenhaus kann eine Saison darstellen. In diesem Kapitel wird untersucht, wie eine Zeitreihe zerlegt wird, so dass Sie sehen können, wie ihre Saisonalität abgesehen von ihrem Trend (falls vorhanden) abläuft. Wie Sie von dem Material in den Kapiteln 3 und 4 erwarten können, stehen Ihnen mehrere Ansätze zur Verfügung. Einfache saisonale Mittel Die Verwendung von einfachen saisonalen Durchschnittswerten, um eine Zeitreihe zu modellieren, kann Ihnen manchmal ein ziemlich grobes Modell für die Daten zur Verfügung stellen. Aber der Ansatz achtet auf die Jahreszeiten in den Datensatz, und es kann einfach viel genauer als eine Prognose-Technik als einfache exponentielle Glättung, wenn die Saisonalität ausgeprägt ist. Sicherlich dient es als nützliche Einführung in einige der Verfahren, die mit Zeitreihen verwendet werden, die sowohl saisonal als auch trendorientiert sind. Sehen Sie sich das Beispiel in Abbildung 5.1 an. Abbildung 5.1 Bei einem horizontalen Modell ergeben einfache Durchschnittswerte Prognosen, die nicht mehr als saisonale Mittel sind. Die Daten und das Diagramm in Abbildung 5.1 zeigt die durchschnittliche Anzahl der täglichen Treffer zu einer Website, die Fans der National Football League bietet. Jede Beobachtung in Spalte D stellt die durchschnittliche Anzahl von Treffern pro Tag in jedem von vier Quartalen über einen Zeitraum von fünf Jahren dar. Erkennen eines Saisonmusters Aus den Durchschnittswerten im Bereich G2: G5 können Sie erkennen, dass eine ausgeprägte Quartalswirkung stattfindet. Die größte durchschnittliche Anzahl der Treffer tritt im Herbst und Winter, wenn die wichtigsten 16 Spiele und die Playoffs geplant sind. Das Interesse, gemessen an den durchschnittlichen täglichen Hits, sinkt im Frühjahr und Sommermonaten. Die Mittelwerte sind einfach zu berechnen, ob Sie sich wohl fühlen mit Array-Formeln. Um den Mittelwert aller fünf Instanzen von Quarter 1 zu erhalten, können Sie beispielsweise diese Matrixformel in Zelle G2 von Abbildung 5.1 verwenden: Array - geben Sie sie mit CtrlShiftEnter ein. Alternativ können Sie die Funktion AVERAGEIF () verwenden, die Sie auf normale Weise eingeben können, indem Sie die Eingabetaste drücken. Im Allgemeinen, bevorzuge ich die Matrix Formel Ansatz, weil es mir Raum für eine größere Kontrolle über die Funktionen und Kriterien beteiligt. Die Charted-Datenreihe enthält Datenetiketten, aus denen hervorgeht, zu welcher Viertel jeden Datenpunkt gehört. Das Diagramm gibt die Meldung der Mittelwerte in G2 wieder: G5: Quartale 1 und 4 wiederholt die meisten Treffer. There8217s klar Saisonalität in diesem Datensatz. Berechnung der Saison-Indizes Nachdem you8217ve beschlossen, dass eine Zeitreihe eine saisonale Komponente, you8217d wie die Größe des Effekts zu quantifizieren. Die in Abbildung 5.2 gezeigten Mittelwerte stellen dar, wie die einfache Mittelwerte-Methode diese Aufgabe übernimmt. Abbildung 5.2 Kombinieren Sie den großen Durchschnitt mit den saisonalen Durchschnittswerten, um die saisonalen Indizes zu erhalten. In Abbildung 5.2. Erhalten Sie additive saisonale Indizes im Bereich G10: G13 durch Subtraktion des Großdurchschnitts in Zelle G7 von jedem saisonalen Durchschnitt in G2: G5. Das Ergebnis ist das 8220effect8221 des Seins im Viertel 1, das des Seins im Viertel 2, und so weiter. Wenn ein gegebener Monat im Viertel 1 ist, erwarten Sie, dass er 99,65 mehr durchschnittliche tägliche Treffer als der große Durchschnitt von 140,35 Treffern pro Tag hat. Diese Information gibt Ihnen ein Gefühl, wie wichtig es ist, in einer bestimmten Jahreszeit zu sein. Angenommen, Sie besitzen die Web-Seite in Frage und Sie wollen Werbefläche auf sie zu verkaufen. Sie können sicher fragen, einen höheren Preis von Werbetreibenden im ersten und vierten Quartal als während der zweiten und dritten. Mehr zu dem Punkt, können Sie wahrscheinlich kostenlos doppelt so viel im ersten Quartal als während der zweiten oder dritten. Mit den saisonalen Indizes in der Hand, you8217re auch in der Lage, saisonale Anpassungen zu berechnen. Zum Beispiel noch in Abbildung 5.2. Die saisonbereinigten Werte für jedes Quartal 2005 erscheinen in G16: G19. Sie werden berechnet, indem der Index von der zugehörigen vierteljährlichen Messung subtrahiert wird. Traditionell bezieht sich der Begriff saisonaler Index auf die Zunahme oder Abnahme des Niveaus einer Reihe, die mit jeder Jahreszeit assoziiert ist. Der Begriff saisonale Wirkung ist in der Literatur in den letzten Jahren erschienen. Weil you8217ll beide Begriffe sehen, verwendet I8217ve sie beide in diesem Buch. Es ist eine kleine Sache nur bedenken, dass die beiden Begriffe haben die gleiche Bedeutung. Beachten Sie, dass Sie im zweiten Quartal des Geschäftsjahres 2001 bis 2005 davon ausgehen, dass die Ergebnisse des zweiten Quartals8217 mit 133,6 (dh 99,65 minus 821133,95) hinter dem Ergebnis des ersten Quartals8217 zurückbleiben. Aber in den Jahren 2004 und 2005 übersteigen die saisonbereinigten Ergebnisse für das zweite Quartal die Werte für das erste Quartal. Dieses Ergebnis könnte Sie auffordern, zu fragen, was sich in den letzten zwei Jahren geändert hat, die das Verhältnis zwischen den saisonbereinigten Ergebnissen für die ersten beiden Quartale umkehrt. (I don8217t verfolgen diese Frage hier. Ich bringe es auf, um zu suggerieren, dass Sie oft wollen, um einen Blick auf die beobachteten und die saisonbereinigten Zahlen haben.) Prognose aus einfachen saisonalen Mittelungen: Keine Tendenz Obwohl die Methode der einfachen Durchschnittswerte ist8212as sagte ich Kann es viel genauer sein als die ausgeklügeltere Alternative der exponentiellen Glättung, besonders wenn die saisonalen Effekte ausgeprägt und zuverlässig sind. Wenn die Zeitreihen ungedehnt sind, wie dies bei dem Beispiel, das dieser Abschnitt diskutiert hat, ist, sind die einfachen saisonalen Prognosen nichts weiter als die saisonalen Durchschnittswerte. Wenn die Serie nicht trending entweder nach oben oder unten, Ihre beste Schätzung des Wertes für die nächste Saison ist, dass season8217s historischen Durchschnitt. Siehe Abbildung 5.3. Abbildung 5.3 Kombinieren Sie den großen Durchschnitt mit den saisonalen Durchschnittswerten, um die saisonalen Indizes zu erhalten. In der Tabelle in Abbildung 5.3. Die gestrichelte Linie stellt die Prognosen aus einfacher Glättung dar. Die beiden durchgezogenen Linien stellen die tatsächlichen saisonalen Beobachtungen und die saisonalen Mittelwerte dar. Beachten Sie, dass die saisonalen Durchschnittswerte die tatsächlichen saisonalen Beobachtungen ziemlich dicht beieinander verfolgen, als die geglätteten Prognosen. Sie sehen, wie viel mehr aus den beiden RMSEs in den Zellen F23 und H23. Die RMSE für die saisonalen Durchschnittswerte ist nur etwas mehr als ein Drittel des RMSE für die geglätteten Prognosen. Sie können Kreide, die bis zu der Größe der saisonalen Effekte sowie ihre Konsistenz: Angenommen, zum Beispiel, dass der Unterschied zwischen dem durchschnittlichen ersten und zweiten Quartal waren 35,0 statt 133,6 (was der Unterschied zwischen den Zellen G2 und G3 in Abbildung ist 5.2). Dann wäre in einem Glättungskontext der Istwert für Quartal 1 ein viel besserer Prädiktor für den Wert für Quartal 2, als dies bei dieser Zeitreihe der Fall ist. Und exponentielle Glättung kann stark auf den Wert der aktuellen Beobachtung für seine Prognose der nächsten Periode verlassen. Wenn die Glättungskonstante auf 1,0 eingestellt ist, wird die exponentielle Glättung in na239ve Prognose aufgelöst, und die Prognose entspricht immer dem vorherigen tatsächlichen Wert. Die Tatsache, dass die Größe jedes Saisonschocks von Quartal zu Quartal so konstant ist, bedeutet, dass die einfachen saisonalen Durchschnittswerte zuverlässige Prognosen sind: Keine tatsächliche Quartalsbeobachtung verläuft sehr weit vom saisonalen Durchschnittsdurchschnitt. Einfache saisonale Mittelwerte mit Trend Die Verwendung von einfachen saisonalen Durchschnittswerten mit einer trendigen Serie hat einige echte Nachteile, und ich versucht, darauf hinzuweisen, dass wir es ignorieren und weitergehen zu fleischigeren Themen. Aber es8217s möglich, dass you8217ll laufen in Situationen, in denen jemand hat diese Methode verwendet und dann es gewagt, wissen, wie es funktioniert und warum es bessere Entscheidungen zu wissen. Jede Methode der Umgang mit Saisonalität in einer trendigen Serie muss sich mit dem grundlegenden Problem der Entwirrung der Wirkung der Trend von der Saisonalität. Saisonalität neigt dazu, Trend zu verdecken, und umgekehrt. Siehe Abbildung 5.4. Abbildung 5.4 Das Vorhandensein von Trend kompliziert die Berechnung saisonaler Effekte. Die Tatsache, dass der Trend in der Serie im Laufe der Zeit aufwärts geht, bedeutet, dass die Durchschnittswerte bei jeder Saison8217s-Beobachtung, wie es im No-Trend-Fall geschieht, den allgemeinen Trend mit der saisonalen Variation verwechselt. Die übliche Idee ist, den Trend getrennt von den saisonalen Effekten zu berücksichtigen. Man könnte den Trend quantifizieren und seine Wirkung von den beobachteten Daten subtrahieren. Das Ergebnis ist eine unerschlossene Serie, die die saisonale Variation beibehält. Es könnte in der gleichen Weise behandelt werden, wie ich bereits in diesem Kapitel. Berechnen des Mittelwerts für jedes Jahr Ein Weg, um die Daten zu trennen (und andere Wege wird zweifellos bei Ihnen auftreten) ist es, den Trend auf der Grundlage der jährlichen Mittelwerte anstelle von vierteljährlichen Daten zu berechnen. Die Idee ist, dass der Jahresdurchschnitt unempfindlich gegenüber saisonalen Effekten ist. Das heißt, wenn Sie ein Jahr8217s Mittelwert von dem Wert für jedes seiner Quartale subtrahieren, ist die Summe (und damit der Durchschnitt) der vier vierteljährlichen Effekte genau Null. So wird ein Trend, der mit den Jahresdurchschnitten berechnet wird, von den saisonalen Schwankungen nicht beeinflusst. Diese Berechnung erscheint in Abbildung 5.5. Abbildung 5.5 Diese Methode legt nun eine lineare Regression auf die einfachen Mittelwerte fest. Der erste Schritt in Detrending die Daten ist es, die durchschnittlichen täglichen Treffer für jedes Jahr zu bekommen. Diese8217s getan im Bereich H3: H7 in Abbildung 5.5. Die Formel in Zelle H3 ist beispielsweise AVERAGE (D3: D6). Berechnung der Trend auf der Grundlage der jährlichen Mittel Mit den jährlichen Durchschnittswerten in der Hand, you8217re in der Lage, ihre Tendenz zu berechnen. That8217s verwaltet durch die Verwendung von LINEST () im Bereich I3: J7, mit dieser Matrixformel: Wenn Sie don-Werte liefern als das zweite Argument an LINEST (). Excel liefert Standard-X-Werte für Sie. Die Standardwerte sind einfach die aufeinanderfolgenden Ganzzahlen beginnend mit 1 und endend mit der Anzahl der y-Werte, die Sie im ersten Argument aufrufen. In diesem Beispiel sind die Standard-x-Werte identisch mit denen, die auf dem Arbeitsblatt in G3: G7 angegeben wurden, so dass Sie LINEST (H3: H7 TRUE) verwenden konnten. Diese Formel verwendet zwei Standardwerte für die x-Werte und die Konstante, dargestellt durch die drei aufeinanderfolgenden Kommas. Der Punkt dieser Übung ist, den Jahr-zu-Jahr-Trend zu quantifizieren, und LINEST () macht das für Sie in Zelle I3. Diese Zelle enthält den Regressionskoeffizienten für die x-Werte. Multiplizieren Sie 106.08 mit 1, dann mit 2, dann mit 3, 4 und 5 und addieren Sie zu jedem Ergebnis den Achsenabschnitt von 84.63. Obwohl dies jährliche Prognosen bringt, ist der wichtigste Punkt für dieses Verfahren der Wert des Koeffizienten 106,08, der den jährlichen Trend quantifiziert. Der Schritt, den ich gerade diskutiert habe, ist die Quelle meiner Bedenken über den gesamten Ansatz, den dieser Abschnitt beschreibt. Sie haben in der Regel eine kleine Anzahl von umfassenden Perioden8212 in diesem Beispiel, dass8217s Jahre8212to durch die Regression zu laufen. Regression8217s Ergebnisse neigen dazu, furchtbar instabil zu sein, wenn, wie hier, sie auf einer kleinen Zahl von Beobachtungen basieren. Und doch geht dieses Verfahren auf diesen Ergebnissen stark zurück, um die Zeitreihen zu trennen. Anziehen der Trend über die Jahreszeiten Die einfache Mittel-Methode der Umgang mit einer trendigen, saisonale Reihe wie diese weiter durch die Trennung der Trend durch die Anzahl der Perioden in der umfassenden Periode, um eine Periode Trend zu erhalten. Hier ist die Anzahl der Perioden pro Jahr vier8212we8217re Arbeit mit vierteljährlichen Daten8212so teilen wir 106,08 von 4, um den Trend pro Quartal bei 26,5 schätzen. Das Verfahren verwendet diesen periodischen Trend, indem er ihn von dem durchschnittlichen periodischen Ergebnis subtrahiert. Ziel ist es, die Auswirkungen des Jahrestrends von den saisonalen Auswirkungen zu beseitigen. Erstens müssen wir das Durchschnittsergebnis für alle fünf Jahre für Periode 1, für Periode 2 und so weiter berechnen. Um dies zu tun, hilft es, die Liste der tatsächlichen vierteljährlichen Treffern neu zu ordnen, die im Bereich D3: D22 von Abbildung 5.5 gezeigt werden. In eine Matrix von fünf Jahren um vier Viertel, gezeigt im Bereich G11: J15. Beachten Sie, dass die Werte in dieser Matrix der Liste in Spalte D entsprechen. Mit den so angeordneten Daten ist es einfach, den durchschnittlichen vierteljährlichen Wert über die fünf Jahre im Datensatz zu berechnen. Die8217s getan im Bereich G18: J18. Die Wirkung des von LINEST () zurückgegebenen Trends erscheint im Bereich G19: J19. Der Anfangswert für jedes Jahr ist die beobachteten durchschnittlichen täglichen Treffer für das erste Quartal, so dass wir keine Anpassung für das erste Quartal machen. Ein Vierteljahrestransaktionswert von 26,5 wird von den mittleren Treffern des zweiten Quartals8217 subtrahiert, was zu einem angepassten zweiten Quartal von 329,9 führt (siehe Zelle H21, Abbildung 5.5). Zwei Quartale8217 Wert von Trend, 2 215 26,5 oder 53 in Zelle I19, wird von dem dritten Quartal8217s Mittel subtrahiert, um einen angepassten dritten Viertel-Wert von 282,6 in Zelle I21 zu erhalten. Und ähnlich für das vierte Quartal, subtrahiert drei Viertel der Trend von 454,4 bis 374,8 in Zelle J21 zu bekommen. Denken Sie daran, dass, wenn der Trend eher nach unten, als in diesem Beispiel, würden Sie den periodischen Trendwert zu den beobachteten periodischen Mittel statt Subtraktion hinzuzufügen. Konvertieren der angepassten Saisonmittel in saisonale Effekte Nach der Logik dieses Verfahrens sind die in den Zeilen 20821121 von 5.5 gezeigten Werte die durchschnittlichen Quartalsergebnisse für jedes der vier Quartale, wobei der Effekt des allgemeinen Aufwärtstrends im Datensatz entfernt wurde. (Die Zeilen 20 und 21 werden in den Spalten G bis J zusammengeführt.) Mit ihrer Tendenz können wir diese Zahlen zu Schätzungen jahreszeitlicher Effekte umwandeln. Das Ergebnis des Seins im ersten Quartal, im zweiten Quartal, und so weiter. Um diese Effekte zu erhalten, beginnen Sie mit der Berechnung der großen Mittelwerte der bereinigten vierteljährlichen Mitteln. Das eingestellte Großmittel erscheint in Zelle I23. Die Analyse wird in Abbildung 5.6 fortgesetzt. Abbildung 5.6 Die vierteljährlichen Effekte oder Indizes werden verwendet, um die beobachteten Quartalszeiten zu deseasonalisieren. Abbildung 5.6 wiederholt die vierteljährlichen Anpassungen und den angepassten Großwert von unten in Abbildung 5.5. Sie werden kombiniert, um die vierteljährlichen Indizes (die Sie auch als saisonale Effekte denken können) zu bestimmen. Zum Beispiel ist die Formel in Zelle D8 wie folgt: Sie gibt 821133.2 zurück. Das ist der Effekt des Seins im zweiten Quartal, vis-224-vis der großen Mittelwert: In Bezug auf die großen Mittel, können wir erwarten, dass ein Ergebnis, das im zweiten Quartal gehört, um unter dem großen Mittelwert von 33,2 Einheiten fallen. Anwendung der saisonalen Effekte auf die beobachteten Quartale Um zu erzählen: Bisher haben wir die jährliche Tendenz der Daten über eine Regression quantifiziert und diesen Trend um 4 geteilt, um ihn auf einen vierteljährlichen Wert zu verteilen. Abholung in Abbildung 5.6. Haben wir den Mittelwert für jedes Quartal (in C3: F3) durch Subtraktion der anteiligen Trends in C4: F4 angepasst. Das Ergebnis ist eine abgeschätzte Schätzung des Mittelwerts für jedes Quartal, unabhängig von dem Jahr, in dem das Quartal stattfindet, in C5: F5. In der Zelle G5 haben wir den angepassten Großwert von den eingestellten vierteljährlichen Mitteln in C5: F5 subtrahiert. Das wandelt jedes Quartal8217s Mittel zu einem Maß des Effektes von jedem Viertel in Bezug auf den justierten grossen Mittelwert. Das sind die saisonalen Indizes oder Effekte in C8: F8. Anschließend entfernen wir die saisonalen Effekte aus den beobachteten Quartalen. Wie in Abbildung 5.6 gezeigt. Indem Sie die Quartalsindizes in C8: F8 von den entsprechenden Werten in C12: F16 subtrahieren. Und der einfachste Weg, dies zu tun ist, diese Formel in Zelle C20 eingeben: Beachten Sie die Single-Dollar-Zeichen vor der 8 in der Referenz auf C8. Das ist ein gemischter Hinweis: teils relativ und teils absolut. Das Dollarzeichen verankert den Verweis auf die achte Zeile, aber der Spaltenabschnitt der Referenz ist frei zu variieren. Daher können Sie, nachdem die letztere Formel in Zelle C20 eingegeben wurde, auf den Auswahlknopf cell8217s klicken (das kleine Rechteck in der rechten unteren Ecke einer ausgewählten Zelle) und nach rechts in die Zelle F20 ziehen. Die Adressen passen sich an, wenn man nach rechts zieht und man die Werte mit den saisonalen Effekten entfernt, für das Jahr 2001 in C20: F20. Wählen Sie diesen Bereich von vier Zellen aus, und verwenden Sie das multiple selection8217s-Handle, jetzt in F20, um in Zeile 24 zu ziehen. Damit füllt sich der Rest der Matrix. Es ist wichtig zu beachten, dass wir die ursprünglichen vierteljährlichen Werte für die saisonalen Effekte anpassen. Was auch immer der Trend in den ursprünglichen Werten war, ist noch da, und in der Theorie bleibt mindestens8212 dort, nachdem wir die Anpassungen für saisonale Effekte vorgenommen haben. Wir haben einen Trend, ja, aber nur von den saisonalen Auswirkungen entfernt. Wenn wir also die (gestörten) saisonalen Effekte von den ursprünglichen vierteljährlichen Beobachtungen subtrahieren, sind die Ergebnisse die ursprünglichen Beobachtungen mit dem Trend, aber ohne die saisonalen Effekte. Ich habe jene saisonbereinigten Werte in Abbildung 5.6 dargestellt. Vergleichen Sie das Diagramm mit dem Diagramm in Abbildung 5.4. Beachten Sie in Abbildung 5.6, dass, obwohl die entsalzten Werte nicht genau auf einer Geraden liegen, ein Großteil der saisonalen Wirkung entfernt wurde. Rückgang der Deseasonalized Quarterlies auf die Zeitperioden Der nächste Schritt ist die Erstellung von Prognosen aus den saisonbereinigten, Trenddaten in Abbildung 5.6. Zellen C20: F24, und an dieser Stelle stehen Ihnen mehrere Alternativen zur Verfügung. Sie könnten den differenzierenden Ansatz kombiniert mit einfacher exponentieller Glättung verwenden, der in Kapitel 3, 8220Working mit Trended Time Series diskutiert wurde.8221 Sie könnten auch den Holt8217-Ansatz verwenden, um geglättete Trendreihen, die sowohl in Kapitel 3 als auch in Kapitel 4, 8220Initialisierung von Prognosen8221 Beide behandelt wurden Methoden haben Sie in der Lage, eine einstufige Prognose zu erstellen, zu der Sie den entsprechenden saisonalen Index hinzufügen würden. Ein anderer Ansatz, den I8217ll hier verwendet, setzt zuerst die Trenddaten durch eine andere Instanz der linearen Regression und fügt dann den saisonalen Index hinzu. Siehe Abbildung 5.7. Abbildung 5.7 Die erste wahre Prognose ist in Zeile 25. Abbildung 5.7 gibt die entsalzten Quartalsmittel aus der tabellarischen Anordnung in C20: F24 aus Abbildung 5.6 zur Listenanordnung im Bereich C5: C24 von Abbildung 5.7 zurück. Wir könnten LINEST () in Verbindung mit den Daten in B5: C24 in Abbildung 5.7 verwenden, um die Regressionsgleichung8217s-Intercept und den Koeffizienten zu berechnen, dann könnten wir den Koeffizienten mit jedem Wert in Spalte B multiplizieren und den Intercept zu jedem Produkt hinzufügen Die Prognosen in Spalte D. Aber obwohl LINEST () gibt nützliche Informationen außer dem Koeffizienten und Intercept, TREND () ist ein schneller Weg, um die Prognosen zu erhalten, und ich benutze es in Abbildung 5.7. Der Bereich D5: D24 enthält die Prognosen, die sich aus dem Rückgang der entsalzten Quartalszahlen in C5: C24 auf die Periodenzahlen in B5: B24 ergeben. Die in D5: D24 verwendete Matrixformel lautet wie folgt: Diese Ergebnismenge spiegelt den Effekt des allgemeinen Aufwärtstrends in der Zeitreihe wider. Da die von TREND () prognostizierten Werte entsalzt sind, bleiben die saisonalen Effekte, auch saisonale Indizes genannt, wieder in der Trendprognose. Hinzufügen der saisonalen Indexe Zurück In Die saisonalen Indizes, berechnet in Abbildung 5.6. Sind in Abbildung 5.7 dargestellt. Zuerst im Bereich C2: F2 und dann wiederholt im Bereich E5: E8, E9: E12, und so weiter. Die reseasonalisierten Prognosen werden in F5: F24 platziert, indem die saisonalen Effekte in Spalte E den Trendvorhersagen in Spalte D hinzugefügt werden. Um die Einzelschrittprognose in Zelle F25 von Abbildung 5.7 zu erhalten. Der Wert von t für die nächste Periode geht in die Zelle B25 über. Die folgende Formel wird in Zelle D25 eingegeben: Sie weist Excel an, die Regressionsgleichung zu berechnen, die Werte im Bereich C5: C24 von denen in B5: B24 prognostiziert und diese Gleichung auf den neuen X-Wert in Zelle B25 anwendet. Der entsprechende saisonale Index wird in die Zelle E25 gesetzt, und die Summe von D25 und E25 wird als erste echte Prognose der Trend - und Saisonzeitreihen in F25 platziert. Sie finden die gesamte Menge der entsalzten Quartale und die Prognosen in Abbildung 5.8. Abbildung 5.8 Die saisonalen Auswirkungen werden auf die Prognosen zurückgeführt. Auswerten von einfachen Mitteln Der Ansatz, mit einer saisonalen Zeitreihe umzugehen, die in mehreren vorhergehenden Abschnitten diskutiert wurde, hat eine gewisse intuitive Anziehungskraft. Die grundlegende Idee scheint einfach: Berechnen Sie eine jährliche Tendenz, indem Sie jährliche Mittel gegen ein Maß von Zeiträumen. Teilen Sie die jährliche Tendenz zu den Perioden innerhalb des Jahres. Subtrahieren Sie den aufgeteilten Trend von den periodischen Effekten, um angepasste Effekte zu erhalten. Subtrahieren Sie die angepassten Effekte von den tatsächlichen Maßnahmen, um die Zeitreihe zu deseasonalisieren. Meine eigenen Ansichten sind, dass mehrere Probleme den Ansatz zu schwächen, und ich würde es nicht in diesem Buch aufgenommen haben, außer dass Sie wahrscheinlich sind, um es zu begegnen und sollte daher vertraut sein damit. Und es bietet eine nützliche Sprungbrett zu diskutieren, einige Konzept und Verfahren in anderen, stärkere Ansätze gefunden. Zuerst gibt es das Thema (über das ich mich früher in diesem Kapitel beschwert habe) bezüglich der sehr kleinen Stichprobengröße für die Regression von jährlichen Mitteln auf aufeinanderfolgenden Ganzzahlen, die jedes Jahr identifizieren. Sogar mit nur einem Prädiktor, so wenig wie 10 Beobachtungen ist wirklich Schaben der Unterseite des Fasses. Zumindest sollten Sie sich die resultierende R 2 für Schrumpfung und wahrscheinlich neu zu berechnen die Standard-Fehler der Schätzung entsprechend zu suchen. It8217s zutreffend, dass, je stärker die Korrelation in der Bevölkerung, desto kleiner die Probe können Sie mit weg. Aber die Arbeit mit Quartalen innerhalb von Jahren, Sie glücklich zu finden, so viele wie 10 Jahre im Wert von aufeinander folgenden vierteljährlichen Beobachtungen, die jeweils in der gleichen Weise über die Zeitspanne gemessen. I8217m nicht überzeugt, dass die Antwort auf das problematische Auf - und Abwärtsmuster, das Sie innerhalb eines Jahres finden (siehe Grafik in Abbildung 5.4), die Spitzen und Täler durchschnittlich ausmachen und eine Trendschätzung aus den jährlichen Mitteln erhalten. Sicherlich ist es eine Antwort auf dieses Problem, aber, wie Sie sehen, dort8217s eine viel stärkere Methode des Segregierens der Saison-Effekte von einem zugrunde liegenden Tendenz, bilanzierend sie beide, und Prognose entsprechend. I8217ll decken diese Methode später in diesem Kapitel, in der 8220Linear Regression mit Coded Vectors8221 Abschnitt. Darüber hinaus gibt es in der Theorie keine Grundlage, um den jährlichen Trend gleichmäßig unter den Perioden zu verteilen, die das Jahr bilden. Es ist wahr, dass lineare Regression etwas Ähnliches macht, wenn es seine Prognosen auf einer geraden Linie platziert. But there8217s a huge gulf between making a fundamental assumption because the analytic model can8217t otherwise handle the data, and accepting a flawed outcome whose flaws8212errors in the forecasts8212can be measured and evaluated. That said, let8217s move on to the use of moving averages instead of simple averages as a way of dealing with seasonality.
No comments:
Post a Comment