Tuesday, 20 June 2017

R Gleit Durchschnitt Prognose


Gleitende durchschnittliche Vorhersage Einführung. Wie Sie vielleicht vermuten, sehen wir uns einige der primitivsten Ansätze zur Prognose an. Aber hoffentlich sind dies zumindest eine lohnende Einführung in einige der Computing-Fragen im Zusammenhang mit der Umsetzung von Prognosen in Tabellenkalkulationen. In diesem Sinne werden wir fortfahren, indem wir am Anfang beginnen und mit Moving Average Prognosen arbeiten. Gleitende durchschnittliche Prognosen. Jeder ist mit gleitenden durchschnittlichen Prognosen vertraut, unabhängig davon, ob sie glauben, dass sie sind. Alle College-Studenten machen sie die ganze Zeit. Denken Sie an Ihre Testergebnisse in einem Kurs, wo Sie vier Tests während des Semesters haben werden. Nehmen wir an, Sie haben eine 85 bei Ihrem ersten Test. Was würdest du für deinen zweiten Test-Score vorhersagen Was denkst du, dein Lehrer würde für deinen nächsten Test-Score voraussagen Was denkst du, deine Freunde können für deinen nächsten Test-Score voraussagen Was denkst du, deine Eltern können für deinen nächsten Test-Score voraussagen All das Blabbing, das du mit deinen Freunden und Eltern machen kannst, sie und deinem Lehrer sind sehr wahrscheinlich zu erwarten, dass du etwas im Bereich der 85 bekommst, die du gerade bekommen hast. Nun, jetzt können wir davon ausgehen, dass trotz Ihrer Selbst-Förderung zu Ihren Freunden, Sie über-schätzen Sie sich selbst und Figur können Sie weniger für den zweiten Test zu studieren und so erhalten Sie eine 73. Nun, was sind alle betroffenen und unbekümmert zu gehen Erwarten Sie auf Ihrem dritten Test zu bekommen Es gibt zwei sehr wahrscheinlich Ansätze für sie eine Schätzung zu entwickeln, unabhängig davon, ob sie es mit Ihnen teilen wird. Sie können sich selbst sagen, "dieser Kerl ist immer bläst Rauch über seine smarts. Er wird noch 73, wenn er glücklich ist. Vielleicht werden die Eltern versuchen, mehr unterstützend zu sein und zu sagen, quotWell, so weit hast du eine 85 und eine 73 bekommen, also vielleicht solltest du auf eine (85 73) 2 79 kommen. Ich weiß nicht, vielleicht, wenn du weniger feiern musst Und werent wedelte den Wiesel überall auf den Platz und wenn du anfing, viel mehr zu studieren, könntest du eine höhere Punktzahl bekommen. Diese beiden Schätzungen belegen tatsächlich durchschnittliche Prognosen. Die erste nutzt nur Ihre aktuellste Punktzahl, um Ihre zukünftige Leistung zu prognostizieren. Dies wird als eine gleitende durchschnittliche Prognose mit einer Periode von Daten bezeichnet. Die zweite ist auch eine gleitende durchschnittliche Prognose, aber mit zwei Perioden von Daten. Lass uns annehmen, dass all diese Leute, die auf deinem großen Verstand zerschlagen sind, dich irgendwie verärgert haben und du entscheidest, den dritten Test aus deinen eigenen Gründen gut zu machen und eine höhere Punktzahl vor deinem Quote zu setzen. Sie nehmen den Test und Ihre Partitur ist eigentlich ein 89 Jeder, auch Sie selbst, ist beeindruckt. So, jetzt haben Sie die endgültige Prüfung des Semesters kommen und wie üblich fühlen Sie sich die Notwendigkeit, goad jeder in die Herstellung ihrer Vorhersagen darüber, wie youll auf den letzten Test zu tun. Nun, hoffentlich sehen Sie das Muster. Nun, hoffentlich kannst du das Muster sehen. Was glaubst du, ist die genaueste Pfeife während wir arbeiten. Jetzt kehren wir zu unserer neuen Reinigungsfirma zurück, die von deiner entfremdeten Halbschwester namens Whistle während wir arbeiten. Sie haben einige vergangene Verkaufsdaten, die durch den folgenden Abschnitt aus einer Kalkulationstabelle dargestellt werden. Zuerst stellen wir die Daten für eine dreistellige gleitende durchschnittliche Prognose vor. Der Eintrag für Zelle C6 sollte jetzt sein. Du kannst diese Zellformel auf die anderen Zellen C7 bis C11 kopieren. Beachten Sie, wie sich der Durchschnitt über die aktuellsten historischen Daten bewegt, aber genau die drei letzten Perioden verwendet, die für jede Vorhersage verfügbar sind. Sie sollten auch bemerken, dass wir nicht wirklich brauchen, um die Vorhersagen für die vergangenen Perioden zu machen, um unsere jüngsten Vorhersage zu entwickeln. Dies unterscheidet sich definitiv von dem exponentiellen Glättungsmodell. Ive enthalten die quotpast Vorhersagen, weil wir sie in der nächsten Webseite verwenden, um die Vorhersagegültigkeit zu messen. Jetzt möchte ich die analogen Ergebnisse für eine zweistufige gleitende durchschnittliche Prognose vorstellen. Der Eintrag für Zelle C5 sollte jetzt sein. Du kannst diese Zellformel in die anderen Zellen C6 bis C11 kopieren. Beachten Sie, wie jetzt nur die beiden letzten Stücke der historischen Daten für jede Vorhersage verwendet werden. Wieder habe ich die quotpast-Vorhersagen für illustrative Zwecke und für die spätere Verwendung in der Prognose-Validierung enthalten. Einige andere Dinge, die wichtig sind, um zu bemerken. Für eine m-Periode gleitende durchschnittliche Prognose werden nur die m aktuellsten Datenwerte verwendet, um die Vorhersage zu machen. Nichts anderes ist nötig Für eine m-Periode gleitende durchschnittliche Prognose, wenn Sie quotpast Vorhersagen quot, bemerken, dass die erste Vorhersage in Periode m 1 auftritt. Beide Themen werden sehr wichtig sein, wenn wir unseren Code entwickeln. Entwicklung der beweglichen Mittelfunktion. Jetzt müssen wir den Code für die gleitende Mittelprognose entwickeln, die flexibler genutzt werden kann. Der Code folgt. Beachten Sie, dass die Eingaben für die Anzahl der Perioden gelten, die Sie in der Prognose und dem Array von historischen Werten verwenden möchten. Sie können es in der beliebigen Arbeitsmappe speichern. Funktion MovingAverage (Historical, NumberOfPeriods) Als Single Declaring und Initialisierung von Variablen Dim Item als Variant Dim Zähler als Integer Dim Akkumulation als Single Dim HistoricalSize als Integer Initialisierung von Variablen Counter 1 Akkumulation 0 Bestimmen der Größe von Historical Array HistoricalSize Historical. Count For Counter 1 To NumberOfPeriods Akkumulation der entsprechenden Anzahl der aktuellsten bisher beobachteten Werte Akkumulation Akkumulation Historical (HistoricalSize - NumberOfPeriods Counter) MovingAverage Accumulation NumberOfPeriods Der Code wird in der Klasse erklärt. Sie möchten die Funktion auf der Kalkulationstabelle so positionieren, dass das Ergebnis der Berechnung erscheint, wo es wie folgt aussehen soll. R - Prognoseansätze zur Prognose bearbeiten ARIMA (AutoRegresive Integrated Moving Average) ETS (Exponentielles Glättungsstatusraummodell) Wir werden diskutieren, wie Diese Methoden funktionieren und wie man sie benutzt. Prognosepaketübersicht bearbeiten Exponential Glättung Bearbeiten Namen AKA: exponentiell gewichteter gleitender Durchschnitt (EWMA) Entspricht ARIMA (0,1,1) Modell ohne konstanter Term Für geglättete Daten für die Präsentation machen Prognosen einfacher gleitender Durchschnitt: Vergangene Beobachtungen werden gleich exponentiell gewichtet Glättung: weist exponentiell abnehmende Gewichte über Zeit auf Zeit Formel xt - Rohdatenfolge st - Ausgabe des exponentiellen Glättungsalgorithmus (Schätzung des nächsten Wertes von x) - Glättungsfaktor. 0160lt160160lt1601.Choose rechts keine formale Art der Wahl der statistischen Technik kann verwendet werden, um den Wert von (zB OLS) zu optimieren, desto größer ist die enge es naive Vorhersage (die gleichen Ports wie Original-Serie mit einer Periode Verzögerung) Double Exponential Smoothing Bearbeiten Simple Exponentielle Glättung geht nicht gut, wenn es einen Trend gibt (es wird immer Bias) Doppelte exponentielle Glättung ist eine Gruppe von Methoden, die sich mit dem Problem beschäftigen Holt-Winters doppelte exponentielle Glättung bearbeiten Und für t gt 1, wo ist der Daten Glättungsfaktor. 0160lt160160lt1601, und ist der Trend Glättungsfaktor. 0160lt160160lt1601 Ausgabe F tm - eine Schätzung des Wertes von x zur Zeit tm, mgt0 auf der Grundlage der Rohdaten bis zur Zeit t Triple Exponential Glättung Bearbeiten berücksichtigt saisonale Änderungen sowie Trends zuerst vorgeschlagen von Holts Student, Peter Winters, im Jahr 1960 Input Xt - rohe Datenfolge von Beobachtungen t 1601600 L Länge ein Zyklus der saisonalen Veränderung Die Methode berechnet: eine Trendlinie für die Datensaisonindizes, die die Werte in der Trendlinie auf der Grundlage dessen, wo dieser Zeitpunkt in den Zyklus der Länge L fällt, gewichten. S t stellt den geglätteten Wert des konstanten Teils für die Zeit t dar. Bt stellt die Abfolge der besten Schätzungen des linearen Trends dar, die den saisonalen Veränderungen überlagert sind ct ist die Sequenz der saisonalen Korrekturfaktoren ct ist der erwartete Anteil des vorhergesagten Trends zu jedem Zeitpunkt t mod L im Zyklus, den die Beobachtungen annehmen Initialisierung der saisonalen Indizes c tL muss mindestens ein vollständiger Zyklus in den Daten sein Die Ausgabe des Algorithmus wird wieder als F tm geschrieben. Eine Schätzung des Wertes von x zum Zeitpunkt tm, mgt0 auf der Grundlage der Rohdaten bis zur Zeit t. Die dreifache exponentielle Glättung ergibt sich aus den Formeln, wo der Datenglättungsfaktor liegt. 0160lt160160lt1601, ist der Trend Glättungsfaktor. 0160lt160160lt1601, und ist die saisonale Änderung Glättung Faktor. 0160lt160160lt1601 Die allgemeine Formel für die anfängliche Trendschätzung b 0 ist: Einstellung der Anfangsschätzungen für die saisonalen Indizes c i für i 1,2. L ist ein bisschen mehr beteiligt. Wenn N die Anzahl der vollständigen Zyklen in Ihren Daten ist, dann: Beachten Sie, dass a j der Mittelwert von x im j-ten Zyklus Ihrer Daten ist. ETS-Bearbeitung Overriding-Parameter bearbeiten 8.4 Durchschnittliche Modelle verschieben Anstatt vergangene Werte der Prognosemenge in einer Regression zu verwenden, verwendet ein gleitendes Durchschnittsmodell vergangene Prognosefehler in einem regressionsähnlichen Modell. Y c et theta e theta e dots theta e, wo et ist weißes Rauschen. Wir bezeichnen dies als MA (q) Modell. Natürlich beobachten wir nicht die Werte von et, also ist es nicht wirklich Regression im üblichen Sinne. Beachten Sie, dass jeder Wert von yt als ein gewichteter gleitender Durchschnitt der letzten Prognosefehler gedacht werden kann. Allerdings sollten die gleitenden durchschnittlichen Modelle nicht mit der gleitenden durchschnittlichen Glättung verwechselt werden, die wir in Kapitel 6 besprochen haben. Ein gleitendes Durchschnittsmodell wird für die Prognose zukünftiger Werte verwendet, während die durchschnittliche Glättung für die Schätzung des Trendzyklus vergangener Werte verwendet wird. Abbildung 8.6: Zwei Beispiele von Daten aus bewegten Durchschnittsmodellen mit unterschiedlichen Parametern. Links: MA (1) mit y t 20e t 0.8e t-1. Rechts: MA (2) mit y t e t - e t-1 0.8e t-2. In beiden Fällen ist e t normal verteilt weißes Rauschen mit mittlerem Null und Varianz eins. Abbildung 8.6 zeigt einige Daten aus einem MA (1) Modell und einem MA (2) Modell. Das Ändern der Parameter theta1, punkte, thetaq führt zu unterschiedlichen zeitreihenmustern. Wie bei autoregressiven Modellen wird die Varianz des Fehlerbegriffs nur den Maßstab der Serie ändern, nicht die Muster. Es ist möglich, jedes stationäre AR (p) Modell als MA (Infty) Modell zu schreiben. Zum Beispiel können wir mit wiederholter Substitution dies für ein AR (1) - Modell nachweisen: begin yt amp phi1y et amp phi1 (phi1y e) et amp phi12y phi1 e et amph phi13y phi12e phi1 e et amptext endgesetzt -1 lt phi1 lt 1, der Wert von phi1k wird kleiner, wenn k größer wird. So erhalten wir schließlich yt et phi1 e phi12 e phi13 e cdots, ein MA (infty) Prozess. Das umgekehrte Ergebnis gilt, wenn wir den MA-Parametern einige Einschränkungen auferlegen. Dann heißt das MA-Modell invertierbar. Das heißt, dass wir einen invertierbaren MA (q) Prozess als AR (Infty) Prozess schreiben können. Invertible Modelle sind nicht einfach, damit wir von MA Modellen in AR Modelle umwandeln können. Sie haben auch einige mathematische Eigenschaften, die sie in der Praxis leichter machen können. Die Invertierbarkeitsbeschränkungen ähneln den stationären Einschränkungen. Für ein MA (1) Modell: -1lttheta1lt1. Für ein MA (2) Modell: -1ltθ2lt1, theta2theta1 gt-1, theta1 - θ2 lt 1. Kompliziertere Bedingungen gelten für qge3. Wiederum wird R diese Einschränkungen bei der Schätzung der Modelle berücksichtigen. Basis Forecasting Forecasting bezieht sich auf den Prozess der Verwendung von statistischen Verfahren, um zukünftige Werte einer Zeitreihe basierend auf historischen Trends vorherzusagen. Für Unternehmen, in der Lage, erwartete Ergebnisse für einen bestimmten Zeitraum ist wichtig für die Verwaltung von Marketing, Planung und Finanzen. Zum Beispiel kann eine Werbeagentur die Verkaufsprognosen nutzen, um zu ermitteln, welche zukünftigen Monate erhöhte Marketingaufwendungen erfordern können. Unternehmen können auch Prognosen verwenden, um zu ermitteln, welche Vertriebsmitarbeiter ihre erwarteten Ziele für ein Geschäftsquartal erfüllt haben. Es gibt eine Reihe von Techniken, die genutzt werden können, um quantitative Prognosen zu generieren. Einige Methoden sind ziemlich einfach, während andere robuster sind und exogene Faktoren einbeziehen. Unabhängig von dem, was genutzt wird, sollte der erste Schritt immer sein, um die Daten mit einem Liniendiagramm zu visualisieren. Sie wollen überlegen, wie sich die Metrik im Laufe der Zeit ändert, ob es einen deutlichen Trend gibt oder ob es deutliche Muster gibt, die bemerkenswert sind. Es gibt mehrere Schlüsselbegriffe, die wir bei der Beschreibung von Zeitreihendaten erkennen sollten. Diese Merkmale informieren, wie wir die Daten vorverarbeiten und die entsprechende Modellierungstechnik und Parameter auswählen. Letztlich ist es das Ziel, die Muster in den historischen Daten zu vereinfachen, indem bekannte Variationsquellen entfernt und die Muster über den gesamten Datensatz hinweg konsistent gemacht werden. Einfachere Muster führen in der Regel zu genaueren Prognosen. Trend: Ein Trend besteht, wenn es eine langfristige Zunahme oder Abnahme der Daten gibt. Saisonalität: Ein saisonales Muster tritt auf, wenn eine Zeitreihe von saisonalen Faktoren wie der Zeit des Jahres oder dem Tag der Woche betroffen ist. Autokorrelation: Bezieht sich auf die Phänomene, wobei Werte von Y zum Zeitpunkt t durch vorherige Werte von Y bei t-i beeinflusst werden. Um die richtige Verzögerungsstruktur und die Art der automatisch korrelierten Werte in Ihren Daten zu finden, verwenden Sie die Autokorrelationsfunktionsdarstellung. Stationär: Eine Zeitreihe soll stationär sein, wenn es keinen systematischen Trend gibt, keine systematische Veränderung der Varianz, und wenn streng periodische Variationen oder Saisonalität nicht existieren Quantitative Prognosetechniken basieren in der Regel auf Reression Analysen oder Zeitreihen Techniken. Regressionsansätze untersuchen die Beziehung zwischen der prognostizierten Variablen und anderen erläuternden Variablen unter Verwendung von Querschnittsdaten. Zeitreihenmodelle verwenden hitorische Daten, die in regelmäßigen Abständen über die Zeit gesammelt wurden, damit die Zielvariablen ihre zukünftigen Werte prognostizieren können. Es gibt keine Zeit, um die Theorie hinter jedem dieser Ansätze in diesem Beitrag zu decken, so dass I8217ve gewählt, um High-Level-Konzepte zu decken und Code für die Durchführung von Zeitreihen-Prognose in R darzustellen. Ich schlage vor, die statistische Theorie hinter einer Technik vor dem Ausführen des Codes zu verstehen. Zuerst können wir die Ma-Funktion im Prognosepaket verwenden, um die Vorhersage mit der gleitenden Durchschnittsmethode durchzuführen. Diese Technik schätzt zukünftige Werte zum Zeitpunkt t durch Mittelungswerte der Zeitreihen innerhalb von k Perioden von t ab. Wenn die Zeitreihe stationär ist, kann der gleitende Durchschnitt sehr effektiv sein, da die Beobachtungen in der Zeit über die Zeit sind. Die einfache exponentielle Glättung ist auch gut, wenn die Daten keine Trend - oder Saisonmuster haben. Anders als ein gleitender Durchschnitt gibt diese Technik den jüngsten Beobachtungen der Zeitreihen mehr Gewicht. In der Prognose-Paket gibt es eine automatische Prognose-Funktion, die durch mögliche Modelle laufen und wählen Sie die am besten geeignete Modell geben die Daten. Dies könnte ein auto regressives Modell der ersten oder (AR (1)), ein ARIMA-Modell mit den richtigen Werten für p, d und q oder etwas anderes, das besser geeignet ist. Da gehst du, eine grundlegende nicht-technische Einführung in die Prognose. Dies sollte man sich mit den wichtigsten Konzepten vertraut machen und wie man eine grundlegende Vorhersage in R verpasst. Verpassen Sie nie ein Update Abonnieren Sie R-Blogger, um E-Mails mit den neuesten R-Beiträgen zu erhalten. (Du wirst diese Nachricht nicht mehr sehen.)

No comments:

Post a Comment