← Zurück zur Analyse

Mathematische Grundlagen

Stufenlose Markov-Ketten (CSMC) & Kernel Density Estimation für Aktien

1. Stufenlose Markov-Ketten (CSMC)

Klassische Markov-Ketten teilen Daten in starre Zustände (z. B. "Steigend", "Fallend") ein. Aktienkurse sind jedoch kontinuierlich. Wurstketten nutzt daher eine Continuous-State Markov Chain (CSMC), bei der Zustandsübergänge nicht mehr in diskreten Boxen stattfinden, sondern stufenlos über eine bedingte Wahrscheinlichkeitsdichte $f(y|x)$ abgebildet werden.

Höhere Markov-Ordnung (Pattern Memory)
f(Xt+1 = y | Xt, Xt-1, ..., Xt-k)

Während eine klassische Kette nur den Zustand von heute betrachtet (Ordnung 1), erlaubt Wurstketten ein einstellbares Gedächtnis (Ordnung k). Die Wahrscheinlichkeitsdichte des morgigen Kurses hängt somit von der Ähnlichkeit des gesamten Kursmusters der letzten k Tage ab.

1.1 Pattern Matching via Euklidischer Distanz

Um die Wahrscheinlichkeit für morgige Kurse basierend auf historischen Mustern zu berechnen, nutzt das System Multi-Scale Pattern Matching. Anstatt nur die heutige Rendite zu vergleichen (1D), gleichen wir das gesamte Gedächtnisfenster auf verschiedenen Zeitebenen ab.

Muster-Ähnlichkeit S = Σlen=1..k [ 2len · D²norm(len) ]

Dabei berechnet das System die Ähnlichkeit für jede mögliche Teillänge (1 Tag, 2 Tage, ..., k Tage). Längere Übereinstimmungen werden dabei überproportional gewichtet (2len). Dies stellt sicher, dass komplexe Formationen (z.B. Schulter-Kopf-Schulter) erkannt werden, das System aber auch bei teilweisen Ähnlichkeiten robuste statistische Aussagen trifft ("Fuzzy Matching").

1.2 Zeitliche Gewichtung innerhalb des Musters

Nicht alle Tage innerhalb eines Musters sind gleich wichtig. Wurstketten gewichtet Tage innerhalb des Gedächtnisfensters exponentiell: Der Renderverlauf von heute zählt mehr für die Mustererkennung als der Verlauf von vor 5 Tagen.

wtemporal(j) = 1.5j

1.3 Kernel Density Estimation (KDE)

Jedem historischen Paar (Muster → Folgetag) wird ein Gaußsches Kernel-Gewicht K zugefügt, das umso größer ist, je ähnlicher das historische Muster unserem aktuellen Muster ist:

Ki(P*) = exp( - D² / (2 · b²) )

wobei b die Glättungs-Bandbreite (Bandwidth) ist.
Anschaulich: Hatte die Aktie in den letzten 3 Tagen ein Muster von (-1%, +0.5%, -2%), sucht Wurstketten stufenlos nach genau solchen Bewegungsabfolgen in der gesamten Historie. Ein historisches 3-Tage-Fenster, das exakt dieses "Zick-Zack" aufweist, erhält die höchste Gewichtung für die Simulation des 4. Tages.

2. Modifizierte Gewichtungssysteme

Zusätzlich zur Distanz im KDE-Grid (Kernel Weight) multiplizieren wir dynamische Marktgewichte Wi auf die historischen Paare. Das finale Gewicht eines historischen Pfades für die Vorhersage ergibt sich aus:

P(yi | x*) ∝ Ki(x*) · Wi

2.1 Recency-Gewichtung (Exponential Decay)

Neuere Reaktionen auf Kursbewegungen werden exponentiell stärker gewichtet. Die Intuition: Aktuelle Marktbedingungen (Zinsen, Inflation, Sentiment) lassen Historien aus der letzten Woche relevanter sein als Reaktionen von vor 2 Jahren.

Wrecency(t) = exp(λ · (t / T))

2.2 Earnings-Gewichtung (Post-Earnings-Drift)

Aktien tendieren dazu, sich nach Quartalszahlen noch tagelang in Richtung des Shocks zu bewegen (PEAD). Wurstketten spürt Earnings-Tage durch Anomalien in Volumen und Rendite auf und vervielfacht deren Gewicht für die fünf darauffolgenden Tage (Exponential Decay).

isEarnings(t) = (Volument > 2·V̄) ∧ (|Renditet| > 1.8·|R̄|)

2.3 Anomalie-Gewichtung (Fat Tails)

Extreme Kurssprünge (Black Swan Events) markieren meist strukturelle Brüche. Solche Extremwerte (Z.b. > 2 Standardabweichungen vom Mittelwert) werden stark überbewertet (Faktor 5.0), damit die stufenlose KDE nicht die Information dieser seltenen Spikes verwässert.

3. Deterministische PDF-Propagation (Raytracing)

Um den Kurs in 14 Tagen vorherzusagen, nutzt Wurstketten keine Monte-Carlo Simulationen (Zufallspfade) mehr, um Rauschen und statistische Varianz zu vermeiden. Stattdessen wird die Wahrscheinlichkeitsdichte (PDF) für jeden Tag deterministisch auf einem Gitter propagiert.

Was ist Grid-Raytracing? Anstatt 2000 "blinde" Pfade zu würfeln, berechnet das System für jeden Punkt im statistischen Raum (Zeit × Preis), wie viel Wahrscheinlichkeit dort aus dem Ursprung "hinfließt". Dies führt zu absolut glatten Heatmaps ohne stochastisches Flackern.

3.1 Der Zustands-Propagator

Zustand: ft(S, R)
S: Akkumulierte Rendite (%) | R: Letzte Tagesrendite (%)

Propagation: ft+1(S+R', R') = ΣR [ ft(S, R) · P(R' | R) ]

Die Wahrscheinlichkeit am Tag t+1 ergibt sich aus der Summe aller Wahrscheinlichkeiten am Tag t, gewichtet mit der Übergangsmatrix P(R'|R). Da wir sowohl die Kursänderung (S) als auch den aktuellen Tageszustand (R) mitführen, bleibt die Markov-Eigenschaft gewahrt, während die gesamte Fläche in einem Rutsch berechnet wird.

Analytische Perzentile
Da uns am Ende für jeden Tag die exakte Verteilungsfunktion (PDF) vorliegt, werden die Konfidenzintervalle (P10, P50, P90) nicht mehr durch Zählen von Pfaden geschätzt, sondern durch direkte Integration der Fläche unter der Kurve berechnet.

3.2 Wahrscheinlichkeits-Heatmaps (Raytracing)

Wurstketten nutzt ein Raytracing-Verfahren zur Darstellung der Übergänge. Anstatt nur historisch diskrete Punkte zu zeichnen, wird für jeden Pixel der Heatmap die bedingte Wahrscheinlichkeitsdichte f(y|x) über alle Transitionen berechnet.

4. Stationarität & Modellgrenzen