Was ist ll?

ll - Die Log-Likelihood-Funktion

Die Log-Likelihood (ll) Funktion ist ein zentrales Konzept in der Statistik und Wahrscheinlichkeitstheorie, insbesondere bei der Parameterschätzung in statistischen Modellen. Sie ist eng mit der Likelihood-Funktion verbunden, wird aber oft bevorzugt verwendet, da sie mathematisch einfacher zu handhaben ist.

Kernidee:

Die Log-Likelihood Funktion gibt die Logarithmus der Likelihood Funktion wieder. Die Likelihood Funktion wiederum, misst, wie wahrscheinlich es ist, die beobachteten Daten zu erhalten, gegeben bestimmte Parameterwerte eines statistischen Modells. Ziel ist es in der Regel, die Parameterwerte zu finden, die die Log-Likelihood Funktion maximieren (Maximum-Likelihood-Schätzung oder MLE).

Warum der Logarithmus?

  • Mathematische Vereinfachung: Die Likelihood-Funktion ist oft ein Produkt vieler Wahrscheinlichkeiten. Der Logarithmus wandelt dieses Produkt in eine Summe um, was die Ableitung und Optimierung deutlich vereinfacht. Die Summe ist einfacher abzuleiten und numerisch zu handhaben.
  • Numerische Stabilität: Sehr kleine Wahrscheinlichkeiten können zu numerischen Problemen führen (z.B. Unterlauf). Der Logarithmus komprimiert den Wertebereich und reduziert so diese Probleme.
  • Gleichwertige Maximierung: Die Parameterwerte, die die Likelihood-Funktion maximieren, maximieren auch die Log-Likelihood-Funktion, da der Logarithmus eine monotone Transformation ist. Die Maximum-Likelihood-Schätzung (MLE) bleibt also erhalten.

Anwendung:

Die Log-Likelihood Funktion wird in einer Vielzahl von statistischen Modellen eingesetzt, darunter:

Interpretation:

Ein höherer Wert der Log-Likelihood deutet auf eine bessere Anpassung des Modells an die Daten hin. Die Log-Likelihood kann auch verwendet werden, um verschiedene Modelle miteinander zu vergleichen (z.B. mit dem Likelihood-Quotienten-Test).

Formel (Beispiel):

Angenommen, wir haben eine Stichprobe von unabhängigen und identisch verteilten (i.i.d.) Datenpunkten x<sub>1</sub>, x<sub>2</sub>, ..., x<sub>n</sub> aus einer Verteilung mit Dichtefunktion f(x; θ), wobei θ der Parametervektor ist. Dann ist die Log-Likelihood-Funktion:

ll(θ) = log(L(θ)) = Σ log(f(xᵢ; θ))  (Summe über i von 1 bis n)

Dabei ist L(θ) die Likelihood Funktion.

Zusammenfassend:

Die Log-Likelihood Funktion ist ein wichtiges Werkzeug für die Parameterschätzung und den Modellvergleich in der Statistik. Ihre mathematischen Vorteile und ihre enge Verbindung zur Likelihood Funktion machen sie zu einer weit verbreiteten Methode in vielen Bereichen der Datenanalyse.