Zentraler Grenzwertsatz

Annäherung von symmetrischen (oben) und schiefen (unten) standardisierten Binomialverteilungen mit den Parametern und (rot) an die Standardnormalverteilung (grün)

Der zentrale Grenzwertsatz (von Lindeberg-Lévy) (auch CLT von englisch central limit theorem), genauer zentraler Grenzverteilungssatz, ist ein bedeutendes Resultat der Wahrscheinlichkeitstheorie.[1]

Der zentrale Grenzwertsatz liefert die Begründung für das Phänomen, dass der Stichprobenmittelwert als Zufallsvariable (unter gewissen Bedingungen) näherungsweise normalverteilt ist, insbesondere wegen der additiven Überlagerung vieler unabhängiger Zufallseinflüsse, wenn die Varianz dieser Zufallseinflüsse endlich ist.[1]

Für andere zentrale Grenzwertsätze siehe zentrale Grenzwertsätze, welche unter anderem beschreiben, dass neben der Normalverteilung auch andere α-stabile Verteilungen als Grenzverteilungen auftreten, falls Verteilungen berücksichtigt werden, die keine endliche Varianz besitzen.

Der Satz ist benannt nach dem finnischen Mathematiker Jarl Waldemar Lindeberg (1876–1932) und dem französischen Statistiker Paul Lévy (1886–1971). Die Bezeichnung geht auf G. Pólyas Arbeit Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem von 1920 zurück.[2]

Es existieren verschiedene Verallgemeinerungen, für die eine identische Verteilung keine notwendige Voraussetzung ist. Stattdessen wird dann eine andere Voraussetzung gefordert, die sicherstellt, dass keine der Variablen zu großen Einfluss auf das Ergebnis erhält. Beispiele sind die Lindeberg-Bedingung und die Ljapunow-Bedingung. Darüber hinausgehende Verallgemeinerungen gestatten sogar „schwache“ Abhängigkeit der Zufallsvariablen. Die Klasse der Verallgemeinerungen des zentralen Grenzwertsatzes wird zentrale Grenzwertsätze genannt.

Zentraler Grenzwertsatz bei identischer Verteilung

Sei eine Folge von Zufallsvariablen, die auf demselben Wahrscheinlichkeitsraum mit dem Wahrscheinlichkeitsmaß alle dieselbe Wahrscheinlichkeitsverteilung aufweisen und unabhängig sind (unabhängig und identisch verteilte Zufallsvariablen). Sei weiter angenommen, dass sowohl der Erwartungswert als auch die Standardabweichung existieren und endlich sind.

Betrachten wir nun die -te Teilsumme dieser Folge von Zufallsvariablen .

Der Erwartungswert von ist und die Varianz ist (siehe Gleichung von Bienaymé).

Bildet man daraus die standardisierte Zufallsvariable

dann besagt der Zentrale Grenzwertsatz, dass die Verteilungsfunktion von für punktweise gegen die Verteilungsfunktion der Standardnormalverteilung konvergiert. Dies entspricht genau dem Begriff der Konvergenz in Verteilung in der Stochastik. Ist die Verteilungsfunktion von , dann bedeutet dies, dass für jedes reelle

In etwas anderer Schreibweise erhält man

wobei

der Mittelwert der ersten Summanden der Zufallsvariablen ist.

Bemerkungen

  • Der Zentrale Grenzwertsatz kann aber auch elementar, das heißt ohne das tiefliegende Hilfsmittel der charakteristischen Funktion, bewiesen werden. Dazu werden Erwartungswerte der Form untersucht, die einerseits im Fall einer Indikatorfunktion eines abgeschlossenen Intervalls der Wahrscheinlichkeit entsprechen und andererseits in Fällen einer genügend glatten Funktion gut approximiert werden können. Dieses Verfahren eines elementaren Beweises stammt von Jarl Waldemar Lindeberg.[3]
  • Endliche Stichprobenumfänge lassen die Frage nach der Konvergenzgüte aufsteigen. Unter bestimmten Bedingungen liefert der Satz von Berry-Esseen eine Antwort: Existiert das dritte zentrierte Moment und ist es endlich, dann ist die Konvergenz zur Normalverteilung gleichmäßig und die Konvergenzgeschwindigkeit wenigstens von der Ordnung .
  • Da für stochastisch unabhängige normalverteilte Zufallsvariablen die Summe wieder normalverteilt ist (da die Normalverteilung eine alpha-stabile Verteilung ist), gilt für diese der zentrale Grenzwertsatz im Endlichen, genauer ist für jedes bereits standardnormalverteilt.

Verallgemeinerungen

Eine Verallgemeinerung des Zentralen Grenzwertsatzes ist der mehrdimensionale zentrale Grenzwertsatz. Er liefert Aussagen über die Konvergenz der Verteilungen von Zufallsvektoren gegen die mehrdimensionale Standardnormalverteilung.

Eine weitere Verallgemeinerung ist der zentrale Grenzwertsatz von Lindeberg-Feller. Er lässt auch gewisse Abhängigkeiten zwischen den Zufallsvariablen zu, indem er sie zu Gruppen zusammenfasst und die Unabhängigkeit nur innerhalb dieser Gruppen fordert. Die Folge dieser Gruppen wird ein Schema von Zufallsvariablen genannt. Die Lindeberg-Bedingung und die Ljapunow-Bedingung lassen sich auch für Schemata von Zufallsvariablen formulieren und liefern damit Kriterien für die Konvergenz bei Verwendung von Schemata.

In Banach-Räumen

Der zentrale Grenzwertsatz lässt sich nicht mehr direkt auf unendlichdimensionale Räume erweitern und hängt von der zugrunde liegenden Geometrie ab. Für Banach-Räume führen wir folgende Definition ein:

Sei ein Banach-Raum, eine Folge unabhängiger -wertiger Zufallsvariablen mit gemeinsamer Radon-Verteilung. Sei und die Verteilung von . Dann erfüllt den zentralen Grenzwertsatz, wenn -schwach gegen ein Radon-Gauß-Maß konvergiert, wenn .

Jørgen Hoffmann-Jørgensen und Gilles Pisier zeigten 1976, dass wenn und für alle und vom Typ 2 ist, dann erfüllt den zentralen Grenzwertsatz.[4] Allgemein gilt für Typ und der Satz nicht.

Beweis-Techniken für zentrale Grenzwertsätze

Um zentrale Grenzwertsätze zu beweisen, gibt es verschiedene Möglichkeiten, zum Beispiel die Methode von Stein oder Techniken aus der Fourier-Analysis.

Literatur

Siehe auch

Einzelnachweise

  1. a b Zentraler Grenzwertsatz. In: Guido Walz (Hrsg.): Lexikon der Mathematik. 1. Auflage. Spektrum Akademischer Verlag, Mannheim/Heidelberg 2000, ISBN 3-8274-0439-8.
  2. Jeff Miller: Earliest Known Uses of Some of the Words of Mathematics.
    George Pólya: Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem, Mathematische Zeitschrift, 8, 1920, S. 171–181 (online)
  3. Jarl Waldemar Lindeberg: Eine neue Herleitung des Exponentialgesetzes in der Wahrscheinlichkeitsrechnung, Mathematische Zeitschrift, Band 15, 1922, S. 211–225 (Online-Version).
    Siehe auch Jörg Bewersdorff: Statistik – wie und warum sie funktioniert. Ein mathematisches Lesebuch. Vieweg+Teubner Verlag 2011, ISBN 978-3-8348-1753-2, doi:10.1007/978-3-8348-8264-6, S. 139–146.
  4. Jørgen Hoffmann-Jørgensen und Gilles Pisier: The Law of Large Numbers and the Central Limit Theorem in Banach Spaces. In: Ann. Probab. Band 4, Nr. 4, 1976, S. 587 - 599, doi:10.1214/aop/1176996029.