Rang (Statistik)

In einer Reihe von statistischen Beobachtungen ergibt sich der Rang einer einzelnen Beobachtung als ihre Position, wenn alle Beobachtungswerte der Größe nach geordnet und durchnummeriert werden.

Es ist möglich, dass mindestens zwei Beobachtungen den gleichen Wert haben. Man spricht dann von Bindungen oder Verbundwerten (engl. Ties). Der Rang ist daher nicht wohldefiniert.

In der Stochastik ist der Rang aber fast sicher eindeutig erklärt, falls die einzelnen Beobachtungen unabhängig und stetig verteilt sind. Auf der Auswertung der Ränge innerhalb von Stichproben basiert eine Reihe von statistischen Tests in der nichtparametrischen Statistik. Die nach ihrem Rang geordneten Beobachtungswerte heißen Ordnungsstatistiken.

Definition

Die Beobachtungswerte werden der Größe nach sortiert. Im Fall, dass kein Wert mehrfach auftritt, bekommt der kleinste Wert meistens den Rang 1, der nächstgrößere (also zweitkleinste) den Rang 2 usw.[1][2] Mögliche Vorgehensweisen bei mehrfach auftretenden Werten (sogenannten Bindungen) sind unten aufgeführt.

Die übliche Schreibweise ist für den Beobachtungswert mit dem Rang .

Beispiel

Folgende Beobachtungen wurden für die monatlichen Aufwendungen für Freizeitgüter und Urlaub in Zweipersonenhaushalten gemacht:

Beobachtungsnummer 1 2 3 4
Beobachtungswert 220 240 220 180
Rang 2 oder 3 4 2 oder 3 1

Also: , d. h. ist der Beobachtungswert mit dem Rang und der zweite Beobachtungswert in der Datenreihe.

Die Beobachtungen können zu einer Rangliste geordnet werden:

Listenrang Beobachtungsnummer Beobachtungswert
1. 4 180
2.–3. 1 220
" 3 "
4. 2 240

Bindungen

In der Praxis kann es vorkommen, dass Beobachtungswerte mehrfach auftreten. Man spricht davon, dass Bindungen in den Beobachtungswerten auftreten. Da Beobachtungen mit gleichen Werten nicht unterschiedliche Ränge haben sollten, müssen diese behandelt werden. Da in der Statistik oft Rangsummen betrachtet werden, ist eine oft gestellte Anforderung an Verfahren, die Bindungen behandeln, dass die Summe der Ränge von Beobachtungen gerade ist.

Verschiedene Verfahren können benutzt werden, um eine eindeutige Rangzuordnung zu finden:[3]

Mittelwert
Den ranggleichen Beobachtungen wird das arithmetische Mittel der auf sie fallenden Ränge zugeordnet.[1][2]
Beispiel: Folgende Beobachtungen wurden für die monatlichen Aufwendungen für Freizeitgüter und Urlaub in Zweipersonenhaushalten gemacht:
Beobachtungsnummer 1 2 3 4 5 6 7 8 9 10
Beobachtungswert 125 315 215 105 200 170 170 220 220 220
Rang 2 10 6 1 5 3,5 3,5 8 8 8
  • Den Beobachtungswerten 170 müssten die Ränge 3 und 4 zugeordnet werden. Das arithmetische Mittel ergibt sich zu .
  • Den Beobachtungswerten 220 müssten die Ränge 7, 8 und 9 zugeordnet werden. Das arithmetische Mittel ergibt sich zu .
Randomisierung
Den ranggleichen Beobachtungswerten wird zufällig einer der Ränge derselben zugeordnet.
A-fortiori-Methode
Im Falle der Durchführung eines Tests wird die Rangfolge so festgelegt, dass die Nullhypothese begünstigt wird.

Alle möglichen Rangzuordnungen untersuchen

Berechne die Teststatistik für alle möglichen Rangzuordnungen, d. h. führe den Test für alle möglichen Zuordnungen durch. Wird unabhängig von den Zuordnungen immer angenommen oder verworfen, dann endet die Methode hier.[4]

Eliminierung

Entferne solange Beobachtungen aus der Stichprobe, bis alle Bindungen verschwinden. Insofern der Stichprobenumfang groß genug ist, ist der Informationsverlust unerheblich, ansonsten ist von dieser Methode abzuraten, da sie bei vielen Tests die Teststärke verringert.[5]

Verteilung der Ränge

Der Rang einer Zufallsvariablen ist eine diskret gleichverteilte Zufallsvariable auf .

Eigenschaften

Die Summe der Ränge einer Datenreihe ist

(Gaußsche Summenformel). Auch bei Bildung des arithmetischen Mittels zur Berechnung der Ränge bei Bindungen bleibt diese Eigenschaft erhalten.

Einzelnachweise

  1. a b Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage. Vieweg, 2005, S. 187–188.
  2. a b Roland Jeske: Spaß mit Statistik. 4. Auflage. Oldenbourg, 2003, S. 172–173.
  3. Jürgen Bortz, Gustav A. Lienert, Klaus Boehnke: Verteilungsfreie Methoden in der Biostatistik. 3. Auflage. Springer Verlag, 2008, S. 69–70.
  4. Christine Duller: Einführung in die nichtparametrische Statistik mit SAS, R und SPSS. 2. Auflage. SpringerGabler, 2019, ISBN 978-3-662-57677-9, S. 27.
  5. Christine Duller: Einführung in die nichtparametrische Statistik mit SAS, R und SPSS. 2. Auflage. SpringerGabler, 2019, ISBN 978-3-662-57677-9, S. 27.

Siehe auch