Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit
Belegen (beispielsweise
Einzelnachweisen) ausgestattet. Angaben ohne ausreichenden Beleg könnten demnächst entfernt werden. Bitte hilf Wikipedia, indem du die Angaben recherchierst und
gute Belege einfügst.
Das zentrale Schwankungsintervall ist ein Begriff aus der mathematischen Statistik. Es sagt etwas über die Präzision der Lageschätzung eines Parameters (zum Beispiel eines Mittelwertes) aus. Das Schwankungsintervall schließt einen Bereich um den wahren Wert des Parameters in der Grundgesamtheit ein, der – vereinfacht gesprochen – mit einer zuvor festgelegten Sicherheitswahrscheinlichkeit den aus der Stichprobe geschätzten Parameter enthält.
Eine Schätzfunktion
ist eine Zufallsvariable für einen unbekannten wahren Parameter
einer Grundgesamtheit. Daher besitzt sie eine Verteilung, und wir können mit der Wahrscheinlichkeit
Intervalle bezüglich der Realisierung angeben.
Das heißt, ziehen wir eine Stichprobe mit den Werten
, dann können wir einen Schätzwert
berechnen und mit einer vorgegebenen Wahrscheinlichkeit ein Intervall angeben, in dem wir den Schätzwert
erwarten.
Die zentralen Schwankungsintervalle haben einen Nachteil: Die Intervallgrenzen enthalten den unbekannten Parameter
(im Gegensatz zum Konfidenzintervall). Trotzdem liefert das zentrale Schwankungsintervall eine wertvolle Information, nämlich die Größe der Abweichung eines aus der Stichprobe geschätzten Parameters vom wahren Parameter.
Parameter
|
Bedingung
|
Zentrales Schwankungsintervall
|
|
, bekannt
|
|
|
, unbekannt
|
|
|
beliebig verteilt,
|
( bekannt)
( unbekannt)
|
|
, bekannt
|
|
|
, unbekannt
|
|
|
Bernoulli verteilt mit Parameter
|
bzw.
|
Dabei sind
die Sicherheitswahrscheinlichkeit,
,
und
die
-Quantile der Standardnormal-, t- und Chi-Quadrat-Verteilung mit
Freiheitsgraden,
die korrigierte Stichprobenvarianz sowie
der geschätzte Anteilswert aus der Stichprobe.
Das zentrale Schwankungsintervall für eine Schätzfunktion
ist das Intervall
für das gilt
bzw.
, also
.
Das zentrale Schwankungsintervall kann, muss aber nicht, symmetrisch um den unbekannten Parameter liegen. Die Werte
bzw.
hängen ab
- von dem Verteilungstyp der Schätzfunktion (siehe
,
) und
- der Varianz der Schätzfunktion
:
.
Für den unbekannten Mittelwert
der Grundgesamtheit wird die Schätzfunktion
genommen. Es ergeben sich für die Verteilung von
zwei Fälle:
, dann gilt
(Reproduktivitätseigenschaft der Normalverteilung) oder
(beliebig verteilt) und die Voraussetzungen des zentralen Grenzwertsatzes erfüllt, dann gilt
.
Daraus ergeben sich drei Schwankungsintervalle:
- 1a.
bekannt, dann gilt
und
![{\displaystyle P\left(\mu -z_{1-\alpha /2}\sigma /{\sqrt {n}}\leq {\bar {X}}\leq \mu +z_{1-\alpha /2}\sigma /{\sqrt {n}}\right)=1-\alpha }](https://cdn.statically.io/img/wikimedia.org/api/rest_v1/media/math/render/svg/e496064a6f92b384380700caa281f735d41cc721)
- 1b.
unbekannt, dann gilt
und
![{\displaystyle P\left(\mu -t_{n-1;1-\alpha /2}S/{\sqrt {n}}\leq {\bar {X}}\leq \mu +t_{n-1;1-\alpha /2}S/{\sqrt {n}}\right)=1-\alpha }](https://cdn.statically.io/img/wikimedia.org/api/rest_v1/media/math/render/svg/e28ef0aee3307f666205e12701861e10c33f5498)
- 2. Es gilt
und
.
Die Werte
bzw.
sind die
-Quantile der Standardnormalverteilung bzw. der Studentsche t-Verteilung mit
Freiheitsgraden.
Wenn die Stichprobenvariablen
verteilt sind, dann gibt es
für die Varianz
zwei verschiedene mögliche Schätzfunktionen:
- Wenn
bekannt ist, dann ergibt sich
.
- Wenn
unbekannt ist, dann ergibt sich
.
Im ersten Fall ist
verteilt, und das zentrale Schwankungsintervall ist
![{\displaystyle P\left(\chi _{n;\alpha /2}^{2}{\frac {\sigma ^{2}}{n}}\leq S^{*^{2}}\leq \chi _{n;1-\alpha /2}^{2}{\frac {\sigma ^{2}}{n}}\right)=1-\alpha }](https://cdn.statically.io/img/wikimedia.org/api/rest_v1/media/math/render/svg/b59256d72c2fbc7d97e24adeb50cc32e9a426cbb)
und im zweiten Fall ist
verteilt, und das zentrale Schwankungsintervall ergibt sich zu
.
Die Werte
sind die
-Quantile der Chi-Quadrat-Verteilung mit
Freiheitsgraden.
In beiden Fällen liegt das zentrale Schwankungsintervall nicht symmetrisch um
.
Eine dichotome Zufallsvariable
Anzahl der Erfolge bei
Ziehungen mit Zurücklegen ist binomialverteilt in Abhängigkeit von der unbekannten Erfolgswahrscheinlichkeit
. Bei der Erfüllung der Approximationsbedingungen ist
normalverteilt und auch die Schätzfunktion
. Das zentrale Schwankungsintervall ergibt sich daher zu
.
Für die praktischen Berechnungen kann man
entweder mit
abschätzen. Alternativ kann man
mit
ersetzen, und
ist der Anteilswert aus der Stichprobe.
Beispiel 1: Wenn wir die mittlere Studiendauer in Semestern von Studenten auf
genau schätzen wollen mit einer Sicherheitswahrscheinlichkeit
, dann bedeutet dies, dass das zentrale Schwankungsintervall vom wahren Wert
um nicht mehr als
Semester abweichen darf. Die Länge des zentralen Schwankungsintervalls muss also
Semester sein.
Für die mittlere Studiendauer ist nicht bekannt, ob sie normalverteilt ist, d. h. es folgt
,
d. h. in Abhängigkeit von
(
) lässt sich ein Stichprobenumfang bestimmen, um diese Genauigkeit zu erreichen:
.
Mit
Semester müssen also 1537 Studenten befragt werden, ist
Semester, dann wären es bereits 6147 Studenten nötig. In diesem Beispiel ist nur die Lage, nicht aber die Breite des zentralen Schwankungsintervalls vom wahren Parameter abhängig.
Beispiel 2: In Wahlumfragen werden üblicherweise ca. 1000 Wahlberechtigte befragt. Mit welcher Genauigkeit bei einer Sicherheitswahrscheinlichkeit von
kann ein Wahlforscher das Ergebnis einer Partei vorhersagen?
Die Länge des zentralen Schwankungsintervalls ist
,
und mit
,
ergibt sich eine Länge von
. D. h. mit 95 % Wahrscheinlichkeit wird der Anteilswert aus der Stichprobe um maximal
vom wahren Anteilswert
abweichen. Bei einem wahren Anteilswert von
ergibt sich das zentrale Schwankungsintervall also zu
; diese große Ungenauigkeit ist einer der Gründe, warum in der Presse/Meinungsforschungsinstituten selten die Genauigkeit von Prognosen mit angegeben wird.
Die Konfidenzintervalle werden direkt aus den zentralen Schwankungsintervallen abgeleitet:
- Subtraktion von
![{\displaystyle \vartheta }](https://cdn.statically.io/img/wikimedia.org/api/rest_v1/media/math/render/svg/d00eaf197c35bbfa391b9477490a4af955416837)
- Subtraktion von
![{\displaystyle \theta }](https://cdn.statically.io/img/wikimedia.org/api/rest_v1/media/math/render/svg/6e5ab2664b422d53eb0c7df3b87e1360d75ad9af)
- Multiplikation von
![{\displaystyle -1}](https://cdn.statically.io/img/wikimedia.org/api/rest_v1/media/math/render/svg/704fb0427140d054dd267925495e78164fee9aac)
Und damit ergibt sich das Konfidenzintervall.
Die folgende Tabelle summiert einige Unterschiede zwischen dem zentralen Schwankungsintervall und dem Konfidenzintervall.
|
Zentrales Schwankungsintervall
|
Konfidenzintervall
|
Grenzen
|
Sind für jede Stichprobe gleich, also feste Werte
|
Ändern sich bei jeder Stichprobe, sind also Zufallsvariablen
|
Lage
|
Schließt den unbekannten Parameter der Grundgesamtheit ein
|
Schließt den geschätzten Parameter der Stichprobe ein
|
Interpretation
|
Gibt an, mit welcher Wahrscheinlichkeit der aus der Stichprobe geschätzte Parameter im Intervall enthalten ist
|
Gibt an, welcher Anteil der Schätzintervalle den wahren Parameter enthalten
|