Click here to load reader
View
222
Download
2
Embed Size (px)
Formeln zur Statistik Statistik - Neff
(1.1) Mittelwert, Varianz bei Einzelwerten (1.2) Freiheitsgrade (1.3) Abweichungsquadrate (1.4) Lineare Einfach-Regression (1.5) Multiple lineare Regression, DW-Tabelle (1.6) A'-Regression (1.7) VT Regression (2.1) Linearer Trend und Saisonschwankungen (2.2) Logistischer Trend (2.3) Gleitende Mittelwerte (2.4) Wachstumsfaktoren (2.5) Exponentielles Gltten (3.1) Konzentrationsmae (3.3) Hufigkeitsverteilung (4.1) Wahrscheinlichkeit (4.2) Chi2-Unabhngigkeitstest (4.3) Diskrete Zufallsvariable (4.4) Stichprobenmittel (4.5) Stetige Zufallsvariable (5.1) Binomialverteilung (5.2) Hypergeometrische Verteilung (5.3) POISSON-Verteilung (5.4) Normalverteilung (5.5) Standard-Normalverteilung (5.6) Approximationsbedingungen (5.7) Anpassung und Korrekturfaktoren (5.8) Chi2 - Anpassungstest (6.1) Konfidenzintervall (6.2) Hypothesentest (6.3) unbekannt (6.4) Stichprobe ohne Zurcklegen Tabellen
(7.1) Binomialverteilung (7.2) POISSON-Verteilung (7.3) Tabelle FISHER-Prfma xF (7.4) Tabelle Chi2-Prfma 2 (7.5a) Tabelle STUDENT-Prfma F(t) (7.5b)Tabelle STUDENT-Prfma D(t) (7.6) Standardnormalverteilung FSN
Formeln zur Statistik Statistik - Neff
(1.1) Mazahlen bei Einzelwerten Mittelwert bei N bzw. n Einzelwerten xi
In der Grundgesamtheit 1
1 Ni
i
xN =
= in der Stichprobe: 1
1 ni
i
x xn =
=
Abweichungsquadrate ( ) ( )22 20
1nx i i i
i
A x x x xn=
= = Varianz bei N bzw. n Einzelwerten xi
der Grundgesamtheit: ( )2 2 21 1
1 1N Ni i n
i i
x x N N
22
= =
= = =
der Stichprobe: ( )22 2 2 11 1
1 1
1 1
n n
i i n
i i
s x x x nxn n
2
= =
= = =
Standardabweichung in der Grundgesamtheit: 2 = in der Stichprobe: 2s s= (1.2) Freiheitsgrade "n" Freiheitsgrade (df, degrees of freedom) ist die Anzahl der frei whlbaren, unabhngigen Einzelwerte, die in die statistischen Berechnungen einbezogen werden knnen. a) bei der Stichprobenvarianz n-1 b) beim FISHER-Prfma = n-p-1 p Anzahl der Einflussgren c) beim STUDENT-t-Prfma in der multiplen Regression: = n-p-1 im Hypothesentest: = n -1 d) beim Chi2-Prfma 2 im Unabhngigkeitstest = (k - 1) (l - 1) im Anpassungstest = k p 1 (1.3) Abweichungsquadrate bei Regressionsanalysen SS "Sum of Squares", Summe der Abweichungsquadrate A MS Mittlere Summe der Abweichungsquadrate, Varianz 2, Mean Sum of Squares p Anzahl der Einflussfaktoren
2 2Error1 1
( )n n
i i i
i i
A y y e= =
= = = SSResiduen ( )2Res
Residuen
- -1 1i iy ySS
MSn p n p
= =
2
2 2Gesamt Gesamt Gesamt 1
1
( )( )
1 1
ni iGesamt
i i n
i
y ySSA y y SS MS
n n
=
= = = = =
2
Regression2erklrt Regression erklrt
1
( )( )
ni i
i i
i
SS y yA y y SS MS
p p=
= = = =
Bestimmtheitsma ( ) ( ) ( )
( )
2 2 2
22 1 1 1
22
1
:1 1
n n n
i i i
erklrt i i i
n
gesamti
i
y y y y y ys
rs n n
y y
= = =
=
= = =
Adjustiertes Bestimmtheitsma 2 Residuen
Gesamt
1adjustMS
rMS
=
FISHER-Prfgre xFempir = erklrt
Residuen
MS
MS
Formeln zur Statistik Statistik - Neff
(1.4) Lineare Einfach-Regression = m x + b
Summe der Abweichungsquadrate 2 2Error1 1
( )n n
i i i
i i
A y y e= =
= =
Regressionskoeffizienten ( )22
i i i i
i i
n x y x ym
n x x
=
1
i i
mb y x
n n=
Korrelationskoeffizient
( )( ) ( )( )2 22 2i i i i
i i i i
n x y x yr
n x x n y y
=
Bestimmtheitsma r2
FISHER-Prfgre xFempir ( )2
erklrt2
Residuen
21
MSrn
r MS= =
Die Nullhypothese wird verworfen, wenn xFempirisch > xFc, | 1 | (1.5) Multiple lineare Regression p Einflussfaktoren, = n-p-1 Freiheitsgrade Die Nullhypothese wird verworfen, wenn xFempirisch > xFc, | p | Signifikanter Beitrag des Einflussfaktors xk , wenn | tempirisch | > tc, | Tabelle 7.5a Signifikante Interkorrelation zwischen den Einflussfaktoren xj, xk , wenn rjk > 0,5.
Signifikante Autokorrelation, wenn fr die DURBIN-WATSON-Prfgre gilt: DW1 [DWunten ; DWoben]
( )21
21
2
1
n
i i
i
n
i
i
e e
DW
e
=
=
=
( )2
1
2
1
n
i i k
i kk n
i
i
e e
DW
e
= +
=
=
(1.6) A'-Regression = a (x) + b Ansatzfunktionen (x)
Summe der Abweichungsquadrate 2
1
( ( ) )n
i
i
A y a x b=
=
Normalgleichungen ( )2( ) ( ) ( )
( )
i i i i
i i
a x b x y x
a x nb y
+ =
+ =
Regressionskoeffizienten ( ) ( )22
( ) ( )
( ) ( )
i i i i
i i
n y x y xa
n x x
=
1
( )i ia
b y xn n
=
Formeln zur Statistik Statistik - Neff
(1.7) VTRegression Lineare Regressionsmodelle (x) = a0 + a11(x) + a2 2(x) + + ak k(x) mit den Ansatzfunktionen i (x)
VANDERMONDE-Matrix
0 0 1 0 0
0 1 1 1 1
0 0
1 ( ) ( ) ( )
1 ( ) ( ) ( )
1 ( ) ( ) ( )
k
k
m m k m
x x x
x x x
x x x
=
V
VANDERMONDE-Gleichung Va = y V TV a = V T y Interpolationswert fr x =z (z) = a0 + a11(z) + a2 2(z) + + ak k(z) (2.1) Linearer Trend und Saisonschwankungen Komponentenmodell yi = i + si + iri
Saisonschwankungen si = yi i 1
1 kj ij
i
s sk =
=
Irregulre Restwerte iri = si js = yi js
Prognosewerte p = (xn+z) + ijs
(2.2) Logistischer Trend
Ansatzfunktion 1 mx b
Sy
e +=
+ *transformiert ln 1
Sy
y
=
Regressionskoeffizienten ( )
* *i i *
i i22i i
1i in x y x y mm b y x
n nn x x
= =
(2.3) Gleitende Mittelwerte k vorausgehende und k nachfolgende Zeitreihenwerte Ungerade bzw. gerade Ordnung des gleitenden Mittelwerts
( )
( )m=i+ k-1m=i+k
i m i i-k m i+km=i-k m=i- k-1
1 1 1 1
2 1 2 2 2y y y y y y
k k
= = + + +
(2.4) Wachstumsfaktoren
Indizes 0,0
kk
BI
B= (Berichtsperiode k, Basisperiode 0)
Wachstumsfaktoren 1
ii
i
yx
y = Zuwachsrate ri = xi 1
Mittlerer Wachstumsfaktor 0
( ) nniy
GM xy
= Mittlere Zuwachsrate 0
nn
y
y-1
(Es liegen n+1 y-Werte y0, y1, , yn vor)
Formeln zur Statistik Statistik - Neff
(2.5) Exponentielles Gltten n Beobachtungswerte, Glttungskonstante
Prognosewerte, direkt n 1
n 1 n-i n-i0 i 0
(1 ) (1 )i i
i
y y y
+= =
= = Geglttete Werte, rekursiv i 1 i+1 i (1 )y y y+ = + Prognosen fr i = n
THEIL'scher Ungleichheitskoeffizient ( )
( )
2
i i
2
i i 1
y yU
y y
=
Die Prognose ist signifikant besser als die naive Prognose, wenn U < 1 (3.1) Konzentrationsmae
n Merkmalstrger mit den Mengen Mi und den Anteilen an der Merkmalsumme mi. Anteile an den Merkmalstrgern fi. Die k anteilsschwchsten Merkmalstrger.
LORENZ-Kurve aus ( )k k
k ki=1 i=1
| i ix y h m
=
Gini-Koeffizient KGini = 1 2 Aunten mit ( )n
unten i 1 i ii=1
1
2A y y h= +
(3.2) speziell fr i1
hn
=
LORENZ-Kurve aus ( )k
k ki=1
| ik
x y mn
=
GINI-Koeffizient KGini = 1 2 Aunten mit n
unten ii=1
1 1
2A y
n
=
HERFINDAHL-Koeffizient n
2Herfindal i
i=1
K m= (3.3) Hufigkeitsverteilungen Stichprobenumfang n, Anzahl der Klassen k, ersatzweise Klassenmitten xi* statt xi.
Relative Hufigkeiten iin
hn
=
Hufigkeitsdichten iii
hf
x=
Empirische Verteilungsfunktion ( )i i i1
( )k
i
i
F F x h h X x=
= = = Zentralwert (Median) xz = xi mit Fi = 0,5
Mittelwert 1 1
1 n ki i i i
i i
x x n x hn = =
= =
Varianz 2 2 2
1
1
1
k
i i
i
s x n n xn =
=
fr n 200. 2 21
k
i i
i
s x h x2
=
= fr n > 200.
Variationskoeffizient s
vx
=
Standardabweichung 2s s= +
Formeln zur Statistik Statistik - Neff
(4.1) Wahrscheinlichkeit
Statistische Konvergenz ( )lim lim( ) 0 1nn n
W h p
= = (Treffer-Wahrschlk. p)
Allgemeiner Additionssatz W(A B) = W(A) + W(B) W(AB) Allgemeiner Multiplikationssatz W(AB) = W(A) W(B|A) Unabhngige Ereignisse W(AB) = W(A) W(B) Verteilungsfunktion F W(a < X b) = F(b