Click here to load reader

Formeln zur Statistik Statistik - · PDF fileFormeln zur Statistik Statistik - Neff (2.5) Exponentielles Glätten n Beobachtungswerte, Glättungskonstante α Prognosewerte, direkt

  • View
    222

  • Download
    2

Embed Size (px)

Text of Formeln zur Statistik Statistik - · PDF fileFormeln zur Statistik Statistik - Neff (2.5)...

  • Formeln zur Statistik Statistik - Neff

    (1.1) Mittelwert, Varianz bei Einzelwerten (1.2) Freiheitsgrade (1.3) Abweichungsquadrate (1.4) Lineare Einfach-Regression (1.5) Multiple lineare Regression, DW-Tabelle (1.6) A'-Regression (1.7) VT Regression (2.1) Linearer Trend und Saisonschwankungen (2.2) Logistischer Trend (2.3) Gleitende Mittelwerte (2.4) Wachstumsfaktoren (2.5) Exponentielles Gltten (3.1) Konzentrationsmae (3.3) Hufigkeitsverteilung (4.1) Wahrscheinlichkeit (4.2) Chi2-Unabhngigkeitstest (4.3) Diskrete Zufallsvariable (4.4) Stichprobenmittel (4.5) Stetige Zufallsvariable (5.1) Binomialverteilung (5.2) Hypergeometrische Verteilung (5.3) POISSON-Verteilung (5.4) Normalverteilung (5.5) Standard-Normalverteilung (5.6) Approximationsbedingungen (5.7) Anpassung und Korrekturfaktoren (5.8) Chi2 - Anpassungstest (6.1) Konfidenzintervall (6.2) Hypothesentest (6.3) unbekannt (6.4) Stichprobe ohne Zurcklegen Tabellen

    (7.1) Binomialverteilung (7.2) POISSON-Verteilung (7.3) Tabelle FISHER-Prfma xF (7.4) Tabelle Chi2-Prfma 2 (7.5a) Tabelle STUDENT-Prfma F(t) (7.5b)Tabelle STUDENT-Prfma D(t) (7.6) Standardnormalverteilung FSN

  • Formeln zur Statistik Statistik - Neff

    (1.1) Mazahlen bei Einzelwerten Mittelwert bei N bzw. n Einzelwerten xi

    In der Grundgesamtheit 1

    1 Ni

    i

    xN =

    = in der Stichprobe: 1

    1 ni

    i

    x xn =

    =

    Abweichungsquadrate ( ) ( )22 20

    1nx i i i

    i

    A x x x xn=

    = = Varianz bei N bzw. n Einzelwerten xi

    der Grundgesamtheit: ( )2 2 21 1

    1 1N Ni i n

    i i

    x x N N

    22

    = =

    = = =

    der Stichprobe: ( )22 2 2 11 1

    1 1

    1 1

    n n

    i i n

    i i

    s x x x nxn n

    2

    = =

    = = =

    Standardabweichung in der Grundgesamtheit: 2 = in der Stichprobe: 2s s= (1.2) Freiheitsgrade "n" Freiheitsgrade (df, degrees of freedom) ist die Anzahl der frei whlbaren, unabhngigen Einzelwerte, die in die statistischen Berechnungen einbezogen werden knnen. a) bei der Stichprobenvarianz n-1 b) beim FISHER-Prfma = n-p-1 p Anzahl der Einflussgren c) beim STUDENT-t-Prfma in der multiplen Regression: = n-p-1 im Hypothesentest: = n -1 d) beim Chi2-Prfma 2 im Unabhngigkeitstest = (k - 1) (l - 1) im Anpassungstest = k p 1 (1.3) Abweichungsquadrate bei Regressionsanalysen SS "Sum of Squares", Summe der Abweichungsquadrate A MS Mittlere Summe der Abweichungsquadrate, Varianz 2, Mean Sum of Squares p Anzahl der Einflussfaktoren

    2 2Error1 1

    ( )n n

    i i i

    i i

    A y y e= =

    = = = SSResiduen ( )2Res

    Residuen

    - -1 1i iy ySS

    MSn p n p

    = =

    2

    2 2Gesamt Gesamt Gesamt 1

    1

    ( )( )

    1 1

    ni iGesamt

    i i n

    i

    y ySSA y y SS MS

    n n

    =

    = = = = =

    2

    Regression2erklrt Regression erklrt

    1

    ( )( )

    ni i

    i i

    i

    SS y yA y y SS MS

    p p=

    = = = =

    Bestimmtheitsma ( ) ( ) ( )

    ( )

    2 2 2

    22 1 1 1

    22

    1

    :1 1

    n n n

    i i i

    erklrt i i i

    n

    gesamti

    i

    y y y y y ys

    rs n n

    y y

    = = =

    =

    = = =

    Adjustiertes Bestimmtheitsma 2 Residuen

    Gesamt

    1adjustMS

    rMS

    =

    FISHER-Prfgre xFempir = erklrt

    Residuen

    MS

    MS

  • Formeln zur Statistik Statistik - Neff

    (1.4) Lineare Einfach-Regression = m x + b

    Summe der Abweichungsquadrate 2 2Error1 1

    ( )n n

    i i i

    i i

    A y y e= =

    = =

    Regressionskoeffizienten ( )22

    i i i i

    i i

    n x y x ym

    n x x

    =

    1

    i i

    mb y x

    n n=

    Korrelationskoeffizient

    ( )( ) ( )( )2 22 2i i i i

    i i i i

    n x y x yr

    n x x n y y

    =

    Bestimmtheitsma r2

    FISHER-Prfgre xFempir ( )2

    erklrt2

    Residuen

    21

    MSrn

    r MS= =

    Die Nullhypothese wird verworfen, wenn xFempirisch > xFc, | 1 | (1.5) Multiple lineare Regression p Einflussfaktoren, = n-p-1 Freiheitsgrade Die Nullhypothese wird verworfen, wenn xFempirisch > xFc, | p | Signifikanter Beitrag des Einflussfaktors xk , wenn | tempirisch | > tc, | Tabelle 7.5a Signifikante Interkorrelation zwischen den Einflussfaktoren xj, xk , wenn rjk > 0,5.

    Signifikante Autokorrelation, wenn fr die DURBIN-WATSON-Prfgre gilt: DW1 [DWunten ; DWoben]

    ( )21

    21

    2

    1

    n

    i i

    i

    n

    i

    i

    e e

    DW

    e

    =

    =

    =

    ( )2

    1

    2

    1

    n

    i i k

    i kk n

    i

    i

    e e

    DW

    e

    = +

    =

    =

    (1.6) A'-Regression = a (x) + b Ansatzfunktionen (x)

    Summe der Abweichungsquadrate 2

    1

    ( ( ) )n

    i

    i

    A y a x b=

    =

    Normalgleichungen ( )2( ) ( ) ( )

    ( )

    i i i i

    i i

    a x b x y x

    a x nb y

    + =

    + =

    Regressionskoeffizienten ( ) ( )22

    ( ) ( )

    ( ) ( )

    i i i i

    i i

    n y x y xa

    n x x

    =

    1

    ( )i ia

    b y xn n

    =

  • Formeln zur Statistik Statistik - Neff

    (1.7) VTRegression Lineare Regressionsmodelle (x) = a0 + a11(x) + a2 2(x) + + ak k(x) mit den Ansatzfunktionen i (x)

    VANDERMONDE-Matrix

    0 0 1 0 0

    0 1 1 1 1

    0 0

    1 ( ) ( ) ( )

    1 ( ) ( ) ( )

    1 ( ) ( ) ( )

    k

    k

    m m k m

    x x x

    x x x

    x x x

    =

    V

    VANDERMONDE-Gleichung Va = y V TV a = V T y Interpolationswert fr x =z (z) = a0 + a11(z) + a2 2(z) + + ak k(z) (2.1) Linearer Trend und Saisonschwankungen Komponentenmodell yi = i + si + iri

    Saisonschwankungen si = yi i 1

    1 kj ij

    i

    s sk =

    =

    Irregulre Restwerte iri = si js = yi js

    Prognosewerte p = (xn+z) + ijs

    (2.2) Logistischer Trend

    Ansatzfunktion 1 mx b

    Sy

    e +=

    + *transformiert ln 1

    Sy

    y

    =

    Regressionskoeffizienten ( )

    * *i i *

    i i22i i

    1i in x y x y mm b y x

    n nn x x

    = =

    (2.3) Gleitende Mittelwerte k vorausgehende und k nachfolgende Zeitreihenwerte Ungerade bzw. gerade Ordnung des gleitenden Mittelwerts

    ( )

    ( )m=i+ k-1m=i+k

    i m i i-k m i+km=i-k m=i- k-1

    1 1 1 1

    2 1 2 2 2y y y y y y

    k k

    = = + + +

    (2.4) Wachstumsfaktoren

    Indizes 0,0

    kk

    BI

    B= (Berichtsperiode k, Basisperiode 0)

    Wachstumsfaktoren 1

    ii

    i

    yx

    y = Zuwachsrate ri = xi 1

    Mittlerer Wachstumsfaktor 0

    ( ) nniy

    GM xy

    = Mittlere Zuwachsrate 0

    nn

    y

    y-1

    (Es liegen n+1 y-Werte y0, y1, , yn vor)

  • Formeln zur Statistik Statistik - Neff

    (2.5) Exponentielles Gltten n Beobachtungswerte, Glttungskonstante

    Prognosewerte, direkt n 1

    n 1 n-i n-i0 i 0

    (1 ) (1 )i i

    i

    y y y

    += =

    = = Geglttete Werte, rekursiv i 1 i+1 i (1 )y y y+ = + Prognosen fr i = n

    THEIL'scher Ungleichheitskoeffizient ( )

    ( )

    2

    i i

    2

    i i 1

    y yU

    y y

    =

    Die Prognose ist signifikant besser als die naive Prognose, wenn U < 1 (3.1) Konzentrationsmae

    n Merkmalstrger mit den Mengen Mi und den Anteilen an der Merkmalsumme mi. Anteile an den Merkmalstrgern fi. Die k anteilsschwchsten Merkmalstrger.

    LORENZ-Kurve aus ( )k k

    k ki=1 i=1

    | i ix y h m

    =

    Gini-Koeffizient KGini = 1 2 Aunten mit ( )n

    unten i 1 i ii=1

    1

    2A y y h= +

    (3.2) speziell fr i1

    hn

    =

    LORENZ-Kurve aus ( )k

    k ki=1

    | ik

    x y mn

    =

    GINI-Koeffizient KGini = 1 2 Aunten mit n

    unten ii=1

    1 1

    2A y

    n

    =

    HERFINDAHL-Koeffizient n

    2Herfindal i

    i=1

    K m= (3.3) Hufigkeitsverteilungen Stichprobenumfang n, Anzahl der Klassen k, ersatzweise Klassenmitten xi* statt xi.

    Relative Hufigkeiten iin

    hn

    =

    Hufigkeitsdichten iii

    hf

    x=

    Empirische Verteilungsfunktion ( )i i i1

    ( )k

    i

    i

    F F x h h X x=

    = = = Zentralwert (Median) xz = xi mit Fi = 0,5

    Mittelwert 1 1

    1 n ki i i i

    i i

    x x n x hn = =

    = =

    Varianz 2 2 2

    1

    1

    1

    k

    i i

    i

    s x n n xn =

    =

    fr n 200. 2 21

    k

    i i

    i

    s x h x2

    =

    = fr n > 200.

    Variationskoeffizient s

    vx

    =

    Standardabweichung 2s s= +

  • Formeln zur Statistik Statistik - Neff

    (4.1) Wahrscheinlichkeit

    Statistische Konvergenz ( )lim lim( ) 0 1nn n

    W h p

    = = (Treffer-Wahrschlk. p)

    Allgemeiner Additionssatz W(A B) = W(A) + W(B) W(AB) Allgemeiner Multiplikationssatz W(AB) = W(A) W(B|A) Unabhngige Ereignisse W(AB) = W(A) W(B) Verteilungsfunktion F W(a < X b) = F(b