Formeln zur Statistik Statistik - Neff

(1.1) Mittelwert, Varianz bei Einzelwerten (1.2) Freiheitsgrade (1.3) Abweichungsquadrate (1.4) Lineare Einfach-Regression (1.5) Multiple lineare Regression, DW-Tabelle (1.6) A'-Regression (1.7) VT – Regression (2.1) Linearer Trend und Saisonschwankungen (2.2) Logistischer Trend (2.3) Gleitende Mittelwerte (2.4) Wachstumsfaktoren (2.5) Exponentielles Glätten (3.1) Konzentrationsmaße (3.3) Häufigkeitsverteilung (4.1) Wahrscheinlichkeit (4.2) Chi2-Unabhängigkeitstest (4.3) Diskrete Zufallsvariable (4.4) Stichprobenmittel (4.5) Stetige Zufallsvariable (5.1) Binomialverteilung (5.2) Hypergeometrische Verteilung (5.3) POISSON-Verteilung (5.4) Normalverteilung (5.5) Standard-Normalverteilung (5.6) Approximationsbedingungen (5.7) Anpassung und Korrekturfaktoren (5.8) Chi2 - Anpassungstest (6.1) Konfidenzintervall (6.2) Hypothesentest (6.3) σ unbekannt (6.4) Stichprobe ohne Zurücklegen Tabellen

(7.1) Binomialverteilung (7.2) POISSON-Verteilung (7.3) Tabelle FISHER-Prüfmaß xF (7.4) Tabelle Chi2-Prüfmaß χ2 (7.5a) Tabelle STUDENT-Prüfmaß F(t) (7.5b)Tabelle STUDENT-Prüfmaß D(t) (7.6) Standardnormalverteilung FSN

(1.1) Maßzahlen bei Einzelwerten Mittelwert bei N bzw. n Einzelwerten xi

In der Grundgesamtheit 1

µ xN =

= ∑ in der Stichprobe: 1

x xn =

Abweichungsquadrate ( ) ( )22 2

x i i i

A x x x xn=

= − = −∑ ∑ ∑

Varianz bei N bzw. n Einzelwerten xi

der Grundgesamtheit: ( )2 2 2

1 1N N

x µ x µN N

σ = − = − = σ∑ ∑

der Stichprobe: ( )22 2 21

s x x x nxn n

−= =

= − = − = σ − −

∑ ∑

Standardabweichung in der Grundgesamtheit: 2σ = σ in der Stichprobe: 2s s= (1.2) Freiheitsgrade ν "nü" Freiheitsgrade ν (df, degrees of freedom) ist die Anzahl der frei wählbaren, unabhängigen Einzelwerte, die in die statistischen Berechnungen einbezogen werden können. a) bei der Stichprobenvarianz n-1 b) beim FISHER-Prüfmaß ν = n-p-1 p Anzahl der Einflussgrößen c) beim STUDENT-t-Prüfmaß in der multiplen Regression: ν = n-p-1 im Hypothesentest: ν = n -1 d) beim Chi2-Prüfmaß χ2 im Unabhängigkeitstest ν = (k - 1) · (l - 1) im Anpassungstest ν = k – p – 1 (1.3) Abweichungsquadrate bei Regressionsanalysen SS "Sum of Squares", Summe der Abweichungsquadrate A MS Mittlere Summe der Abweichungsquadrate, Varianz σ2, Mean Sum of Squares p Anzahl der Einflussfaktoren

2 2Error

ˆ( )n n

A y y e= =

= − =∑ ∑ = SSResiduen ( )2

ResResiduen

- -1 1i iy ySS

MSn p n p

−= =

− −∑

2 2Gesamt Gesamt Gesamt 1

( )( )

ni iGesamt

y ySSA y y SS MS

n n−

−= − = = = =

− −∑∑ σ

Regression2erklärt Regression erklärt

ˆ( )ˆ( )

SS y yA y y SS MS

−= − = = = ∑∑

Bestimmtheitsmaß ( ) ( ) ( )

22 1 1 1

erklärt i i i

gesamti

y y y y y ys

rs n n

− − −= = =

− − −

∑ ∑ ∑

Adjustiertes Bestimmtheitsmaß 2 Residuen

Gesamt

1adjust

MS= −

FISHER-Prüfgröße xFempir = erklärt

Residuen

(1.4) Lineare Einfach-Regression ŷ = m x + b

Summe der Abweichungsquadrate 2 2Error

ˆ( )n n

A y y e= =

= − =∑ ∑

Regressionskoeffizienten ( )22

i i i i

n x y x ym

− ⋅=

∑ ∑ ∑∑ ∑

mb y x

n n= −∑ ∑

Korrelationskoeffizient

( )( ) ( )( )2 22 2

i i i i

n x y x yr

n x x n y y

− ⋅= ±

− ⋅ −

∑ ∑ ∑∑ ∑ ∑ ∑

Bestimmtheitsmaß r2

FISHER-Prüfgröße xFempir ( )2

erklärt2

Residuen

r MS= ⋅ − =

Die Nullhypothese wird verworfen, wenn xFempirisch > xFc, α | 1 | ν (1.5) Multiple lineare Regression p Einflussfaktoren, ν = n-p-1 Freiheitsgrade Die Nullhypothese wird verworfen, wenn xFempirisch > xFc, α | p | ν Signifikanter Beitrag des Einflussfaktors xk , wenn | tempirisch | > tc, α | ν Tabelle 7.5a Signifikante Interkorrelation zwischen den Einflussfaktoren xj, xk , wenn rjk > 0,5.

Signifikante Autokorrelation, wenn für die DURBIN-WATSON-Prüfgröße gilt: DW1 ∉ [DWunten ; DWoben]

i kk n

−= +

(1.6) A'-Regression ŷ = a ϕ(x) + b Ansatzfunktionen ϕ(x)

Summe der Abweichungsquadrate 2

( ( ) )n

A y a x b=

= − ϕ −∑

Normalgleichungen ( )2

( ) ( ) ( )

i i i i

a x b x y x

a x nb y

ϕ + ϕ = ϕ

ϕ + =

∑ ∑ ∑∑ ∑

Regressionskoeffizienten ( ) ( )22

( ) ( )

i i i i

n y x y xa

⋅ − ⋅=

∑ ∑ ∑∑ ∑

( )i i

ab y x

n nϕ= −∑ ∑

(1.7) VT–Regression Lineare Regressionsmodelle ŷ(x) = a0 + a1ϕ1(x) + a2 ϕ2(x) + … + ak ϕk(x) mit den Ansatzfunktionen ϕ i (x)

VANDERMONDE-Matrix

0 0 1 0 0

0 1 1 1 1

1 ( ) ( ) ( )

m m k m

ϕ ϕ ϕ ϕ ϕ ϕ = ϕ ϕ ϕ

VANDERMONDE-Gleichung V·a = y ⇒⇒⇒⇒ V

TV a = V

T y Interpolationswert für x =z ŷ(z) = a0 + a1ϕ1(z) + a2 ϕ2(z) + … + ak ϕk(z) (2.1) Linearer Trend und Saisonschwankungen Komponentenmodell yi = ŷi + si + iri

Saisonschwankungen si = yi – ŷi 1

s sk =

Irreguläre Restwerte iri = si – js = yi – ŷî − js

Prognosewerte p̂ = ŷ(xn+z) + ijs

(2.2) Logistischer Trend

Ansatzfunktion ˆ1 mx b

transformiert ln 1S

Regressionskoeffizienten ( )

* *i i *

i i22i i

1i in x y x y mm b y x

n nn x x

⋅ −= = −

∑ ∑ ∑ ∑ ∑∑ ∑

(2.3) Gleitende Mittelwerte k vorausgehende und k nachfolgende Zeitreihenwerte Ungerade bzw. gerade Ordnung des gleitenden Mittelwerts

( )m=i+ k-1m=i+k

i m i i-k m i+km=i-k m=i- k-1

1 1 1 1

2 1 2 2 2y y y y y y

= = + + +

∑ ∑ɶ ɶ

(2.4) Wachstumsfaktoren

Indizes 0,

B= (Berichtsperiode k, Basisperiode 0)

Wachstumsfaktoren 1

= Zuwachsrate ri = xi – 1

Mittlerer Wachstumsfaktor 0

( ) nn

y= Mittlere Zuwachsrate

(Es liegen n+1 y-Werte y0, y1, …, yn vor)

(2.5) Exponentielles Glätten n Beobachtungswerte, Glättungskonstante α

Prognosewerte, direkt

n 1 n-i n-i0 i 0

ˆ (1 ) (1 )i i

y y y∞ −

= − ⋅ = − ⋅∑ ∑α α α α

Geglättete Werte, rekursiv i 1 i+1 iˆ ˆ(1 )y y y+ = + − ⋅α α Prognosen für i = n

THEIL'scher Ungleichheitskoeffizient ( )

ˆy yU

y y −

∑∑

Die Prognose ist signifikant besser als die naive Prognose, wenn U < 1 (3.1) Konzentrationsmaße

n Merkmalsträger mit den Mengen Mi und den Anteilen an der Merkmalsumme mi. Anteile an den Merkmalsträgern fi. Die k anteilsschwächsten Merkmalsträger.

LORENZ-Kurve aus ( )k k

k ki=1 i=1

| i ix y h m

= ∑ ∑

Gini-Koeffizient KGini = 1 – 2 Aunten mit ( )n

unten i 1 i ii=1

2A y y h−= + ⋅∑

(3.2) speziell für i

LORENZ-Kurve aus ( )k

k ki=1

kx y m

GINI-Koeffizient KGini = 1 – 2 Aunten mit n

unten ii=1

HERFINDAHL-Koeffizient n

2Herfindal i

K m= ∑

(3.3) Häufigkeitsverteilungen Stichprobenumfang n, Anzahl der Klassen k, ersatzweise Klassenmitten xi* statt xi.

Relative Häufigkeiten ii

Häufigkeitsdichten ii

Empirische Verteilungsfunktion ( )i i i1

F F x h h X x=

= = = ≤∑

Zentralwert (Median) xz = xi mit Fi = 0,5

Mittelwert 1 1

i i i i

x x n x hn = =

= ⋅ = ⋅∑ ∑

Varianz 2 2 2

s x n n xn =

= − −

∑ für n ≤ 200. 2 2

s x h x2

= ⋅ −∑ für n > 200.

Variationskoeffizient s

Standardabweichung 2s s= +

(4.1) Wahrscheinlichkeit

Statistische Konvergenz ( )lim lim( ) 0 1nn n

W h p→∞ →∞

− = = (Treffer-Wahrschlk. p)

Allgemeiner Additionssatz W(A ∪B) = W(A) + W(B) − W(A∩B) Allgemeiner Multiplikationssatz W(A∩B) = W(A) · W(B|A) Unabhängige Ereignisse W(A∩B) = W(A) · W(B) Verteilungsfunktion F W(a < X ≤ b) = F(b) – F(a) (4.2) Chi2-Unabhängigkeitstest k Zeilen (Anzahl der Kategorien von X), l Spalten (Anzahl der Kategorien von Y). Häufigkeiten nij für den i-ten Wert des Merkmals X und den j-ten Wert des Merkmals Y. Randhäufigkeiten n, ni•, n•j.

Berechnete Häufigkeiten i jij

• •⋅=

Voraussetzung für Test uij ≥ 5

Normierte Abweichungsquadrate ( )2

Chi2-Prüfmaß ( )

ijij ij2 2

iji ji 1 j 1 i 1 j 1ij

k l k l

empirisch empirisch

n u nchi q

• •

• •= = = =

− − = χ = = =∑ ∑∑ ∑∑

Freiheitsgrade für χ2crit | ν | α ν = (k - 1) · (l - 1)

Unabhängigkeitshypothese wird verworfen, wenn 2 2.empirisch critχ > χ .

(4.3) Diskrete Zufallsvariable

Erwartungswert i i1

µ = ⋅∑

Erwartete Varianz 2 2 2i i

σ = ⋅ − µ∑

Erwartete Standardabweichung 2σ = + σ (4.4) Stichprobenmittel

1 2 ... nX X XX

+ + += kommt der Normalverteilung mit zunehmendem n immer näher.

Die Xi müssen nicht selbst normalverteilt sein. Die Xi müssen nicht völlig voneinander unabhängig sein.

Erwartungswerte ( ) ( )µ X µ X=

Erwartete Varianzen 1

( ) ( )X Xn

σ = σ X

(4.5) Stetige Zufallsvariable

Dichtefunktion f mit f(x) ≥ 0 und ( ) 1 100%f x dx

−∞

= =∫

Verteilungsfunktion F 2

2 2( ) ( ) ( )x

F x f x dx W X x−∞

= = ≤∫

2lim ( ) 1 100%x

F x→∞

Wahrscheinlichkeit 2( ) ( ) ( ) ( ) [ ( )]b

W a X b f x dx F b F a F x≤ ≤ = = − =∫

Erwartungswert ( )µ x f x dx

−∞

= ⋅∫

Erwartete Varianz ( )22 2 2( ) ( )x f x dx µ x µ f x dx

+∞ +∞

−∞ −∞

σ = ⋅ − = − ⋅∫ ∫

Erwartete Standardabweichung 2σ = + σ (5.1) Binomialverteilung Treffer-Wahrscheinlichkeit p, q = 1 – p, Anzahl der Treffer x.

Binomialkoeffizienten ( 1) ( 2) ... ( 1) !

! !( )!

n n n n n x n

x x x n x

⋅ − ⋅ − ⋅ ⋅ − += = −

Wahrscheinlichkeitsfunktion W(X = x) = fn,p(x) = (1 )x n x x n xn n

p q p px x

− − = −

Verteilungsfunktion Bin | n | p ,0 0

( ) ( )k k

nF k f x p q

∑ ∑ Tabelle 7.1

Erwartungswert µ = n p Erwartete Varianz σ2 = n p q

Erwartete Standardabweichung 2σ = + σ (5.2) Hypergeometrische Verteilung N Anzahl der Elemente in der Grundgesamtheit, n Stichprobenumfang M Anzahl der Treffer in der Grundgesamtheit M = N p

Treffer-Wahrscheinlichkeit . 1 1M M

p q pN N

= = − = −

Wahrscheinlichkeitsfunktion | , ,( ) ( )Hyp n N M

x n xW X x f x

− ⋅ − = = =

Erwartungswert µ = n p.

Erwartete Varianz σ2 = n p q 1

−⋅

Erwartete Standardabweichung Hyp Binσ σ1 1

N n N nn p q

− −= ⋅ ⋅ ⋅ = ⋅

− −

(5.3) POISSON-Verteilung

Erwartungswert und 1 1µ µ

µ n p p q pn n

= ⋅ ⇒ = = − = −

Wahrscheinlichkeitsfunktion Poi| µ ( )! !

µ µf x e

−= ⋅ =

Verteilungsfunktion Poi | µ0

µF k e

= ⋅∑ Tabelle 7.2

Erwartete Varianz σ2 = µ (5.4) Normalverteilung

2 σNorm|µ,σ

2 σ2 Norm|µ,σ 2

1Dichtefunktion ( )

1Verteilungsfunktion ( ) ( )

W X x F x e dx

− −

−∞

≤ = =π ∫

(5.5) Standard-Normalverteilung

Dichtefunktion fSN(z) = 2 21 1

e e− −

Verteilungsfunktion 2 21

( ) ( )2

SNW Z z F z e d z−

−∞

≤ = =π ∫ Tabelle 7.6

Erwartungswert µ = 0 Standardabweichung σ = 1

Standard-Normalvariable bzw. x µ

z x µ z−

= = + ⋅σσ

Standardnormalvariable z mit Stetigkeitskorrektur 0,5

+ −=

(5.6) Approximationsbedingungen Übergang von der Hypergeometrischen V. zur Binomial-V., wenn n/N ≤ 0,05 Binomial-V. zur POISSON-V., wenn n/p ≥ 1500

Hypergeometrischen V. zur POISSON-V., wenn n/N ≤ 0,05 und n/p ≥ 1500 Binomial-V zur Normalverteilung, wenn σ2 = n p q > 9 Hypergeometrischen V. zur Normalverteilung, wenn n/N ≤ 0,05 und σ2 = n p q > 9 POISSON-V. zur Normalverteilung, wenn µ = σ2 > 9 STUDENT-t-V. zur Normalverteilung, wenn n > 30, bei normalverteilter Grundgesamtheit wenn n > 50, bei unbekannter Verteilung der Grundgesamtheit

(5.7) Anpassung und Korrekturfaktoren µ, σ aus Grundgesamtheit, x , s aus Stichprobe

Diskrete Zufallsvariable X 0,5

+ −= (Stetigkeitskorrektur)

Stichprobenmittel X x

x µz n

−= ⇒ =

n/N > 0,05: σkorrigiert = σ·1

−−

σ unbekannt, n < 30 bzw. n < 50 bzw. s s

x µ x µt t n

− −= =

(5.8) Chi2 - Anpassungstest k Klassen [xi

unten ; xioben], i = 1, 2, …, k. Signifikanzniveau α.

p ist die Anzahl der Parameter ( x , s) , die aus der Stichprobe ermittelt werden.

Standardnormalvariablen obeni

Wahrscheinlichkeiten W(–∞ < X ≤ xioben) = FSN(zi)

Wahrscheinlichkeiten wi = FSN(zi) – FSN(zi – 1) mit FSN(z0) = 0 Theoretische Häufigkeiten ui = n · wi.

Testgröße ( )2

empirisch

−χ = ∑

Prüfmaß χ2crit | 1 – α | ν Tabelle 7.5

Freiheitsgrade ν = k – p – 1

Entscheidung Verteilungshypothese bestätigt, wenn 2 2empirisch crit.χ ≤ χ

(6.1) Konfidenzintervall

Intervall µ ∈ c cz ; zx xn n

σ σ − +

Intervall-Länge oben unten 2 2 cµ µ zn

σ− = ε =

Abweichung x µε = −

Stichprobenumfang

σ= −

Kritischer Wert c

x µz n

Signifikanzniveau D(zc) = 1 – α

(6.2) Hypothesentest

Intervall [ ]X Xµ σ , µ σx z z∈ − + Nullhypothese H0 H0 wird verworfen, wenn zempirisch > zkritisch

Empirischer Wert empirisch σ

x µz n

Signifikanzniveau D(zc) = 1 – α (6.3) σ unbekannt, n < 30 bzw. n < 50

Kritischer Wert empirisch

x µt n

Signifikanzniveau Dν (tc) = 1 – α mit ν = n – 1.

(6.4) Stichprobe ohne Zurücklegen, n/N > 0,05

Standardweichung des Stichprobenmittels 1x

σ −σ = ⋅

Notwendiger Stichprobenumfang 2

1 ( 1)σc

≥ ε

(7.1 a)

(7.1 b)

(7.5a)

(7.5b)

Formeln zur Statistik Statistik - Neff · Formeln zur Statistik Statistik - Neff (2.5)...

Documents

MODEL UPDATING MIT OPTISLANG. · 2016. 2. 20. · Formeln von Chamis auf Basis der Materialdaten der Grundwerkstoffe berechnet werden. Abb. 10: Formeln von Chamis für transversal

Statistik Inferensial

Materi Statistik Bab 1 : Data dan Statistik

Neff Wed5c

STATISTIK NON PARAMETRIK (1) - debrina.lecture.ub.ac.id · Metode Statistik : Parametrik vs Non Parametrik Uji Statistik Non parametrik ! Cabang ilmu statistik yang mempelajari prosedur-prosedur

Univariate Statistik

Uji Statistik

Modul Statistik

STATISTIK PERKEBUNAN INDONESIA - ditjenbun.pertanian.go.idditjenbun.pertanian.go.id/tinymcpuk/gambar/file/statistik/2016/TEH 2014-2016.pdf · Statistik Perkebunan Indonesia Komoditas

Community Statistik

STATISTIK PELANCONG

Sifir Statistik

FMK2015: FileMaker Grundlagen Formeln by Longin Ziegler

LAMPIRAN Lampiran 1 STATISTIK DESKRIPTIF DAN STATISTIK ...repository.unika.ac.id/16576/8/14.G1.0224 OLIVIA MEIRINA MARSHIELENA... · STATISTIK DESKRIPTIF DAN STATISTIK FREKUENSI

statistik sederhana

Nonparametrik Statistik

Statistik gia Elektrolìgouc MhqanikoÔc - users.auth.grusers.auth.gr/~dkugiu/Teach/ElectricEngineer/Lecture1NoPause.pdfPerigraf Statistik¸n dedomènwn Perigrafik Mètra Statistik¸n

WILLIAM DUWAYNE NEFF 1912–2002nasonline.org/.../memoir-pdfs/neff-william-duwayne.pdf · Dewey Neff was born on October 27, 1912, in Lomax, Illinois, to Lyman Neff and Emma Jacobson

STATISTIK KESHTN- Slide I - Pengantar Statistik

Statistik Deskriptif