Upload
desma
View
66
Download
1
Embed Size (px)
DESCRIPTION
Univariate Statistik. Graphische Darstellung. Kreisdiagramm Stabdiagramm (Säulen-, Balkendiagramm) Histogramm. Häufigkeit des Geschlechts für n =55 Probanden. Kreisdiagramm. Häufigkeit der Geschwisterkinder bei n =55 Probanden. Stabdiagramm. Histogramm. - PowerPoint PPT Presentation
1M. Kresken
Univariate Statistik
2M. Kresken
Graphische Darstellung
• Kreisdiagramm• Stabdiagramm
(Säulen-, Balkendiagramm)• Histogramm
3M. Kresken
Häufigkeit des Geschlechtsfür n=55 Probanden
SEX absolut relativ prozentualAufteilung derWinkelsumme
männlich 28 0,51 50,9% 183weiblich 27 0,49 49,1% 177gesamt 55 1,00 100,0% 360
4M. Kresken
Kreisdiagramm
Geschlecht
50,9%49,1%männlich
weiblich
5M. Kresken
Häufigkeit der Geschwisterkinderbei n=55 Probanden
GZ absolut relativ
0 10 0,181 18 0,332 12 0,223 4 0,074 4 0,075 3 0,056 1 0,027 0 0,008 1 0,02
k. A. 2 0,04gesamt 55 1,00
6M. Kresken
StabdiagrammGeschwisterzahl
0
2
4
6
8
10
12
14
16
18
20
0 1 2 3 4 5 6 7 8 k. A.
ab
solu
te H
äü
figke
it
7M. Kresken
Histogramm
• Zur Darstellung eines stetigen (auf einer metrischen Skala gemessenen) Merkmals
• Dazu wird die Messskala in Bereiche, die sogenannten Klassen, aufgeteilt.
• Klassen müssen den gesamten Wertevorrat überdecken (Vollständigkeit).
• Klassen dürfen sich nicht überschneiden (Disjunktheit).• Insbesondere ist festzulegen, zu welcher Klasse die
einzelnen Klassengrenzen gehören.
8M. Kresken
Histogramm
• Wird die untere Klasse zugeordnet linksgeschlossen Darstellung: [a1, a2) zur Klasse gehören alle Werte ab a1 bis unterhalb a2
• Wird die obere Klasse zugeordnet rechtsgeschlossen Darstellung: (a1, a2] zur Klasse gehören alle Werte oberhalb von a1 bis einschließlich a2
9M. Kresken
Häufigkeiten des systolischen Blutdrucks der n=55 Probanden
Klasseneinteilung für den sysolischen Blutdruck [mmHg]
absolut relativ
(90, 100] 3 0,05(100, 110] 6 0,11(110, 120] 13 0,24(120, 130] 14 0,25(130, 140] 10 0,18(140, 150] 6 0,11(150, 160] 0 0,00(160, 170] 3 0,05
gesamt 55 1,00
10M. Kresken
Histogramm
Systolischer Blutdruck [mmHg]
0,05
0,11
0,240,25
0,18
0,11
0,00
0,05
0,00
0,05
0,10
0,15
0,20
0,25
0,30
(90,100]
(100,110]
(110,120]
(120,130]
(130,140]
(140,150]
(150,160]
(160,170]
rela
tive
Häu
figke
it
11M. Kresken
Empirische Verteilungsfunktion
• Die Klassenbildung bedeutet eine Zusammenfassung der Messergebnisse und damit eine Reduzierung der Information über den konkreten Daten.
• Eine graphische Veranschaulichung der Orginal-Messergebnisse eines quantitativen Merkmals ist die empirische Verteilungsfunktion.
• Dazu werden zu den Messwerten, die auf der Abszisse angegeben sind, die zugehörigen Summenhäufigkeiten auf der Ordinate angetragen.
• Die entstehenden Punkte werden durch eine Treppenfunktion miteinander verbunden.
12M. Kresken
Empirische Verteilungsfunktion
Blutzuckerkonzentration
0,00,10,20,30,40,50,60,70,80,91,0
50 60 70 80 90 100 110 120 130 140 150
Blutzuckerkonzentration (mg/100ml)
kum
ulie
rte
rela
tive
Häu
figke
it
13M. Kresken
Kenngrößen
14M. Kresken
Kenngrößen
• Ziel ist es, typische Eigenschaften einer Messreihe mit wenigen Zahlen zu beschreiben.
• Dadurch wird bewusst eine radikale Reduktion der in den konkreten Daten enthaltenen Information angestrebt.
• Zur Beschreibung der Verteilung von Messwerten sollte immer ein Lagemaß und ein Streuungsmaß angegeben werden.
15M. Kresken
Lagemaße
Lagemaße• Mittelwert• Quantile• Median• Modalwert
Streuungsmaße• Spannweite• Standardabweichung/
Varianz• Quartilsabstand• Variationskoeffizient
Box-Whisker Plot
16M. Kresken
Lagemaße (Lageparameter)
• Beschreiben die zentrale Tendenz der Daten
17M. Kresken
MittelwertMittelwerte
18M. Kresken
Mittelwert
x = _ x1 + x2 + ... + xn
n = 1n
n
j=1
xj
• Beschreibt den Schwerpunkt der Messwerte, wobei jeder einzelnen Beobachtung das gleiche Gewicht 1/n zukommt.
Arithmetischer Mittelwert
19M. Kresken
Mittelwert
• Mittelwert der Blutzuckerkonzentrationen von n = 52 Probanden
- Berechnung des Mittelwertes:
x = _ 62 + 75 + ... + 125
52 = 92,4
Arithmetischer Mittelwert
20M. Kresken
Mittelwert
• Geometrischer Mittelwert:- Werte: 0,25, 0,5, 1, 2, 4, 8, 16
x log2 x log2 x + 9
0,25 0,25 = 2-2 log2 0,25 = –2 -2 + 9 = 7
0,5 0,5 = 2-1 log2 0,5 = –1 -1 + 9 = 8
1 1 = 20 log2 1 = 0 0 + 9 = 9
2 2 = 21 log2 2 = 1 1 + 9 = 10
4 4 = 22 log2 4 = 2 2 + 9 = 11
8 8 = 23 log2 8 = 3 3 + 9 = 12
16 16 = 24 log2 16 = 4 4 + 9 = 13
21M. Kresken
Mittelwert
• Geometrischer Mittelwert:
- Transformierte Werte (log2 x + 9): 7, 8, 9, 10, 11, 12, 13
x = _ 7 + 8 + 9 + 10 + 11 + 12 + 13
7 = 10
Rücktransformation: 10 – 9 = 1
1 = log2 2
21 = 2
Mittelwert: 2
22M. Kresken
Quantile, Median
• Ein p-Quantil ist dadurch gekennzeichnet, dass mindestens der Anteil p der Werte kleiner oder gleich diesem Wert ist.
• x, das 0,5-Quantil, Median genannt
• Q1, das 0,25-Quantil, unteres Quartil genannt
• Q3, das 0,75-Quantil, oberes Quartil genannt
• Die 0,1-, 0,2 .... 0,9-Quantile heißen Dezile.• Die 0,01-, 0,02 .... 0,09-Quantile heißen Percentile.
~
23M. Kresken
Quantile, Median
• Das p-Quantil lässt sich aus der Rangliste von n Messwerten bestimmen.
• Zunächst wird das Produkt n x p berechnet.• Ist n x p keine ganze Zahl, so ist das p-Quantil der k-te
Wert x (k) der Rangliste, wobei k die auf n x p folgende ganze Zahl ist.
• Falls n x p eine ganze Zahl ist, so wird zur Bestimmung des p-Quantils zwischen den Werten x (n x p) und x (n x p + 1) interpoliert.
(x (n x p) + x (n x p + 1) )1
2
24M. Kresken
Quantile, Median
• Median und Quartile der Blutzuckerkonzentrationen von n = 52 Probanden
- Berechnung des Medians: Position in der Rangliste n x p = 52 x 0,5 = 26 Da 26 eine ganze Zahl ist, errechnet man den
Median als den mittleren Messwert zwischen dem 26. und 27. Messwert der Rangliste.
Der mediane Blutzuckerwert beträgt (90 + 92) / 2 [mg/100 ml] = 91 [mg/100 ml]
25M. Kresken
Quantile, Median
• Median und Quartile der Blutzuckerkonzentrationen von n = 52 Probanden
- Berechnung des unteren Quartils: Position in der Rangliste n x p = 52 x 0,25 = 13 Da 13 eine ganze Zahl ist, errechnet man das
untere Quartil als den mittleren Messwert zwischen dem 13. und 14. Messwert der Rangliste.
Q1 = (86 + 86) / 2 [mg/100 ml] = 86 [mg/100 ml]
- Berechnung des oberen Quartils: Q3 = (96 + 96) / 2 [mg/100 ml] = 96 [mg/100 ml]
26M. Kresken
Quantile, Median
• Median der Körpergröße von n = 53 Probanden- Berechnung des Medians:
Position in der Rangliste n x p = 53 x 0,5 = 26,5 Da 26,5 keine ganze Zahl ist, ist der 27.
Messwert der Rangliste der Median Der mediane Körpergröße beträgt
172 cm
27M. Kresken
Modalwert
• Der Modalwert ist der Messwert mit der größten absoluten Häufigkeit.
• Er ist nur sinnvoll, wenn er eindeutig ist. • Modalwert der Blutzuckerkonzentrationen von n = 52
Probanden:- Die Werte 84 und 92 wurden jeweils sechs mal
bestimmt.- Der häufigste Messwert ist nicht eindeutig und der
Modalwert damit nicht bestimmbar.
28M. Kresken
Modalwert, Median, Mittelwert
• Der Modalwert ist ein sehr einfach bestimmbares Lagemaß.
• Der Vorteil des Medians gegenüber dem Mittelwert liegt vor allem darin, dass er durch einzelne „Ausreißer“ nicht beeinflusst wird.
• Insofern ist der Median ein robustes Maß.• Ein Vorteil des Mittelwertes besteht darin, dass mit ihm
Rechenoperationen durchgeführt werden können.