Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Pattern Recognition
Semestre Agosto-Diciembre 2012
Mediana • La mediana de una colección de datos ordenados
en orden de magnitud es el valor medio o media
aritmética de los 2 valores medios.
• Ej. 3,4,4,5,6,8,8,8,10 => mediana = 6
• Ej. 5,5,7,9,11,12,15,18 => mediana=(9+11)/2=10
Mediana = L +
N
2- få
fmediana
æ
è
ççç
ö
ø
÷÷÷c
L = límite inferior de la clase mediana N= # total de datos Σf= suma de frecuancias de todas las clases por debajo de la clase mediana Fmediana = frecuencia clase mediana C= tamaño del intervalo de la clase mediana
• Geométricamente la mediana es el valor de X que
corresponde a la vertical que divide un histograma
en 2 parte de igual área.
Moda • La moda de una serie de números es aquel valor
que se presenta con mayor frecuencia, es decir el
más común.
• La moda puede no existir, o si existe puede nos ser
única.
Media Geométrica (G) • G de una serie de N números X1 ,X2, X3, …, XN es la
raíz N-ésima del producto de los números.
G = X1X2 X3, ...,XnN
Media Armónica (H)
H =1
1
N
1
X jj=1
N
å
Note que:
H £ G£ X
Las tres medias son iguales tos los números X son iguales.
Raíz Cuadrada del Cuadrado de la Media
(RMS) • RMS o media cuadrática de una serie de números
X1 ,X2, X3, …, XN se define como:
RMS=
X2
j
j=1
N
å
N
Cuartiles • Aquellos valores que dividen los datos ordenados
en 4 partes iguales. Estos valores son representados
por: Q1, Q2 y Q3 se llaman primero, segundo y tercer
cuartil, respectivamente. Note que:
• Mediana = Q2
Desviación Estándar y Otras Medidas de
Dispersión • Dispersión o variación es el grado en que los dato
numéricos tienden a extenderse alrededor de un
valor medio.
Desviación Media • De una serie de N números X1 ,X2, X3, …, XN se
define como:
DM =
X j - Xj=1
N
å
N
Donde:
X = media aritmética
· = valor absoluto
• Si X1, X2, X3, …, Xk se presentan en frecuencias f1, f2,
f3, …, fk reescribimos MD como:
DM =
fj
X j - Xj=1
k
å
N
Donde:
N = f j
j=1
K
å
Note que podemos usar cualquier valor ‘a’ de referencia, pero MD es mínima respecto a la mediana
DM =
fj
X j - aj=1
k
å
N
Rango Semiintercuartílico o desviación cuartílica
• De una serie de datos se define como:
Rango semiintercuartilico=Q=Q3-Q1
2
donde Q1 y Q3 son el primer y tercer cuartil de los datos
Rango entre percentiles • De una serie de datos viene definido por:
Rango Percentil 10-90 = P90 -P10
Donde P10 y P90 son el percentil décimo nonagésimo de los datos
Desviación Típica • De una serie de N números X1, X2, X3, …, XN se
representa por ‘s’ y se define por:
s=
X j - X2
j=1
N
å
N
s=
f j X j - X2
j=1
k
å
N
Nota: se usa el denominador N-1 cuando N<30
Varianza • La varianza de un conjunto de datos se define
como el cuadrado de la desviación típica y viene
dada por:
• Varianza = s2
• Nota: s2 = varianza muestral
• σ2 = varianza poblacional
Propiedades de la Desviación Típica
• Se puede definir la desviación típica respecto a algún promedio ‘a’ distinto de la media aritmética. Sin embargo, es mínima cuando a=media aritmética.
• Para distribuciones normales resulta que:
• A) el 68.27 % de los datos están comprendidos entre y
• A) el 95.45 % de los datos están comprendidos entre
• A) el 99.73 % de los datos están comprendidos entre
sX sX
sX 2 sX 2
sX 3 sX 3
Dispersión Absoluta y relativa. Coeficiente de
variación • La dispersión o variación real determinada por la
desviación típica se la dispersión absoluta (DA).
• La dispersión relativa se define por:
• El coeficiente de dispersión o variación se define
por:
promedio
DA DR
X
s DR
Variable normalizada o tipificada
s
X-X z
Momentos, Sesgo y Curtosis
• Si X1 ,X2, X3, …, XN son los N valores que toma la
variable X, se define la cantidad:
Como el momento de orden ‘r’, respecto al origen si
la media es cero..
• El momento de orden ’r’ respecto a la media se
define como:
Xr =X1
r + X2
r +... + XN
r
N=
X j
r
j=1
N
å
N
mr =
(X j
j=1
N
å - X)r
N
Sesgo • Es el grado de asimetría de una distribución
sesgo=
X - Moda
s
sesgo=(X - Mediana)
sCoeficiente de sesgo= a3 =
m3
s3=
m3
m3
2
Coeficiente de sesgo= (a3)2
Coeficiente de sesgo intercuartilico=(Q3 -Q2 )- (Q2 -Q1)
(Q3 -Q1)
Curtosis • El grado de Apuntamiento de una distribución
Coeficiente de curtosis = a4 =m4
s4=
m3
m4
2