21
Pattern Recognition Semestre Agosto-Diciembre 2012

Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Pattern Recognition

Semestre Agosto-Diciembre 2012

Page 2: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Mediana • La mediana de una colección de datos ordenados

en orden de magnitud es el valor medio o media

aritmética de los 2 valores medios.

• Ej. 3,4,4,5,6,8,8,8,10 => mediana = 6

• Ej. 5,5,7,9,11,12,15,18 => mediana=(9+11)/2=10

Mediana = L +

N

2- få

fmediana

æ

è

ççç

ö

ø

÷÷÷c

L = límite inferior de la clase mediana N= # total de datos Σf= suma de frecuancias de todas las clases por debajo de la clase mediana Fmediana = frecuencia clase mediana C= tamaño del intervalo de la clase mediana

Page 3: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

• Geométricamente la mediana es el valor de X que

corresponde a la vertical que divide un histograma

en 2 parte de igual área.

Page 4: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Moda • La moda de una serie de números es aquel valor

que se presenta con mayor frecuencia, es decir el

más común.

• La moda puede no existir, o si existe puede nos ser

única.

Page 5: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Media Geométrica (G) • G de una serie de N números X1 ,X2, X3, …, XN es la

raíz N-ésima del producto de los números.

G = X1X2 X3, ...,XnN

Page 6: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Media Armónica (H)

H =1

1

N

1

X jj=1

N

å

Note que:

H £ G£ X

Las tres medias son iguales tos los números X son iguales.

Page 7: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Raíz Cuadrada del Cuadrado de la Media

(RMS) • RMS o media cuadrática de una serie de números

X1 ,X2, X3, …, XN se define como:

RMS=

X2

j

j=1

N

å

N

Page 8: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Cuartiles • Aquellos valores que dividen los datos ordenados

en 4 partes iguales. Estos valores son representados

por: Q1, Q2 y Q3 se llaman primero, segundo y tercer

cuartil, respectivamente. Note que:

• Mediana = Q2

Page 9: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Desviación Estándar y Otras Medidas de

Dispersión • Dispersión o variación es el grado en que los dato

numéricos tienden a extenderse alrededor de un

valor medio.

Page 10: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Desviación Media • De una serie de N números X1 ,X2, X3, …, XN se

define como:

DM =

X j - Xj=1

N

å

N

Donde:

X = media aritmética

· = valor absoluto

Page 11: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

• Si X1, X2, X3, …, Xk se presentan en frecuencias f1, f2,

f3, …, fk reescribimos MD como:

DM =

fj

X j - Xj=1

k

å

N

Donde:

N = f j

j=1

K

å

Note que podemos usar cualquier valor ‘a’ de referencia, pero MD es mínima respecto a la mediana

DM =

fj

X j - aj=1

k

å

N

Page 12: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Rango Semiintercuartílico o desviación cuartílica

• De una serie de datos se define como:

Rango semiintercuartilico=Q=Q3-Q1

2

donde Q1 y Q3 son el primer y tercer cuartil de los datos

Page 13: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Rango entre percentiles • De una serie de datos viene definido por:

Rango Percentil 10-90 = P90 -P10

Donde P10 y P90 son el percentil décimo nonagésimo de los datos

Page 14: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Desviación Típica • De una serie de N números X1, X2, X3, …, XN se

representa por ‘s’ y se define por:

s=

X j - X2

j=1

N

å

N

s=

f j X j - X2

j=1

k

å

N

Nota: se usa el denominador N-1 cuando N<30

Page 15: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Varianza • La varianza de un conjunto de datos se define

como el cuadrado de la desviación típica y viene

dada por:

• Varianza = s2

• Nota: s2 = varianza muestral

• σ2 = varianza poblacional

Page 16: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Propiedades de la Desviación Típica

• Se puede definir la desviación típica respecto a algún promedio ‘a’ distinto de la media aritmética. Sin embargo, es mínima cuando a=media aritmética.

• Para distribuciones normales resulta que:

• A) el 68.27 % de los datos están comprendidos entre y

• A) el 95.45 % de los datos están comprendidos entre

• A) el 99.73 % de los datos están comprendidos entre

sX sX

sX 2 sX 2

sX 3 sX 3

Page 17: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Dispersión Absoluta y relativa. Coeficiente de

variación • La dispersión o variación real determinada por la

desviación típica se la dispersión absoluta (DA).

• La dispersión relativa se define por:

• El coeficiente de dispersión o variación se define

por:

promedio

DA DR

X

s DR

Page 18: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Variable normalizada o tipificada

s

X-X z

Page 19: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Momentos, Sesgo y Curtosis

• Si X1 ,X2, X3, …, XN son los N valores que toma la

variable X, se define la cantidad:

Como el momento de orden ‘r’, respecto al origen si

la media es cero..

• El momento de orden ’r’ respecto a la media se

define como:

Xr =X1

r + X2

r +... + XN

r

N=

X j

r

j=1

N

å

N

mr =

(X j

j=1

N

å - X)r

N

Page 20: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Sesgo • Es el grado de asimetría de una distribución

sesgo=

X - Moda

s

sesgo=(X - Mediana)

sCoeficiente de sesgo= a3 =

m3

s3=

m3

m3

2

Coeficiente de sesgo= (a3)2

Coeficiente de sesgo intercuartilico=(Q3 -Q2 )- (Q2 -Q1)

(Q3 -Q1)

Page 21: Pattern Recognitiongalia.fc.uaslp.mx/~mmendez/lecturenotes/patternRecognition/slides/... · Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia,

Curtosis • El grado de Apuntamiento de una distribución

Coeficiente de curtosis = a4 =m4

s4=

m3

m4

2