Resumen Final de Estadística

8/16/2019 Resumen Final de Estadística

1/23

o

e

s

a

d

s

c

a

Estudia Variables Se Clasifican en

Cualitativas

Formas deRepresentación

Tabular

Gráfica

Descriptivas Mediasde punto

Inferencial Ji - cuadrado

Cuantitativas

Formas deRepresentación

Tabular

Gráfica

Descriptiva

Medidas de tendencia central

Medidas de punto

Inferencial Pruebas de

hipótesis.

Variables

Cualitativa

Escalas

Ordinal

Permiteestablecer

relaciones de tipo "mayor que"

o "menor que"

Nominal

medidas que nospermite

identificar sujetos como

"iguales" o"diferentes".

Cuantitativa

Escalas

Razón

Ocupa el nivel masalto de la escala,

posee un 0 absolutoque indica ausencia

total de lacarácterisitica.

Intervalo

Conocer ladistancia entredos mediciones

cualesquiera.

Posee un crelativo, u

cero no verdader


2/23

Parámetro ⇨ Medida calculada a partir de una población.

Estadístico ⇨ Medida calculada a partir de una muestra.Estadística Inferencial Estadística Descriptiva

Permite sacar conclusiones generales de

una población, basándose en los datosde una muestra. Ayuda a conocer algunos aspectos de la

población mediante el conocimiento deciertos aspectos de la muestra.

Pueden medirse los valores específicos delfenómeno colectivo o variable en estudio.

Formas para organizar y reducir el volumen dedatos. Se apoya en: - Tablas- Gráficas- Medidas numéricas de resumen.- Medidas de tendencia Central.

Variable Cualitativa

Partes de una Tabla

CUADRO No. 1GRUPO DE PACIENTES MASCULINOS MAYORES DE 15 AÑOS DE LA CLÍNICA “LA OBSCURIDAD”GUATEMALA 2013

(Solo se tomaron en cuenta a los pacientes más frecuentes)

Hombres 15 -25 Hombres 26 -35 Hombres 36-45 Total

Se droga 20 15 10 45

No se droga 30 15 15 60

total 50 30 25 105

Nota: los datos están actualizados respecto a la fecha indicadaFuente: Clínica

Presentación

de datos de

variables

cualitativas

En Formaescrita

Proposito

General:

Elaboradoscomo fuente

deinformacion

estadistica.Usualmente tienen grancantidad de

datos.

Proposito

Especifico:

Elaboradoscon fin deanalisis y

cálculo.

Tabular En forma Gráfica

Diagrama deBarras

Simples

GráficaBidireccional

Pie

Cuadro deAsociacion dedoble entrada

Barras

Segmentadas

Gráfica de Datos

Agrupados

# De

Cuadro

Título En

Mayúscula

Nota de encabezado

Cuerpo del

cuadro


3/23

GráficasBarras Simples : Excelentes para las distribuciones simples de frecuencias, a escala cualitativa. Se puede utilizar

cifras absolutas o cifras relativas.

Gráfica Bidireccional : Dos direcciones, puede comparar variables, se puede representar en porcentaje, se

utiliza la misma escala en dos sentidos y esta parte de la linea 0.

Diagrama de Sectores (Pie): Tamaño relativo de los componentes de un total, presentaciones populares. Se

puede presentar en cifras relativas y absolutas.

Barras Agrupadas: Es muy útil para datos de asociación, permite la comparación de las variables. (Identificar

componentes. Espacio, Claridad y Simplicidad).

Barras Segmentadas: La información va segmentada, es usado para representar datos de asociación. Se

coloca la información seguida de otra, presenta la dificultad de no ser tan clara. Es conveniente no usar más

de tres variables.

Cuadro asociación de doble entrada: doble variables, todos los datos del encabezado se escriben en

mayúscula. Puede ser utilizado para la realización de una gráfica.

Hombres Mujeres Total

Fuma 75 15 90

No Fuma 25 85 110

total 100 100 200


4/23

Variable Cuantitativa

Serie Simple ⇨Consiste en ordenar ascendente o descendente los datos en una tabla. Se manejacuando se obtienen menos de 30 datos.

Distribución simple de frecuencias ⇨ En la columna I se ponen los datos de la variable y en la segunda

la frecuencia del mismo. Se maneja cuando se obtienen de 30 a 50 datos.

Distribución en clases o intervalos de clase ⇨ Consiste en agrupar los datos en clases o intervalos;

acompañados de sus respectivas frecuencias. Para elaborar una Distribución en Intervalos de Clase esnecesario establecer el número de clases o intervalos a utilizar así como la amplitud que tendrán

dichos intervalos. Se maneja cuando se obtienen más de 60 datos.

1. Rango, Recorrido o Amplitud de la variable: es necesario escudriñar los datos porque se requierede la amplitud que exista entre ellos. La amplitud de la variable no es más que la diferenciaexistente entre el valor más bajo (XS) y el valor más alto (XL). Su símbolo es una R.

R = XL- XS

2. Numero de clases o intervalos: cálculo de la cantidad de intervalos a utilizar se realiza en funcióndel total de elementos o sujetos en la distribución, ya sea una población (N) o bien una muestra (n),apoyándose en la fórmula de Sturgess. Su símbolo es una K.

K = 1 + 3.322 X (log N)

Los valores 1 y 3.322 son constantes en la fórmula.

3. Amplitud de los intervalos o clases: Para calcular la amplitud que deberán tener los intervalos serequiere de los resultados obtenidos en los dos pasos anteriores. Su símbolo es una i.

Variable

Cuantitativa

Se clasificanen

continua

Se da cuandolos valoresnúmericos

que forman la variable en un

intervalocualquiera

son infitinos.

discreta

Es la variablecuyos valoresnúmericos se

pueden contaro son finitos en

un intervalocualquiera.

Tabular

Serie Simple

Distribucion simple de

frecuencias

Distribucion enclases o

Inertervalosde clase

En formaGráfica

Histograma

Ovijade

Galton

Polígono defrecuencias


5/23

Límites

Límites de clase:Luego de haber calculado el No. de clases y la amplitud de las mismas, se procede a laelaboración de los intervalos o clases. Es recomendable iniciar con el valor más bajo de los datospara luego se va sumando la amplitud de intervalo calculada (i) para ir formando las clases.

Límites AparentesLos límites de una clase son aparentes cuando éstos no permiten espacio entre un límite y otro, los

Intervalos han sido elaborados en forma continua.

Límites Absolutos

Si hay espacio entre los límites. Los intervalos en forma discreta.

Límites realesSe calculan imites reales si los intervalos han sido elaborados en forma discreta y se requiere sucontinuidad.

LS (i): límite superior de la clase (i)LI (i + 1): límite inferior de la clase siguiente (i+1)

Para calcular los límites reales realizamos lo siguiente:

150 -155

155- 160 Si nos dieran los datos 155 iría aquí.

160- 165 160 va aquí.

13- 19

20-26

27- 36

Edad f

13- 19 620-26 9

27- 36 8

Edad f

12.5- 19.5 6

19.5-26.5 9

26.5- 36.5 8


6/23

Frecuencia Absoluta Frecuencias RelativaFrecuenciaacumulada

Marca de Clase

Es el número de vecesque aparece undeterminado valor.Se simboliza con una f o fi.La suma de lasfrecuencias absolutas dacomo resultado el total dedatos que corresponde altamaño de la muestra (n)o de la población (N) quese estudia.

Es el cociente entre unafrecuencia absoluta y elnúmero total de losdatos.Se simboliza con una fr.La frecuencia relativatambién puedemultiplicarse por 100para expresarla enporcentaje.

Es la sumaacumulativa, de lasfrecuencias absolutas.Se simboliza con unafa.

Se conoce tambiéncomo punto medio, es elvalor que representa acada clase y se localiza justo al centro delintervalo.

Edades Recuento f fa Limites Reales mc fr fra

55-5859-6263-6667-70

IIIII IIIIIII II

IIIII IIIII IIIII IIIIII IIIII IIII

771614

7143044

54.5 -58.558.5 – 62.562.5 – 66.566.5 – 70.5

56.560.564.568.5

0.160.160.360.32

0.160.320.681

Total 44 1

GráficasHistograma:

Intervalos deamplitud

Constantes Se llama así porque la separación

o distancia entre límite inferior y superior de cada clase es

siempre el mismo.

Variable

En una distribución los intervalos son de amplitud variable cuandola distancia entre límite inferior y

límite superior varía de una clasea otra.

Se utiliza cuando los valores de ladistribución que se está

estudiando están muy dispersos,por lo que al agruparlos con

intervalos constantes, algunosquedarían con frecuencia de

cero.

05

1015

F r e c u e n c i a

Limites Reales

Histograma


7/23

Poligono de Frecuencia:

Ojiva de Galton:

Medidas de punto

0

5

10

15

Medidas

de punto

Proporciones

Una proporción es larelación o

comparación entredos grupos, uno es una

parte del todo y el otroes el total o universo.

P= =

Razones

Una razón es la relación ocomparación que se hace

entre dos grupos diferentes,que pueden ser de igual o

diferente naturaleza, paradeterminar si ellas son igualeso si una es mayor que la otra.

C = total del primer grupo

d = total del segundo grupo

k = es una base, una unidad seguida de ceros (10, 1000,

etc.).

Porcentajes

Un porcentaje es unaproporción

multiplicada por cien.

Marca de clase

F r e c u e n c i a

Limites Reales

F r e c u e n c i a s

a c u m u l a

d a s

Por cada K del segundogrupo d hay Resultado deltotal del primer grupo C.


8/23

Medidas de tendenciacentral Media (µ,x)

Es el valor promedio de los datos, es la medida de tendencia central más importante, debido a la

representatividad que posee los datos de la variable en estudio. Su uso es adecuado cuando lasdistribuciones son simétricas o aproximadas a la forma normal.

Datos agrupados en frecuencias Datos agrupados en intervalos

∑ ∑

Mediana (Me) Identifica el valor que se encuentra en el centro de los datos. Es decir que nos permite separa por la mitad unconjunto de datos. También es llamado valor medio. Como primer paso se ordenan los datos de menor amayor. Es adecuado utilizarla cuando una distribución se aparta de lo normal (distribuciones sesgadas).

Datos agrupados en frecuencias Datos agrupados en intervalosPosición (n)

Si la serie es par, el valor de la medianase calcula con el promedio de los dosvalores centrales dividido dos.

( ⁄ )

Moda (Mo) Es aquel valor que tiene la frecuencia mayor o es el valor particular que ocurre más frecuente quecualquier otro. Es la medida de tendencia central menos confiable. Su utilización es prioritariamentecon datos cualitativos.

Medidas

Descriptivas

medidas de tendencia

central

media

mediana

moda

medidas deposición

cuartiles

deciles

percentiles

medidas dedisperción

desviaciónestandar

varianza

coheficiente de variación


9/23

Datos agrupados en frecuencias Datos agrupados en intervalosEl dato con mayor frecuencia.

Se tiene una muestra con los valores: 1,2,4,4,3,7,2,4,3,2,5 y 2.

1,2,2,2,2,3,3,4,4,4,5,7Mo= 2

Se tiene una muestra con valores 20, 20, 23, 24, 25, 25, 26 y 30.

Mo= 20 y 25, se dice que es bimodal.

= fmayor- fanterior= fmayor- fposteior

Medidas de PosiciónEstos valores son de la misma familia de la mediana, por lo que para calcularlos en las distribuciones de datosagrupados en intervalos podemos utilizar la fórmula de la mediana, solo que el total de los datos en lugar dedividirlo dentro dos, lo dividimos dentro de 4 para los cuartiles, entre 10 para los deciles y entre 100 para lospercentiles o centiles.

Cuartiles (Qk)Los cuartiles dividen los datos en cuatro partes iguales. Cada una de las partes representa una cuarta parte, o

el 25% de las observaciones. El segundo Cuartil equivale a la mediana.Q4 NOEXISTE! (se dividen en 4 pero son 3)

Valor Q1: 25% bajo ese valor75% sobre ese valor

Valor Q2: 50% bajo ese valor

50% sobre ese valor

Valor Q3: 75% bajo ese valor25% sobre ese valor

Deciles (Dk)Los deciles dividen los datos en 10 partes iguales. El quinto decil equivale a la mediana.

Percentiles o Centiles (Pk/Ck) Los deciles dividen los datos en 100 partes iguales.

Arreglo Simple Datos Agrupados



La mediana es igual al cuartil segundo, decil quinto y centil 50

Me = Q2 = D5 = C50El cuartil primero es igual al centil 25

Q1 = C25El cuartil tercero es igual al centil 75

Q3= C75El Decil primero es igual al centil decimo.

D1 = C10


10/23

Medidas de DispersiónMide la dispersión de los datos con respecto a la media la distribución es simétrica entoncesmedia=moda=mediana; Las medidas más utilizadas son: rango, varianza, desviación estándar y coeficientede variación.

Rango, Recorrido o AmplitudMide la extensión total de un conjunto de datos y se calcula utilizando únicamente dos números.

R = medición más grande (XL) – medición más pequeña (Xs)

Varianza o Variancia Cuantifica la variabilidad de los datos respecto al valor de la media elevada al cuadrado. La varianza para lamuestra se representa mediante una s² y la notación para población σ ².

Datos no agrupadosde una muestra

Datos agrupados deuna muestra

Datos no agrupados deuna población

Datos agrupados deuna población

∑̂

∑ ̂

∑

∑

Desviación Estándar o Desviación TípicaEs la raíz cuadrada de la varianza. Los símbolos son s si es una muestra y población σ si es una población.

Coeficiente de variabilidad Se usa para comparar la variabilidad entre dos o más muestras medidas en las mismas unidades o no. Losdatos que se expresan en porcentaje en la cual se compara la desviación estándar con el respectivo valor de

promedio de los datos.

̂

Regresión y CorrelaciónRegresión LinealConsiste en determinar un modelo lineal que sea capaz de poder realizar estimaciones a través del tiempo. En un modelode regresión lineal simple, solo existen dos tipos de variables, la variable independiente y la variable dependiente.

La ecuación general del modelo de regresión simple es la siguiente:

La pendiente de la recta puede ser positiva o negativa, si es positiva se dice que la relación esdirectamente proporcional (si X aumenta, Y también). En caso contrario si es negativa es inversamenteproporcional (si X aumenta, Y disminuye).

La pendiente de la recta indica el cambio por cada unidad de medida por cada variableindependiente.

Variable

dependiente

Independiente

Pendiente dela rectaIntersección

con eje y.


11/23

Coeficiente de correlación: Se utiliza para medir la intensidad de la variable independiente con ladependiente, este coeficiente determina si existe buena, regular o mala relación entre las variables.

Diagrama de dispersión: Sirve para graficar los puntos en parejas ordenadas de la variabledependiente con la independiente. A través de él se puede observar el tipo de pendiente de la recta,si la relación va ser directa o inversa y puede observarse también que tan diversos están los puntos.

Conjuntos

Universo: conjunto que contiene todos los elementos.

Elemento: objeto, animal o cosa que forma parte de un conjunto. Subconjunto: conjunto contenido en otro conjunto. Diagrama de Venn: Forma gráfica de representar un conjunto.

Teoría de la probabilidad

Probabilidad de un Evento

Probabilidad Marginal: Se tiene interés en un solo un evento. P=

Conjuntos

Es un grupo de elementos uobjetos especificos en tal

forma que se puede afirmar sicualquier objeto dado

pertenece o no a laagrupación.

Formas derepresentarlos

enumerativa

{a,e,i,o,u}

descriptiva

{las vocales}

gráfica

Tipos deconjuntos

Finitos: que sepueden contar

Infinitos: no sepueden contar.

Vacios: noexisten, estan vacios.

Operacionesentre

conjuntos

Unión

Es laagrupacion de

dos o másconjuntos.

Intersección

Es laagrupación delos elementos

en común.

Probabilidad

Probabilidad subjetiva Probabilidad objetiva

Clasica o apriori

Puede calcularse sinnecesidad de buscar o

esperar datos.

Relativa o A posteriori

Se necesitaexperimentar o probar

antes.

P=

a eui o

X= Evento

de interés


12/23

-0.79 0.54

Z=0.54 ⇨ 0.7054Z=-0.79⇨ 0.21480.7054 - 0.2148= 0.4906

Probabilidad Conjunta: Se tiene interés en dos eventos al mismo tiempo, en una tabla es una

intersección.

Probabilidad de dos eventos mutuamente excluyentes: Es la probabilidad de que ocurra uno u otro de

dos eventos mutuamente excluyentes.

Mutuamente excluyentes: que no pueden ocurrir al mismo tiempo. Probabilidad de dos eventos NO mutuamente excluyentes: Es aquella en la cual se desea saber la

probabilidad de que ocurra uno u otro de dos eventos no mutuamente excluyentes.

No mutuamente excluyentes: pueden estar presentes al mismo tiempo.

Probabilidad condicional: No utiliza al universo como denominador. El numerador es el número de

veces que aparece el evento de interés con la característica condicionante, y como denominador el

total de la característica condicionante.

Probabilidad de dos eventos independientes: Se calculan dos probabilidades, una marginal y una

condicional, si el resultado obtenido es el mismo esto quiere decir que las variables son independientes

si el resultado es diferente existe relación entre las mismas.

Distribución Normal Es simétrica

µ = 0 y µ ± 1 ⇨ 68%µ ± 2 ⇨ 95%µ ± 3 ⇨ 91%

Encuentre el área bajo la curva entre z=0 y z=1.5

La campana se toma como 1.

Para Z=1.5 ⇨ 0.9332 (ver Tabla) Para Z=0 ⇨ 0.50000.9332- 0.5000 = 0.4332

P ( -0.79


13/23

0 0.72

Z=0.72 ⇨ 0.76421 - 0.7642= 0.2358

o busco -0.72

0-Z1

1 – 0.8944= 0.1056 (cola)

Z1= -1.25

Por definición cuando “Z es igual a n número” o es igual a “-n”, es igual a 0.

P (Z>0.72)

P (Z>Z1)= 0.8944

P (Z= 2) = 0

Aplicación de la DistribuciónNormal Estándar

La distribución normal estándar se aplica a cualquier problema de distribución normal. Para cambiar el eje “x”

por el eje “z” se realizara a través de la siguiente formula.

La fórmula anterior puede ser utilizada únicamente con poblaciones.

En un estudio sobre niveles de glucosa, en una población de 276 recién nacidos,

se encontró un promedio de 82mg/dl y una desviación estándar de 6,2mg/dl.

Suponiendo que los datos se distribuyen normalmente, determine lo siguiente:

a. Probabilidad de escoger al azar a un recién nacido con glicemia menor de

80mg/dl

P (Z0.48) = 0.6844

1-0.6844 = 0.3156

Eje “x”

Desviación estándar

Media


14/23

c. El porcentaje de recién nacidos con nivel de glicemia menor a 74mg/dl.

-1.29 = 0.09850.0985*100 = 9.85%

d. El número de recién nacidos con nivel de glicemia de 82mg/dl o más asciende a.

276*0.5= 138

e. La probabilidad de escoger un recién nacido que tenga los valores de glicemia entre 79.51

y 84.49mg/dl.

-0.40 ⇨ 0.3446

0.40 ⇨ 0.6554P (-0.40


15/23

Cantidad de Posibilidades en el Muestreo

Muestreo con reemplazo

Numero de formas = Muestreo sin reemplazo

Numero de formas = Calculadora = Shift (nCr)

Estimación de MediasDatos ≥ 30 ⇨ Se trabaja con distribución normal.Datos < 30 ⇨ Se trabaja con t- student

Se reunieron 31 datos referentes al peso del salón 322. Calcule el promedio y la

desviación de la µ (media poblacional) a través de un intervalo con un nivel deconfianza del 95%.

159, 150, 198,180, 130, 165, 205, 130, 140, 101, 115, 115,128, 200, 208, 186, 117, 182, 170, 105, 127,128,150, 100, 129, 100, 137,118, 170, 101.

̂= 140.23lbsS = 33.7 lbs.

NC=95%

= significancia=5% = 0.05= 0.0250 = 0.975Z= 0.975 ⇨ 1.96

̂ ̂ : Estimador puntual z: coeficiente de confiabilidad

̂ : Error Estándar

140.23± (1.96) (√ )140.23 + 11.86= 152.09140.23 – 11.86 = 128.37

÷

[128.37 – 152.09]

Interpretación: Con el 95% de confiabilidad se

puede decir que la media del peso de los

estudiantes del salón 322 se encuentra entre

[128.37 – 152.09]


16/23

̂ ̂ ̂

√

̂ ⇨ ̂ ⇨ > 0.05 ⇨ Si utiliza factor de corrección (FC) ≤ 0.05 ⇨ No utiliza Factor de Corrección

Factor de corrección (FC)

Afecta al ̂ (Error estándar)

̂ √ En una muestra de 144 pacientes se determinó el valor medio de la presión,

el cual corresponde a 18mmhg. Si determino que la varianza de lapoblación es de 4. Determine lo siguiente.

a. El error estándar ̂ √ b. El coeficiente de confiabilidad para un nivel de confianza de 90%

NC= 90% Z (1-0.05) = z0.95 = 1.645

c. Construya un intervalo de confianza con una significancia 7.40% 0.370 = 1-0370 =0.963 ⇨ Busco el áreaZ= 0. 1.79

Coeficiente deconfiabilidad

EstimadorPuntual

ErrorEstándar

- Precisión- Máximo error d

Estimación- Error


17/23

d. Si existe una población de sujetos de estudios equivalente a 600. Encuentre el errorestándar.

18 ± (1.79) (0.17)

18 + 0.39 = 18.3018 – 0-39 = 17.7[17.7 – 18.30] mmHg

e. Encuentre el máximo error de estimación (con la población y sin la población) N=600

̂

̂ o Sin la población (1.79)(0.17) = 0.30o Con la población (1.79)(0.15) 0.27

Distribución “t- student” Criterio para usar z o t

̂ ̂

z

muestragrande

s

muestrapequeña

tmuestragrande s

EstándarPuntual

Error Estándar

Coeficiente de confiabilidad

Con un nivel de confianza de 92% se puede concluir que la media de la

población (µ) se encuentra entre [17.7 – 18.30] mmHg

Población

Muestra

Todo lo contrario es “z”


EstimadorPuntual

ErrorEstándar


18/23

Se tomó una muestra de 16 niños recién nacidos a los cuales se les determino la

concentración media de bilirrubina en el suero. El valor de la concentración media es dê=5.98mg/100cc con una desviación de 3.5mg/100cc a. ¿Cuál es el valor del estimador puntual?

La media de la muestra es el estimador puntual!

5.98mg/100cc

b. ¿Cuál es el valor del coeficiente de confiabilidad?

5% 0.3250 = 1-03250=0.975 ⇨ busco el áreaCoeficiente de confiabilidad =2.1315

c. ¿Cuál es el valor de error estándar?

√ d. Construya un intervalo de confianza con una significancia igual al 5%

5.98± (2.1315)(0.875)

5.98+1.87 = 7.85

5.98-1.87= 4.11

e. Construya un intervalo de confianza con un nivel de confianza de 90%

5.98± (1.7530)(0.875)

5.98+1.53 = 7.51

5.98-1.53= 4.45

⇨ busco el área

n=16

n-1 =15

Grados de libertad (gl) =15

Con 95% de confiabilidad se puede concluir que la media de la población(µ) se encuentra entre [4.11 – 7.85] mg/100cc

Con 90% de confiabilidad se puede

concluir que la media de la población (µ)

se encuentra entre [4.45 – 7.51] mg/100cc


19/23

AmplitudDimensión

Intervalo de confianza parala proporción de unapoblaciónSe utilizara z para los intervalos de proporción. Si tiene la población y muestra deberá calcular

para determinar si es mayor de 0.05 y utilizar factor de corrección.

En una muestra aleatoria simple de 125 varones desempleados, expulsados todos ellos de laescuela preparatoria, entre las edades de 16 - 21 años inclusive 88 de ellos declararon queeran consumidores de bebidas alcohólicas, construya un intervalo de confianza de 95% parala proporción de la población.N=125n=88NC= 95% ⇨ z=1.96 0.704 ± (1.96) (0.04)

0.704+ 0.0784 =0.78240.704- 0.0784 = 0.6256

Tamaño de Muestra

D = 2 d d= Población InfinitaMedias

Población FinitaMedias


EstimadorPuntual

ErrorEstándar

Con el 95% de confiabilidad se puede concluir que la se encuentra entre [0.63 – 0.78]

Proporciones

Proporciones

q =1-p p=


20/23

Prueba de Hipótesis

Cuando se rechaza la nula, se acepta la alterna. Cuando se acepta la alterna se dice que es “Estadísticamente significativo”.

Z calculada √ ⁄ Z crítico= 1- o Prueba de Hipótesis para la media de una población (µ): Para realizar una prueba

de hipótesis se recomienda seguir un procedimiento ordenado.

Condición de la hipótesis

Acción Posible

Verdadera Falsa

No rechaza Ho Acción Correcta Error tipo II

Rechazar Ho Error tipo I Acción correcta

Prueba dehipótesis

Desde el punto de vistaestadístico una hipótesis

es una suposición dealgo que se supone

referente a una muestrao población.

Las hipótesisestadísticas se

dividen en

Alterna (Ha)

es la que elinvestigador

supone.

Nula (Ho) Es la contraparte dela alterna o bien laque se presume o

carácteristicaestudiada.

Paso 1.

Datos

Paso 2

Planteamientode hipótesis

Paso 3

Regla dedecisión

Paso 4

EstadísticoCálculado

Paso 5

Decisión

Paso 6

Conclusión

Error

Tipo I

Este error se conoce también

como Error alfa. Alfa (α

) es laprobabilidad de cometer unError tipo I

Tipo II

La probabilidad decometererror tipo II es el valor de Beta, se llama Error tipo β o error de

aceptación.


21/23

No RechazarHo.

Se desea saber si es posible concluir que el consumo medio diario de calorías de la

población rural de un país en desarrollo es de menos de 2000. Una muestra de 500

individuos produjo un consumo medio de 1985 y una desviación estándar de 210. Alfa

de 0.05

Paso 1 (Datos)

n=500

x=1985

s= 210 Paso 2 (Planteo de hipótesis)

Ho: µ≥ 2000

Ha: µ z crítico

No rechaza Ho

Paso 6 (Conclusión)

Con un 95% se concluye que la media calórica de la población rural de un país en

desarrollo es mayor o igual que 2000.

Estadístico “P” – PruebaEn toda prueba de hipótesis el estadístico “p” nos permite comparar la proporción de “p” con

la significancia para poder tomar la decisión final.

Condición general

P ≤ ⇨ Rechaza HoP > ⇨ No Rechaza Ho

El valor de P, viene de z calculado

Z crítico


22/23

Supuesta población

qo= 1-po

Población

estimada

Prueba de Hipótesis (t-student)

t calculada √ ⁄ t crítico= Unilateral ⇨

Bilateral ⇨ ⁄ Prueba de hipótesis para la proporción de una población

̂

Prueba de independencia(ji- cuadrado)

Se puede establecer la asociación o relación que existe entre dos

variables cualitativas.

Todos los pasos de la prueba de hipótesis son iguales excepto el de

estadístico calculado.

Cuando las variables cualitativas son dipotómicas (2 categorías) los

cuadros de contingencia son de “2x2”

Primero criterio Clasificación

1 2 Totales

Segundo Criterio 1 A B A+B

Clasificación 2 C D C+D

A+C B+ D n

Para calcular el estadístico de prueba para una tabla de contingencia

de 2x2.

Para buscar el valor de Ji – crítico en la tabla se hace a través de los

grados de libertad (gl). Y el valor de la significancia.

gl= (número de filas -1) (número de columnas -1)

gl= 1 ⇨ tablas de 2x2.Si Ji calculado > ji critico Se rechaza Ho


23/23

Valores Esperados

Valores Observados

Cantidad de elementos dentro la matriz

Son unilaterales a la derecha únicamente.

La distribución no es simétricaEs significativa cuando se rechaza la hipótesis nula (Existe relación).

Prueba de Ji- cuadrado

matriz mayor 2x2Todos los pasos de la prueba de hipótesis son iguales excepto el de

estadístico calculado.

Se utiliza la siguiente fórmula para el cálculo del estadístico de prueba.

∑

Oi Ei Oi- Ei (Oi-Ei)² (Oi-Ei)² / Ei

Valorobservado

Ei =

Al valor observado sele resta el resultado

de la operaciónanterior.

El resultado loelevamos al

cuadrado

El resultado en lacasilla anterior, divido

lo de la segunda.

Documents

Resumen Final de Estadística