Upload
nelson-fuentes
View
218
Download
0
Embed Size (px)
Citation preview
8/16/2019 Resumen Final de Estadística
1/23
o
e
s
a
d
s
c
a
Estudia Variables Se Clasifican en
Cualitativas
Formas deRepresentación
Tabular
Gráfica
Descriptivas Mediasde punto
Inferencial Ji - cuadrado
Cuantitativas
Formas deRepresentación
Tabular
Gráfica
Descriptiva
Medidas de tendencia central
Medidas de punto
Inferencial Pruebas de
hipótesis.
Variables
Cualitativa
Escalas
Ordinal
Permiteestablecer
relaciones de tipo "mayor que"
o "menor que"
Nominal
medidas que nospermite
identificar sujetos como
"iguales" o"diferentes".
Cuantitativa
Escalas
Razón
Ocupa el nivel masalto de la escala,
posee un 0 absolutoque indica ausencia
total de lacarácterisitica.
Intervalo
Conocer ladistancia entredos mediciones
cualesquiera.
Posee un crelativo, u
cero no verdader
8/16/2019 Resumen Final de Estadística
2/23
Parámetro ⇨ Medida calculada a partir de una población.
Estadístico ⇨ Medida calculada a partir de una muestra.Estadística Inferencial Estadística Descriptiva
Permite sacar conclusiones generales de
una población, basándose en los datosde una muestra. Ayuda a conocer algunos aspectos de la
población mediante el conocimiento deciertos aspectos de la muestra.
Pueden medirse los valores específicos delfenómeno colectivo o variable en estudio.
Formas para organizar y reducir el volumen dedatos. Se apoya en: - Tablas- Gráficas- Medidas numéricas de resumen.- Medidas de tendencia Central.
Variable Cualitativa
Partes de una Tabla
CUADRO No. 1GRUPO DE PACIENTES MASCULINOS MAYORES DE 15 AÑOS DE LA CLÍNICA “LA OBSCURIDAD”GUATEMALA 2013
(Solo se tomaron en cuenta a los pacientes más frecuentes)
Hombres 15 -25 Hombres 26 -35 Hombres 36-45 Total
Se droga 20 15 10 45
No se droga 30 15 15 60
total 50 30 25 105
Nota: los datos están actualizados respecto a la fecha indicadaFuente: Clínica
Presentación
de datos de
variables
cualitativas
En Formaescrita
Proposito
General:
Elaboradoscomo fuente
deinformacion
estadistica.Usualmente tienen grancantidad de
datos.
Proposito
Especifico:
Elaboradoscon fin deanalisis y
cálculo.
Tabular En forma Gráfica
Diagrama deBarras
Simples
GráficaBidireccional
Pie
Cuadro deAsociacion dedoble entrada
Barras
Segmentadas
Gráfica de Datos
Agrupados
# De
Cuadro
Título En
Mayúscula
Nota de encabezado
Cuerpo del
cuadro
8/16/2019 Resumen Final de Estadística
3/23
GráficasBarras Simples : Excelentes para las distribuciones simples de frecuencias, a escala cualitativa. Se puede utilizar
cifras absolutas o cifras relativas.
Gráfica Bidireccional : Dos direcciones, puede comparar variables, se puede representar en porcentaje, se
utiliza la misma escala en dos sentidos y esta parte de la linea 0.
Diagrama de Sectores (Pie): Tamaño relativo de los componentes de un total, presentaciones populares. Se
puede presentar en cifras relativas y absolutas.
Barras Agrupadas: Es muy útil para datos de asociación, permite la comparación de las variables. (Identificar
componentes. Espacio, Claridad y Simplicidad).
Barras Segmentadas: La información va segmentada, es usado para representar datos de asociación. Se
coloca la información seguida de otra, presenta la dificultad de no ser tan clara. Es conveniente no usar más
de tres variables.
Cuadro asociación de doble entrada: doble variables, todos los datos del encabezado se escriben en
mayúscula. Puede ser utilizado para la realización de una gráfica.
Hombres Mujeres Total
Fuma 75 15 90
No Fuma 25 85 110
total 100 100 200
8/16/2019 Resumen Final de Estadística
4/23
Variable Cuantitativa
Serie Simple ⇨Consiste en ordenar ascendente o descendente los datos en una tabla. Se manejacuando se obtienen menos de 30 datos.
Distribución simple de frecuencias ⇨ En la columna I se ponen los datos de la variable y en la segunda
la frecuencia del mismo. Se maneja cuando se obtienen de 30 a 50 datos.
Distribución en clases o intervalos de clase ⇨ Consiste en agrupar los datos en clases o intervalos;
acompañados de sus respectivas frecuencias. Para elaborar una Distribución en Intervalos de Clase esnecesario establecer el número de clases o intervalos a utilizar así como la amplitud que tendrán
dichos intervalos. Se maneja cuando se obtienen más de 60 datos.
1. Rango, Recorrido o Amplitud de la variable: es necesario escudriñar los datos porque se requierede la amplitud que exista entre ellos. La amplitud de la variable no es más que la diferenciaexistente entre el valor más bajo (XS) y el valor más alto (XL). Su símbolo es una R.
R = XL- XS
2. Numero de clases o intervalos: cálculo de la cantidad de intervalos a utilizar se realiza en funcióndel total de elementos o sujetos en la distribución, ya sea una población (N) o bien una muestra (n),apoyándose en la fórmula de Sturgess. Su símbolo es una K.
K = 1 + 3.322 X (log N)
Los valores 1 y 3.322 son constantes en la fórmula.
3. Amplitud de los intervalos o clases: Para calcular la amplitud que deberán tener los intervalos serequiere de los resultados obtenidos en los dos pasos anteriores. Su símbolo es una i.
Variable
Cuantitativa
Se clasificanen
continua
Se da cuandolos valoresnúmericos
que forman la variable en un
intervalocualquiera
son infitinos.
discreta
Es la variablecuyos valoresnúmericos se
pueden contaro son finitos en
un intervalocualquiera.
Tabular
Serie Simple
Distribucion simple de
frecuencias
Distribucion enclases o
Inertervalosde clase
En formaGráfica
Histograma
Ovijade
Galton
Polígono defrecuencias
8/16/2019 Resumen Final de Estadística
5/23
Límites
Límites de clase:Luego de haber calculado el No. de clases y la amplitud de las mismas, se procede a laelaboración de los intervalos o clases. Es recomendable iniciar con el valor más bajo de los datospara luego se va sumando la amplitud de intervalo calculada (i) para ir formando las clases.
Límites AparentesLos límites de una clase son aparentes cuando éstos no permiten espacio entre un límite y otro, los
Intervalos han sido elaborados en forma continua.
Límites Absolutos
Si hay espacio entre los límites. Los intervalos en forma discreta.
Límites realesSe calculan imites reales si los intervalos han sido elaborados en forma discreta y se requiere sucontinuidad.
LS (i): límite superior de la clase (i)LI (i + 1): límite inferior de la clase siguiente (i+1)
Para calcular los límites reales realizamos lo siguiente:
150 -155
155- 160 Si nos dieran los datos 155 iría aquí.
160- 165 160 va aquí.
13- 19
20-26
27- 36
Edad f
13- 19 620-26 9
27- 36 8
Edad f
12.5- 19.5 6
19.5-26.5 9
26.5- 36.5 8
8/16/2019 Resumen Final de Estadística
6/23
Frecuencia Absoluta Frecuencias RelativaFrecuenciaacumulada
Marca de Clase
Es el número de vecesque aparece undeterminado valor.Se simboliza con una f o fi.La suma de lasfrecuencias absolutas dacomo resultado el total dedatos que corresponde altamaño de la muestra (n)o de la población (N) quese estudia.
Es el cociente entre unafrecuencia absoluta y elnúmero total de losdatos.Se simboliza con una fr.La frecuencia relativatambién puedemultiplicarse por 100para expresarla enporcentaje.
Es la sumaacumulativa, de lasfrecuencias absolutas.Se simboliza con unafa.
Se conoce tambiéncomo punto medio, es elvalor que representa acada clase y se localiza justo al centro delintervalo.
Edades Recuento f fa Limites Reales mc fr fra
55-5859-6263-6667-70
IIIII IIIIIII II
IIIII IIIII IIIII IIIIII IIIII IIII
771614
7143044
54.5 -58.558.5 – 62.562.5 – 66.566.5 – 70.5
56.560.564.568.5
0.160.160.360.32
0.160.320.681
Total 44 1
GráficasHistograma:
Intervalos deamplitud
Constantes Se llama así porque la separación
o distancia entre límite inferior y superior de cada clase es
siempre el mismo.
Variable
En una distribución los intervalos son de amplitud variable cuandola distancia entre límite inferior y
límite superior varía de una clasea otra.
Se utiliza cuando los valores de ladistribución que se está
estudiando están muy dispersos,por lo que al agruparlos con
intervalos constantes, algunosquedarían con frecuencia de
cero.
05
1015
F r e c u e n c i a
Limites Reales
Histograma
8/16/2019 Resumen Final de Estadística
7/23
Poligono de Frecuencia:
Ojiva de Galton:
Medidas de punto
0
5
10
15
Medidas
de punto
Proporciones
Una proporción es larelación o
comparación entredos grupos, uno es una
parte del todo y el otroes el total o universo.
P= =
Razones
Una razón es la relación ocomparación que se hace
entre dos grupos diferentes,que pueden ser de igual o
diferente naturaleza, paradeterminar si ellas son igualeso si una es mayor que la otra.
C = total del primer grupo
d = total del segundo grupo
k = es una base, una unidad seguida de ceros (10, 1000,
etc.).
Porcentajes
Un porcentaje es unaproporción
multiplicada por cien.
Marca de clase
F r e c u e n c i a
Limites Reales
F r e c u e n c i a s
a c u m u l a
d a s
Por cada K del segundogrupo d hay Resultado deltotal del primer grupo C.
8/16/2019 Resumen Final de Estadística
8/23
Medidas de tendenciacentral Media (µ,x)
Es el valor promedio de los datos, es la medida de tendencia central más importante, debido a la
representatividad que posee los datos de la variable en estudio. Su uso es adecuado cuando lasdistribuciones son simétricas o aproximadas a la forma normal.
Datos agrupados en frecuencias Datos agrupados en intervalos
∑ ∑
Mediana (Me) Identifica el valor que se encuentra en el centro de los datos. Es decir que nos permite separa por la mitad unconjunto de datos. También es llamado valor medio. Como primer paso se ordenan los datos de menor amayor. Es adecuado utilizarla cuando una distribución se aparta de lo normal (distribuciones sesgadas).
Datos agrupados en frecuencias Datos agrupados en intervalosPosición (n)
Si la serie es par, el valor de la medianase calcula con el promedio de los dosvalores centrales dividido dos.
( ⁄ )
Moda (Mo) Es aquel valor que tiene la frecuencia mayor o es el valor particular que ocurre más frecuente quecualquier otro. Es la medida de tendencia central menos confiable. Su utilización es prioritariamentecon datos cualitativos.
Medidas
Descriptivas
medidas de tendencia
central
media
mediana
moda
medidas deposición
cuartiles
deciles
percentiles
medidas dedisperción
desviaciónestandar
varianza
coheficiente de variación
8/16/2019 Resumen Final de Estadística
9/23
Datos agrupados en frecuencias Datos agrupados en intervalosEl dato con mayor frecuencia.
Se tiene una muestra con los valores: 1,2,4,4,3,7,2,4,3,2,5 y 2.
1,2,2,2,2,3,3,4,4,4,5,7Mo= 2
Se tiene una muestra con valores 20, 20, 23, 24, 25, 25, 26 y 30.
Mo= 20 y 25, se dice que es bimodal.
= fmayor- fanterior= fmayor- fposteior
Medidas de PosiciónEstos valores son de la misma familia de la mediana, por lo que para calcularlos en las distribuciones de datosagrupados en intervalos podemos utilizar la fórmula de la mediana, solo que el total de los datos en lugar dedividirlo dentro dos, lo dividimos dentro de 4 para los cuartiles, entre 10 para los deciles y entre 100 para lospercentiles o centiles.
Cuartiles (Qk)Los cuartiles dividen los datos en cuatro partes iguales. Cada una de las partes representa una cuarta parte, o
el 25% de las observaciones. El segundo Cuartil equivale a la mediana.Q4 NOEXISTE! (se dividen en 4 pero son 3)
Valor Q1: 25% bajo ese valor75% sobre ese valor
Valor Q2: 50% bajo ese valor
50% sobre ese valor
Valor Q3: 75% bajo ese valor25% sobre ese valor
Deciles (Dk)Los deciles dividen los datos en 10 partes iguales. El quinto decil equivale a la mediana.
Percentiles o Centiles (Pk/Ck) Los deciles dividen los datos en 100 partes iguales.
Arreglo Simple Datos Agrupados
Arreglo Simple Datos Agrupados
Arreglo Simple Datos Agrupados
La mediana es igual al cuartil segundo, decil quinto y centil 50
Me = Q2 = D5 = C50El cuartil primero es igual al centil 25
Q1 = C25El cuartil tercero es igual al centil 75
Q3= C75El Decil primero es igual al centil decimo.
D1 = C10
8/16/2019 Resumen Final de Estadística
10/23
Medidas de DispersiónMide la dispersión de los datos con respecto a la media la distribución es simétrica entoncesmedia=moda=mediana; Las medidas más utilizadas son: rango, varianza, desviación estándar y coeficientede variación.
Rango, Recorrido o AmplitudMide la extensión total de un conjunto de datos y se calcula utilizando únicamente dos números.
R = medición más grande (XL) – medición más pequeña (Xs)
Varianza o Variancia Cuantifica la variabilidad de los datos respecto al valor de la media elevada al cuadrado. La varianza para lamuestra se representa mediante una s² y la notación para población σ ².
Datos no agrupadosde una muestra
Datos agrupados deuna muestra
Datos no agrupados deuna población
Datos agrupados deuna población
∑̂
∑ ̂
∑
∑
Desviación Estándar o Desviación TípicaEs la raíz cuadrada de la varianza. Los símbolos son s si es una muestra y población σ si es una población.
Coeficiente de variabilidad Se usa para comparar la variabilidad entre dos o más muestras medidas en las mismas unidades o no. Losdatos que se expresan en porcentaje en la cual se compara la desviación estándar con el respectivo valor de
promedio de los datos.
̂
Regresión y CorrelaciónRegresión LinealConsiste en determinar un modelo lineal que sea capaz de poder realizar estimaciones a través del tiempo. En un modelode regresión lineal simple, solo existen dos tipos de variables, la variable independiente y la variable dependiente.
La ecuación general del modelo de regresión simple es la siguiente:
La pendiente de la recta puede ser positiva o negativa, si es positiva se dice que la relación esdirectamente proporcional (si X aumenta, Y también). En caso contrario si es negativa es inversamenteproporcional (si X aumenta, Y disminuye).
La pendiente de la recta indica el cambio por cada unidad de medida por cada variableindependiente.
Variable
dependiente
Independiente
Pendiente dela rectaIntersección
con eje y.
8/16/2019 Resumen Final de Estadística
11/23
Coeficiente de correlación: Se utiliza para medir la intensidad de la variable independiente con ladependiente, este coeficiente determina si existe buena, regular o mala relación entre las variables.
Diagrama de dispersión: Sirve para graficar los puntos en parejas ordenadas de la variabledependiente con la independiente. A través de él se puede observar el tipo de pendiente de la recta,si la relación va ser directa o inversa y puede observarse también que tan diversos están los puntos.
Conjuntos
Universo: conjunto que contiene todos los elementos.
Elemento: objeto, animal o cosa que forma parte de un conjunto. Subconjunto: conjunto contenido en otro conjunto. Diagrama de Venn: Forma gráfica de representar un conjunto.
Teoría de la probabilidad
Probabilidad de un Evento
Probabilidad Marginal: Se tiene interés en un solo un evento. P=
Conjuntos
Es un grupo de elementos uobjetos especificos en tal
forma que se puede afirmar sicualquier objeto dado
pertenece o no a laagrupación.
Formas derepresentarlos
enumerativa
{a,e,i,o,u}
descriptiva
{las vocales}
gráfica
Tipos deconjuntos
Finitos: que sepueden contar
Infinitos: no sepueden contar.
Vacios: noexisten, estan vacios.
Operacionesentre
conjuntos
Unión
Es laagrupacion de
dos o másconjuntos.
Intersección
Es laagrupación delos elementos
en común.
Probabilidad
Probabilidad subjetiva Probabilidad objetiva
Clasica o apriori
Puede calcularse sinnecesidad de buscar o
esperar datos.
Relativa o A posteriori
Se necesitaexperimentar o probar
antes.
P=
a eui o
X= Evento
de interés
8/16/2019 Resumen Final de Estadística
12/23
-0.79 0.54
Z=0.54 ⇨ 0.7054Z=-0.79⇨ 0.21480.7054 - 0.2148= 0.4906
Probabilidad Conjunta: Se tiene interés en dos eventos al mismo tiempo, en una tabla es una
intersección.
Probabilidad de dos eventos mutuamente excluyentes: Es la probabilidad de que ocurra uno u otro de
dos eventos mutuamente excluyentes.
Mutuamente excluyentes: que no pueden ocurrir al mismo tiempo. Probabilidad de dos eventos NO mutuamente excluyentes: Es aquella en la cual se desea saber la
probabilidad de que ocurra uno u otro de dos eventos no mutuamente excluyentes.
No mutuamente excluyentes: pueden estar presentes al mismo tiempo.
Probabilidad condicional: No utiliza al universo como denominador. El numerador es el número de
veces que aparece el evento de interés con la característica condicionante, y como denominador el
total de la característica condicionante.
Probabilidad de dos eventos independientes: Se calculan dos probabilidades, una marginal y una
condicional, si el resultado obtenido es el mismo esto quiere decir que las variables son independientes
si el resultado es diferente existe relación entre las mismas.
Distribución Normal Es simétrica
µ = 0 y µ ± 1 ⇨ 68%µ ± 2 ⇨ 95%µ ± 3 ⇨ 91%
Encuentre el área bajo la curva entre z=0 y z=1.5
La campana se toma como 1.
Para Z=1.5 ⇨ 0.9332 (ver Tabla) Para Z=0 ⇨ 0.50000.9332- 0.5000 = 0.4332
P ( -0.79
8/16/2019 Resumen Final de Estadística
13/23
0 0.72
Z=0.72 ⇨ 0.76421 - 0.7642= 0.2358
o busco -0.72
0-Z1
1 – 0.8944= 0.1056 (cola)
Z1= -1.25
Por definición cuando “Z es igual a n número” o es igual a “-n”, es igual a 0.
P (Z>0.72)
P (Z>Z1)= 0.8944
P (Z= 2) = 0
Aplicación de la DistribuciónNormal Estándar
La distribución normal estándar se aplica a cualquier problema de distribución normal. Para cambiar el eje “x”
por el eje “z” se realizara a través de la siguiente formula.
La fórmula anterior puede ser utilizada únicamente con poblaciones.
En un estudio sobre niveles de glucosa, en una población de 276 recién nacidos,
se encontró un promedio de 82mg/dl y una desviación estándar de 6,2mg/dl.
Suponiendo que los datos se distribuyen normalmente, determine lo siguiente:
a. Probabilidad de escoger al azar a un recién nacido con glicemia menor de
80mg/dl
P (Z0.48) = 0.6844
1-0.6844 = 0.3156
Eje “x”
Desviación estándar
Media
8/16/2019 Resumen Final de Estadística
14/23
c. El porcentaje de recién nacidos con nivel de glicemia menor a 74mg/dl.
-1.29 = 0.09850.0985*100 = 9.85%
d. El número de recién nacidos con nivel de glicemia de 82mg/dl o más asciende a.
276*0.5= 138
e. La probabilidad de escoger un recién nacido que tenga los valores de glicemia entre 79.51
y 84.49mg/dl.
-0.40 ⇨ 0.3446
0.40 ⇨ 0.6554P (-0.40
8/16/2019 Resumen Final de Estadística
15/23
Cantidad de Posibilidades en el Muestreo
Muestreo con reemplazo
Numero de formas = Muestreo sin reemplazo
Numero de formas = Calculadora = Shift (nCr)
Estimación de MediasDatos ≥ 30 ⇨ Se trabaja con distribución normal.Datos < 30 ⇨ Se trabaja con t- student
Se reunieron 31 datos referentes al peso del salón 322. Calcule el promedio y la
desviación de la µ (media poblacional) a través de un intervalo con un nivel deconfianza del 95%.
159, 150, 198,180, 130, 165, 205, 130, 140, 101, 115, 115,128, 200, 208, 186, 117, 182, 170, 105, 127,128,150, 100, 129, 100, 137,118, 170, 101.
̂= 140.23lbsS = 33.7 lbs.
NC=95%
= significancia=5% = 0.05= 0.0250 = 0.975Z= 0.975 ⇨ 1.96
̂ ̂ : Estimador puntual z: coeficiente de confiabilidad
̂ : Error Estándar
140.23± (1.96) (√ )140.23 + 11.86= 152.09140.23 – 11.86 = 128.37
÷
[128.37 – 152.09]
Interpretación: Con el 95% de confiabilidad se
puede decir que la media del peso de los
estudiantes del salón 322 se encuentra entre
[128.37 – 152.09]
8/16/2019 Resumen Final de Estadística
16/23
̂ ̂ ̂
√
̂ ⇨ ̂ ⇨ > 0.05 ⇨ Si utiliza factor de corrección (FC) ≤ 0.05 ⇨ No utiliza Factor de Corrección
Factor de corrección (FC)
Afecta al ̂ (Error estándar)
̂ √ En una muestra de 144 pacientes se determinó el valor medio de la presión,
el cual corresponde a 18mmhg. Si determino que la varianza de lapoblación es de 4. Determine lo siguiente.
a. El error estándar ̂ √ b. El coeficiente de confiabilidad para un nivel de confianza de 90%
NC= 90% Z (1-0.05) = z0.95 = 1.645
c. Construya un intervalo de confianza con una significancia 7.40% 0.370 = 1-0370 =0.963 ⇨ Busco el áreaZ= 0. 1.79
Coeficiente deconfiabilidad
EstimadorPuntual
ErrorEstándar
- Precisión- Máximo error d
Estimación- Error
8/16/2019 Resumen Final de Estadística
17/23
d. Si existe una población de sujetos de estudios equivalente a 600. Encuentre el errorestándar.
18 ± (1.79) (0.17)
18 + 0.39 = 18.3018 – 0-39 = 17.7[17.7 – 18.30] mmHg
e. Encuentre el máximo error de estimación (con la población y sin la población) N=600
̂
̂ o Sin la población (1.79)(0.17) = 0.30o Con la población (1.79)(0.15) 0.27
Distribución “t- student” Criterio para usar z o t
̂ ̂
z
muestragrande
s
muestrapequeña
tmuestragrande s
EstándarPuntual
Error Estándar
Coeficiente de confiabilidad
Con un nivel de confianza de 92% se puede concluir que la media de la
población (µ) se encuentra entre [17.7 – 18.30] mmHg
Población
Muestra
Todo lo contrario es “z”
Coeficiente deconfiabilidad
EstimadorPuntual
ErrorEstándar
8/16/2019 Resumen Final de Estadística
18/23
Se tomó una muestra de 16 niños recién nacidos a los cuales se les determino la
concentración media de bilirrubina en el suero. El valor de la concentración media es dê=5.98mg/100cc con una desviación de 3.5mg/100cc a. ¿Cuál es el valor del estimador puntual?
La media de la muestra es el estimador puntual!
5.98mg/100cc
b. ¿Cuál es el valor del coeficiente de confiabilidad?
5% 0.3250 = 1-03250=0.975 ⇨ busco el áreaCoeficiente de confiabilidad =2.1315
c. ¿Cuál es el valor de error estándar?
√ d. Construya un intervalo de confianza con una significancia igual al 5%
5.98± (2.1315)(0.875)
5.98+1.87 = 7.85
5.98-1.87= 4.11
e. Construya un intervalo de confianza con un nivel de confianza de 90%
5.98± (1.7530)(0.875)
5.98+1.53 = 7.51
5.98-1.53= 4.45
⇨ busco el área
n=16
n-1 =15
Grados de libertad (gl) =15
Con 95% de confiabilidad se puede concluir que la media de la población(µ) se encuentra entre [4.11 – 7.85] mg/100cc
Con 90% de confiabilidad se puede
concluir que la media de la población (µ)
se encuentra entre [4.45 – 7.51] mg/100cc
8/16/2019 Resumen Final de Estadística
19/23
AmplitudDimensión
Intervalo de confianza parala proporción de unapoblaciónSe utilizara z para los intervalos de proporción. Si tiene la población y muestra deberá calcular
para determinar si es mayor de 0.05 y utilizar factor de corrección.
En una muestra aleatoria simple de 125 varones desempleados, expulsados todos ellos de laescuela preparatoria, entre las edades de 16 - 21 años inclusive 88 de ellos declararon queeran consumidores de bebidas alcohólicas, construya un intervalo de confianza de 95% parala proporción de la población.N=125n=88NC= 95% ⇨ z=1.96 0.704 ± (1.96) (0.04)
0.704+ 0.0784 =0.78240.704- 0.0784 = 0.6256
Tamaño de Muestra
D = 2 d d= Población InfinitaMedias
Población FinitaMedias
Coeficiente deconfiabilidad
EstimadorPuntual
ErrorEstándar
Con el 95% de confiabilidad se puede concluir que la se encuentra entre [0.63 – 0.78]
Proporciones
Proporciones
q =1-p p=
8/16/2019 Resumen Final de Estadística
20/23
Prueba de Hipótesis
Cuando se rechaza la nula, se acepta la alterna. Cuando se acepta la alterna se dice que es “Estadísticamente significativo”.
Z calculada √ ⁄ Z crítico= 1- o Prueba de Hipótesis para la media de una población (µ): Para realizar una prueba
de hipótesis se recomienda seguir un procedimiento ordenado.
Condición de la hipótesis
Acción Posible
Verdadera Falsa
No rechaza Ho Acción Correcta Error tipo II
Rechazar Ho Error tipo I Acción correcta
Prueba dehipótesis
Desde el punto de vistaestadístico una hipótesis
es una suposición dealgo que se supone
referente a una muestrao población.
Las hipótesisestadísticas se
dividen en
Alterna (Ha)
es la que elinvestigador
supone.
Nula (Ho) Es la contraparte dela alterna o bien laque se presume o
carácteristicaestudiada.
Paso 1.
Datos
Paso 2
Planteamientode hipótesis
Paso 3
Regla dedecisión
Paso 4
EstadísticoCálculado
Paso 5
Decisión
Paso 6
Conclusión
Error
Tipo I
Este error se conoce también
como Error alfa. Alfa (α
) es laprobabilidad de cometer unError tipo I
Tipo II
La probabilidad decometererror tipo II es el valor de Beta, se llama Error tipo β o error de
aceptación.
8/16/2019 Resumen Final de Estadística
21/23
No RechazarHo.
Se desea saber si es posible concluir que el consumo medio diario de calorías de la
población rural de un país en desarrollo es de menos de 2000. Una muestra de 500
individuos produjo un consumo medio de 1985 y una desviación estándar de 210. Alfa
de 0.05
Paso 1 (Datos)
n=500
x=1985
s= 210 Paso 2 (Planteo de hipótesis)
Ho: µ≥ 2000
Ha: µ z crítico
No rechaza Ho
Paso 6 (Conclusión)
Con un 95% se concluye que la media calórica de la población rural de un país en
desarrollo es mayor o igual que 2000.
Estadístico “P” – PruebaEn toda prueba de hipótesis el estadístico “p” nos permite comparar la proporción de “p” con
la significancia para poder tomar la decisión final.
Condición general
P ≤ ⇨ Rechaza HoP > ⇨ No Rechaza Ho
El valor de P, viene de z calculado
Z crítico
8/16/2019 Resumen Final de Estadística
22/23
Supuesta población
qo= 1-po
Población
estimada
Prueba de Hipótesis (t-student)
t calculada √ ⁄ t crítico= Unilateral ⇨
Bilateral ⇨ ⁄ Prueba de hipótesis para la proporción de una población
̂
Prueba de independencia(ji- cuadrado)
Se puede establecer la asociación o relación que existe entre dos
variables cualitativas.
Todos los pasos de la prueba de hipótesis son iguales excepto el de
estadístico calculado.
Cuando las variables cualitativas son dipotómicas (2 categorías) los
cuadros de contingencia son de “2x2”
Primero criterio Clasificación
1 2 Totales
Segundo Criterio 1 A B A+B
Clasificación 2 C D C+D
A+C B+ D n
Para calcular el estadístico de prueba para una tabla de contingencia
de 2x2.
Para buscar el valor de Ji – crítico en la tabla se hace a través de los
grados de libertad (gl). Y el valor de la significancia.
gl= (número de filas -1) (número de columnas -1)
gl= 1 ⇨ tablas de 2x2.Si Ji calculado > ji critico Se rechaza Ho
8/16/2019 Resumen Final de Estadística
23/23
Valores Esperados
Valores Observados
Cantidad de elementos dentro la matriz
Son unilaterales a la derecha únicamente.
La distribución no es simétricaEs significativa cuando se rechaza la hipótesis nula (Existe relación).
Prueba de Ji- cuadrado
matriz mayor 2x2Todos los pasos de la prueba de hipótesis son iguales excepto el de
estadístico calculado.
Se utiliza la siguiente fórmula para el cálculo del estadístico de prueba.
∑
Oi Ei Oi- Ei (Oi-Ei)² (Oi-Ei)² / Ei
Valorobservado
Ei =
Al valor observado sele resta el resultado
de la operaciónanterior.
El resultado loelevamos al
cuadrado
El resultado en lacasilla anterior, divido
lo de la segunda.