Resumen Final de Estadística

Embed Size (px)

Citation preview

  • 8/16/2019 Resumen Final de Estadística

    1/23

    o

    e

    s

    a

    d

    s

    c

    a

     

    Estudia Variables Se Clasifican en

    Cualitativas

    Formas deRepresentación

     Tabular

    Gráfica

     Descriptivas Mediasde punto

     Inferencial Ji - cuadrado

    Cuantitativas

    Formas deRepresentación

     Tabular

    Gráfica

     Descriptiva

    Medidas de tendencia central

    Medidas de punto

     Inferencial Pruebas de

    hipótesis.

    Variables

    Cualitativa

    Escalas

    Ordinal

     Permiteestablecer

    relaciones de tipo "mayor que"

    o "menor que"

    Nominal

    medidas que nospermite

    identificar sujetos como

    "iguales" o"diferentes".

    Cuantitativa

    Escalas

    Razón

    Ocupa el nivel masalto de la escala,

    posee un 0 absolutoque indica ausencia

     total de lacarácterisitica.

     Intervalo

    Conocer ladistancia entredos mediciones

    cualesquiera.

     Posee un crelativo, u

    cero no verdader

  • 8/16/2019 Resumen Final de Estadística

    2/23

      Parámetro ⇨  Medida calculada a partir de una población.

      Estadístico ⇨  Medida calculada a partir de una muestra.Estadística Inferencial Estadística Descriptiva

      Permite sacar conclusiones generales de

    una población, basándose en los datosde una muestra.   Ayuda a conocer algunos aspectos de la

    población mediante el conocimiento deciertos aspectos de la muestra. 

      Pueden medirse los valores específicos delfenómeno colectivo o variable en estudio. 

     

    Formas para organizar y reducir el volumen dedatos. Se apoya en: -  Tablas-  Gráficas-  Medidas numéricas de resumen.-  Medidas de tendencia Central.

    Variable Cualitativa

    Partes de una Tabla

    CUADRO No. 1GRUPO DE PACIENTES MASCULINOS MAYORES DE 15 AÑOS DE LA CLÍNICA “LA OBSCURIDAD”GUATEMALA 2013

    (Solo se tomaron en cuenta a los pacientes más frecuentes)

    Hombres 15 -25 Hombres 26 -35 Hombres 36-45 Total

    Se droga 20 15 10 45

    No se droga 30 15 15 60

    total 50 30 25 105

    Nota: los datos están actualizados respecto a la fecha indicadaFuente: Clínica

    Presentación

    de datos de

    variables

    cualitativas

    En Formaescrita

    Proposito

    General:

    Elaboradoscomo fuente

    deinformacion

    estadistica.Usualmente tienen grancantidad de

    datos.

    Proposito

    Especifico:

    Elaboradoscon fin deanalisis y

    cálculo.

     Tabular En forma Gráfica

     Diagrama deBarras

     Simples

    GráficaBidireccional

     Pie

    Cuadro deAsociacion dedoble entrada

    Barras

     Segmentadas

    Gráfica de Datos

    Agrupados

    # De

    Cuadro

    Título En

    Mayúscula

    Nota de encabezado

    Cuerpo del

    cuadro

  • 8/16/2019 Resumen Final de Estadística

    3/23

    GráficasBarras Simples : Excelentes para las distribuciones simples de frecuencias, a escala cualitativa. Se puede utilizar

    cifras absolutas o cifras relativas. 

    Gráfica Bidireccional : Dos direcciones, puede comparar variables, se puede representar en porcentaje, se

    utiliza la misma escala en dos sentidos y esta parte de la linea 0.

    Diagrama de Sectores (Pie): Tamaño relativo de los componentes de un total, presentaciones populares. Se

    puede presentar en cifras relativas y absolutas.

    Barras Agrupadas: Es muy útil para datos de asociación, permite la comparación de las variables. (Identificar

    componentes. Espacio, Claridad y Simplicidad).

    Barras Segmentadas: La información va segmentada, es usado para representar datos de asociación. Se

    coloca la información seguida de otra, presenta la dificultad de no ser tan clara. Es conveniente no usar más

    de tres variables.

    Cuadro asociación de doble entrada: doble variables, todos los datos del encabezado se escriben en

    mayúscula. Puede ser utilizado para la realización de una gráfica.

    Hombres Mujeres Total 

    Fuma  75 15 90

    No Fuma  25 85 110

    total  100 100 200

  • 8/16/2019 Resumen Final de Estadística

    4/23

    Variable Cuantitativa

      Serie Simple ⇨Consiste en ordenar ascendente o descendente los datos en una tabla. Se manejacuando se obtienen menos de 30 datos.

      Distribución simple de frecuencias ⇨ En la columna I se ponen los datos de la variable y en la segunda

    la frecuencia del mismo. Se maneja cuando se obtienen de 30 a 50 datos.

      Distribución en clases o intervalos de clase ⇨ Consiste en agrupar los datos en clases o intervalos;

    acompañados de sus respectivas frecuencias. Para elaborar una Distribución en Intervalos de Clase esnecesario establecer el número de clases o intervalos a utilizar así como la amplitud que tendrán

    dichos intervalos. Se maneja cuando se obtienen más de 60 datos.

    1.  Rango, Recorrido o Amplitud de la variable: es necesario escudriñar los datos porque se requierede la amplitud que exista entre ellos. La amplitud de la variable no es más que la diferenciaexistente entre el valor más bajo (XS) y el valor más alto (XL). Su símbolo es una R.

    R = XL- XS

    2.  Numero de clases o intervalos: cálculo de la cantidad de intervalos a utilizar se realiza en funcióndel total de elementos o sujetos en la distribución, ya sea una población (N) o bien una muestra (n),apoyándose en la fórmula de Sturgess. Su símbolo es una K. 

    K = 1 + 3.322 X (log N)

    Los valores 1 y 3.322 son constantes en la fórmula.

    3.  Amplitud de los intervalos o clases: Para calcular la amplitud que deberán tener los intervalos serequiere de los resultados obtenidos en los dos pasos anteriores. Su símbolo es una i.

     

    Variable

    Cuantitativa

     Se clasificanen

    continua

     Se da cuandolos valoresnúmericos

    que forman la variable en un

    intervalocualquiera

     son infitinos.

    discreta

    Es la variablecuyos valoresnúmericos se

    pueden contaro son finitos en

    un intervalocualquiera.

     Tabular

     Serie Simple

     Distribucion simple de

    frecuencias

     Distribucion enclases o

     Inertervalosde clase

    En formaGráfica

     Histograma

    Ovijade

    Galton

     Polígono defrecuencias

  • 8/16/2019 Resumen Final de Estadística

    5/23

    Límites

      Límites de clase:Luego de haber calculado el No. de clases y la amplitud de las mismas, se procede a laelaboración de los intervalos o clases. Es recomendable iniciar con el valor más bajo de los datospara luego se va sumando la amplitud de intervalo calculada (i) para ir formando las clases.

      Límites AparentesLos límites de una clase son aparentes cuando éstos no permiten espacio entre un límite y otro, los

    Intervalos han sido elaborados en forma continua.

      Límites Absolutos

    Si hay espacio entre los límites. Los intervalos en forma discreta.

      Límites realesSe calculan imites reales si los intervalos han sido elaborados en forma discreta y se requiere sucontinuidad.

     LS (i): límite superior de la clase (i)LI (i + 1): límite inferior de la clase siguiente (i+1)

    Para calcular los límites reales realizamos lo siguiente:    

    150 -155

    155- 160 Si nos dieran los datos 155 iría aquí.

    160- 165 160 va aquí.

    13- 19

    20-26

    27- 36

    Edad f

    13- 19 620-26 9

    27- 36 8

    Edad f

    12.5- 19.5 6

    19.5-26.5 9

    26.5- 36.5 8

  • 8/16/2019 Resumen Final de Estadística

    6/23

     

    Frecuencia Absoluta Frecuencias RelativaFrecuenciaacumulada

    Marca de Clase

    Es el número de vecesque aparece undeterminado valor.Se simboliza con una f o fi.La suma de lasfrecuencias absolutas dacomo resultado el total dedatos que corresponde altamaño de la muestra (n)o de la población (N) quese estudia.

    Es el cociente entre unafrecuencia absoluta y elnúmero total de losdatos.Se simboliza con una fr.La frecuencia relativatambién puedemultiplicarse por 100para expresarla enporcentaje.

    Es la sumaacumulativa, de lasfrecuencias absolutas.Se simboliza con unafa.

    Se conoce tambiéncomo punto medio, es elvalor que representa acada clase y se localiza justo al centro delintervalo.

     

    Edades Recuento f fa Limites Reales mc fr fra

    55-5859-6263-6667-70

    IIIII IIIIIII II

    IIIII IIIII IIIII IIIIII IIIII IIII

    771614

    7143044

    54.5 -58.558.5 –  62.562.5 –  66.566.5 –  70.5

    56.560.564.568.5

    0.160.160.360.32

    0.160.320.681

    Total 44 1

    GráficasHistograma:

     Intervalos deamplitud

    Constantes Se llama así porque la separación

    o distancia entre límite inferior y superior de cada clase es

     siempre el mismo.

    Variable

    En una distribución los intervalos son de amplitud variable cuandola distancia entre límite inferior y

    límite superior varía de una clasea otra.

     Se utiliza cuando los valores de ladistribución que se está

    estudiando están muy dispersos,por lo que al agruparlos con

    intervalos constantes, algunosquedarían con frecuencia de

    cero.

    05

    1015

       F   r   e   c   u   e   n   c   i   a 

    Limites Reales

    Histograma

  • 8/16/2019 Resumen Final de Estadística

    7/23

    Poligono de Frecuencia:

    Ojiva de Galton:

    Medidas de punto

    0

    5

    10

    15

    Medidas

    de punto

     Proporciones

    Una proporción es larelación o

    comparación entredos grupos, uno es una

    parte del todo y el otroes el total o universo.

     P=  = 

    Razones

    Una razón es la relación ocomparación que se hace

    entre dos grupos diferentes,que pueden ser de igual o

    diferente naturaleza, paradeterminar si ellas son igualeso si una es mayor que la otra.

       C = total del primer grupo

    d = total del segundo grupo

    k = es una base, una unidad seguida de ceros (10, 1000,

    etc.).

     Porcentajes

    Un porcentaje es unaproporción

    multiplicada por cien.

    Marca de clase

       F  r  e  c  u  e  n  c   i  a

    Limites Reales

       F  r  e  c  u  e  n  c   i  a  s

      a  c  u  m  u   l  a

       d  a  s

    Por cada K del segundogrupo d hay Resultado deltotal del primer grupo C. 

  • 8/16/2019 Resumen Final de Estadística

    8/23

     

    Medidas de tendenciacentral  Media (µ,x)

    Es el valor promedio de los datos, es la medida de tendencia central más importante, debido a la

    representatividad que posee los datos de la variable en estudio. Su uso es adecuado cuando lasdistribuciones son simétricas o aproximadas a la forma normal.

    Datos agrupados en frecuencias Datos agrupados en intervalos

    ∑   ∑  

      Mediana (Me) Identifica el valor que se encuentra en el centro de los datos. Es decir que nos permite separa por la mitad unconjunto de datos. También es llamado valor medio. Como primer paso se ordenan los datos de menor amayor. Es adecuado utilizarla cuando una distribución se aparta de lo normal (distribuciones sesgadas).

    Datos agrupados en frecuencias Datos agrupados en intervalosPosición (n)

     Si la serie es par, el valor de la medianase calcula con el promedio de los dosvalores centrales dividido dos. 

    ( ⁄ )    

      Moda (Mo) Es aquel valor que tiene la frecuencia mayor o es el valor particular que ocurre más frecuente quecualquier otro. Es la medida de tendencia central menos confiable. Su utilización es prioritariamentecon datos cualitativos.

    Medidas

    Descriptivas

    medidas de tendencia

    central

    media

    mediana

    moda

    medidas deposición

    cuartiles

    deciles

    percentiles

    medidas dedisperción

    desviaciónestandar

     varianza

    coheficiente de variación

  • 8/16/2019 Resumen Final de Estadística

    9/23

    Datos agrupados en frecuencias Datos agrupados en intervalosEl dato con mayor frecuencia.

      Se tiene una muestra con los valores: 1,2,4,4,3,7,2,4,3,2,5 y 2.

    1,2,2,2,2,3,3,4,4,4,5,7Mo= 2

      Se tiene una muestra con valores 20, 20, 23, 24, 25, 25, 26 y 30.

    Mo= 20 y 25, se dice que es bimodal. 

     = fmayor- fanterior= fmayor- fposteior

    Medidas de PosiciónEstos valores son de la misma familia de la mediana, por lo que para calcularlos en las distribuciones de datosagrupados en intervalos podemos utilizar la fórmula de la mediana, solo que el total de los datos en lugar dedividirlo dentro dos, lo dividimos dentro de 4 para los cuartiles, entre 10 para los deciles y entre 100 para lospercentiles o centiles.

    Cuartiles (Qk)Los cuartiles dividen los datos en cuatro partes iguales. Cada una de las partes representa una cuarta parte, o

    el 25% de las observaciones. El segundo Cuartil equivale a la mediana.Q4 NOEXISTE! (se dividen en 4 pero son 3)

      Valor Q1: 25% bajo ese valor75% sobre ese valor

      Valor Q2: 50% bajo ese valor

    50% sobre ese valor

      Valor Q3: 75% bajo ese valor25% sobre ese valor

    Deciles (Dk)Los deciles dividen los datos en 10 partes iguales. El quinto decil equivale a la mediana.

    Percentiles o Centiles (Pk/Ck) Los deciles dividen los datos en 100 partes iguales.

    Arreglo Simple Datos Agrupados

         

    Arreglo Simple Datos Agrupados

         

    Arreglo Simple Datos Agrupados

         La mediana es igual al cuartil segundo, decil quinto y centil 50

    Me = Q2 = D5 = C50El cuartil primero es igual al centil 25

    Q1 = C25El cuartil tercero es igual al centil 75

    Q3= C75El Decil primero es igual al centil decimo.

    D1 = C10

  • 8/16/2019 Resumen Final de Estadística

    10/23

    Medidas de DispersiónMide la dispersión de los datos con respecto a la media la distribución es simétrica entoncesmedia=moda=mediana; Las medidas más utilizadas son: rango, varianza, desviación estándar y coeficientede variación.

    Rango, Recorrido o AmplitudMide la extensión total de un conjunto de datos y se calcula utilizando únicamente dos números.

    R = medición más grande (XL) –  medición más pequeña (Xs)

    Varianza o Variancia Cuantifica la variabilidad de los datos respecto al valor de la media elevada al cuadrado. La varianza para lamuestra se representa mediante una s² y la notación para población σ ².

    Datos no agrupadosde una muestra

    Datos agrupados deuna muestra

    Datos no agrupados deuna población

    Datos agrupados deuna población

    ∑̂

     

    ∑   ̂

     

    ∑  

     

    ∑  

     

    Desviación Estándar o Desviación TípicaEs la raíz cuadrada de la varianza. Los símbolos son s si es una muestra y población σ si es una población.

    Coeficiente de variabilidad Se usa para comparar la variabilidad entre dos o más muestras medidas en las mismas unidades o no. Losdatos que se expresan en porcentaje en la cual se compara la desviación estándar con el respectivo valor de

    promedio de los datos.

    ̂  

    Regresión y CorrelaciónRegresión LinealConsiste en determinar un modelo lineal que sea capaz de poder realizar estimaciones a través del tiempo. En un modelode regresión lineal simple, solo existen dos tipos de variables, la variable independiente y la variable dependiente.

    La ecuación general del modelo de regresión simple es la siguiente:  

      La pendiente de la recta puede ser positiva o negativa, si es positiva se dice que la relación esdirectamente proporcional (si X aumenta, Y también). En caso contrario si es negativa es inversamenteproporcional (si X aumenta, Y disminuye).

      La pendiente de la recta indica el cambio por cada unidad de medida por cada variableindependiente.

    Variable

    dependiente

    Independiente

    Pendiente dela rectaIntersección

    con eje y.

  • 8/16/2019 Resumen Final de Estadística

    11/23

    Coeficiente de correlación: Se utiliza para medir la intensidad de la variable independiente con ladependiente, este coeficiente determina si existe buena, regular o mala relación entre las variables.

    Diagrama de dispersión: Sirve para graficar los puntos en parejas ordenadas de la variabledependiente con la independiente. A través de él se puede observar el tipo de pendiente de la recta,si la relación va ser directa o inversa y puede observarse también que tan diversos están los puntos.

    Conjuntos

      Universo: conjunto que contiene todos los elementos.

      Elemento: objeto, animal o cosa que forma parte de un conjunto.  Subconjunto: conjunto contenido en otro conjunto.  Diagrama de Venn: Forma gráfica de representar un conjunto.

    Teoría de la probabilidad

    Probabilidad de un Evento

      Probabilidad Marginal: Se tiene interés en un solo un evento. P=

    Conjuntos

    Es un grupo de elementos uobjetos especificos en tal

    forma que se puede afirmar sicualquier objeto dado

    pertenece o no a laagrupación.

    Formas derepresentarlos

    enumerativa

    {a,e,i,o,u}

    descriptiva

    {las vocales}

    gráfica

     Tipos deconjuntos

    Finitos: que sepueden contar

     Infinitos: no sepueden contar.

    Vacios: noexisten, estan vacios.

    Operacionesentre

    conjuntos

    Unión

    Es laagrupacion de

    dos o másconjuntos.

     Intersección

    Es laagrupación delos elementos

    en común.

     Probabilidad

     Probabilidad subjetiva Probabilidad objetiva

    Clasica o apriori

     Puede calcularse sinnecesidad de buscar o

    esperar datos.

    Relativa o A posteriori

     Se necesitaexperimentar o probar

    antes.

     P= 

    a eui o

    X= Evento

    de interés

  • 8/16/2019 Resumen Final de Estadística

    12/23

    -0.79 0.54

    Z=0.54 ⇨ 0.7054Z=-0.79⇨ 0.21480.7054 - 0.2148= 0.4906

      Probabilidad Conjunta: Se tiene interés en dos eventos al mismo tiempo, en una tabla es una

    intersección. 

      Probabilidad de dos eventos mutuamente excluyentes: Es la probabilidad de que ocurra uno u otro de

    dos eventos mutuamente excluyentes.

    Mutuamente excluyentes: que no pueden ocurrir al mismo tiempo.   Probabilidad de dos eventos NO mutuamente excluyentes: Es aquella en la cual se desea saber la

    probabilidad de que ocurra uno u otro de dos eventos no mutuamente excluyentes.

    No mutuamente excluyentes: pueden estar presentes al mismo tiempo.

      Probabilidad condicional: No utiliza al universo como denominador. El numerador es el número de

    veces que aparece el evento de interés con la característica condicionante, y como denominador el

    total de la característica condicionante.

      Probabilidad de dos eventos independientes: Se calculan dos probabilidades, una marginal y una

    condicional, si el resultado obtenido es el mismo esto quiere decir que las variables son independientes

    si el resultado es diferente existe relación entre las mismas.

    Distribución Normal  Es simétrica

     

    µ = 0 y    µ ± 1  ⇨ 68%µ ± 2  ⇨ 95%µ ± 3  ⇨ 91%

      Encuentre el área bajo la curva entre z=0 y z=1.5

    La campana se toma como 1.

    Para Z=1.5 ⇨ 0.9332 (ver Tabla) Para Z=0 ⇨ 0.50000.9332- 0.5000 = 0.4332

      P ( -0.79

  • 8/16/2019 Resumen Final de Estadística

    13/23

    0 0.72

    Z=0.72 ⇨ 0.76421 - 0.7642= 0.2358

    o busco -0.72

    0-Z1

    1 –  0.8944= 0.1056 (cola)

    Z1= -1.25

    Por definición cuando “Z es igual a n número” o es igual a “-n”, es igual a 0.

      P (Z>0.72) 

      P (Z>Z1)= 0.8944 

      P (Z= 2) = 0

     Aplicación de la DistribuciónNormal Estándar

    La distribución normal estándar se aplica a cualquier problema de distribución normal. Para cambiar el eje “x”

    por el eje “z” se realizara a través de la siguiente formula. 

     

    La fórmula anterior puede ser utilizada únicamente con poblaciones.

    En un estudio sobre niveles de glucosa, en una población de 276 recién nacidos,

    se encontró un promedio de 82mg/dl y una desviación estándar de 6,2mg/dl.

    Suponiendo que los datos se distribuyen normalmente, determine lo siguiente:

    a.  Probabilidad de escoger al azar a un recién nacido con glicemia menor de

    80mg/dl

     P (Z0.48) = 0.6844

    1-0.6844 = 0.3156

    Eje “x” 

    Desviación estándar

    Media

  • 8/16/2019 Resumen Final de Estadística

    14/23

    c.  El porcentaje de recién nacidos con nivel de glicemia menor a 74mg/dl.

     -1.29 = 0.09850.0985*100 = 9.85% 

    d.  El número de recién nacidos con nivel de glicemia de 82mg/dl o más asciende a.

     

    276*0.5= 138

    e.  La probabilidad de escoger un recién nacido que tenga los valores de glicemia entre 79.51

    y 84.49mg/dl.

     -0.40 ⇨ 0.3446  

    0.40 ⇨ 0.6554P (-0.40

  • 8/16/2019 Resumen Final de Estadística

    15/23

    Cantidad de Posibilidades en el Muestreo

    Muestreo con reemplazo

    Numero de formas =  Muestreo sin reemplazo

    Numero de formas =  Calculadora = Shift (nCr)

    Estimación de MediasDatos ≥ 30 ⇨ Se trabaja con distribución normal.Datos < 30 ⇨ Se trabaja con t- student

    Se reunieron 31 datos referentes al peso del salón 322. Calcule el promedio y la

    desviación de la µ (media poblacional) a través de un intervalo con un nivel deconfianza del 95%.

    159, 150, 198,180, 130, 165, 205, 130, 140, 101, 115, 115,128, 200, 208, 186, 117, 182, 170, 105, 127,128,150, 100, 129, 100, 137,118, 170, 101.

    ̂= 140.23lbsS = 33.7 lbs.

    NC=95% 

     = significancia=5% = 0.05= 0.0250 = 0.975Z= 0.975 ⇨ 1.96

    ̂ ̂ : Estimador puntual z: coeficiente de confiabilidad 

    ̂ : Error Estándar  

    140.23± (1.96) (√  )140.23 + 11.86= 152.09140.23 –  11.86 = 128.37

    ÷ 

    [128.37 –  152.09]

    Interpretación: Con el 95% de confiabilidad se

    puede decir que la media del peso de los

    estudiantes del salón 322 se encuentra entre

    [128.37 –  152.09]

  • 8/16/2019 Resumen Final de Estadística

    16/23

    ̂ ̂ ̂

    √  

    ̂   ⇨ ̂ ⇨   > 0.05 ⇨ Si utiliza factor de corrección (FC) ≤ 0.05 ⇨ No utiliza Factor de Corrección 

      Factor de corrección (FC)

       Afecta al ̂ (Error estándar)

    ̂ √       En una muestra de 144 pacientes se determinó el valor medio de la presión,

    el cual corresponde a 18mmhg. Si determino que la varianza de lapoblación es de 4. Determine lo siguiente.

    a.  El error estándar      ̂ √   b.  El coeficiente de confiabilidad para un nivel de confianza de 90% 

    NC= 90%  Z (1-0.05) = z0.95 = 1.645

    c.  Construya un intervalo de confianza con una significancia 7.40%     0.370 = 1-0370 =0.963 ⇨ Busco el áreaZ= 0. 1.79

    Coeficiente deconfiabilidad

    EstimadorPuntual

    ErrorEstándar

    - Precisión- Máximo error d

    Estimación- Error

  • 8/16/2019 Resumen Final de Estadística

    17/23

    d.  Si existe una población de sujetos de estudios equivalente a 600. Encuentre el errorestándar. 

    18 ± (1.79) (0.17)

    18 + 0.39 = 18.3018 –  0-39 = 17.7[17.7 –  18.30] mmHg

    e.  Encuentre el máximo error de estimación (con la población y sin la población) N=600

    ̂    

        ̂  o  Sin la población (1.79)(0.17) = 0.30o  Con la población (1.79)(0.15) 0.27

    Distribución “t- student” Criterio para usar z o t

    ̂ ̂ 

     z

    muestragrande

     s

     

    muestrapequeña

     

     tmuestragrande  s

    EstándarPuntual

    Error Estándar

    Coeficiente de confiabilidad

    Con un nivel de confianza de 92% se puede concluir que la media de la

    población (µ) se encuentra entre [17.7 –  18.30] mmHg

     Población

    Muestra

     Todo lo contrario es “z” 

    Coeficiente deconfiabilidad

    EstimadorPuntual

    ErrorEstándar

  • 8/16/2019 Resumen Final de Estadística

    18/23

     

    Se tomó una muestra de 16 niños recién nacidos a los cuales se les determino la

    concentración media de bilirrubina en el suero. El valor de la concentración media es dê=5.98mg/100cc con una desviación de 3.5mg/100cc a.  ¿Cuál es el valor del estimador puntual?

    La media de la muestra es el estimador puntual!

    5.98mg/100cc

    b.  ¿Cuál es el valor del coeficiente de confiabilidad?

    5%    0.3250 = 1-03250=0.975 ⇨ busco el áreaCoeficiente de confiabilidad =2.1315

    c.  ¿Cuál es el valor de error estándar?

    √  d.  Construya un intervalo de confianza con una significancia igual al 5%

    5.98± (2.1315)(0.875)

    5.98+1.87 = 7.85

    5.98-1.87= 4.11

    e.  Construya un intervalo de confianza con un nivel de confianza de 90%

    5.98± (1.7530)(0.875)

    5.98+1.53 = 7.51

    5.98-1.53= 4.45

    ⇨ busco el área

    n=16

    n-1 =15

    Grados de libertad (gl) =15

    Con 95% de confiabilidad se puede concluir que la media de la población(µ) se encuentra entre [4.11 –  7.85] mg/100cc

    Con 90% de confiabilidad se puede

    concluir que la media de la población (µ)

    se encuentra entre [4.45 –  7.51] mg/100cc

  • 8/16/2019 Resumen Final de Estadística

    19/23

    AmplitudDimensión

    Intervalo de confianza parala proporción de unapoblaciónSe utilizara z para los intervalos de proporción. Si tiene la población y muestra deberá calcular

     para determinar si es mayor de 0.05 y utilizar factor de corrección.

        

    En una muestra aleatoria simple de 125 varones desempleados, expulsados todos ellos de laescuela preparatoria, entre las edades de 16 - 21 años inclusive 88 de ellos declararon queeran consumidores de bebidas alcohólicas, construya un intervalo de confianza de 95% parala proporción de la población.N=125n=88NC= 95% ⇨ z=1.96  0.704 ± (1.96) (0.04)

    0.704+ 0.0784 =0.78240.704- 0.0784 = 0.6256

    Tamaño de Muestra

    D = 2 d d=  Población InfinitaMedias

       Población FinitaMedias

        

    Coeficiente deconfiabilidad

    EstimadorPuntual

    ErrorEstándar

        

    Con el 95% de confiabilidad se puede concluir que la  se encuentra entre [0.63 –  0.78]

     

     

    Proporciones 

        

    Proporciones 

      

     

    q =1-p p=

     

  • 8/16/2019 Resumen Final de Estadística

    20/23

    Prueba de Hipótesis

    Cuando se rechaza la nula, se acepta la alterna. Cuando se acepta la alterna se dice que es “Estadísticamente significativo”.

    Z calculada  √ ⁄   Z crítico= 1-  o  Prueba de Hipótesis para la media de una población (µ): Para realizar una prueba

    de hipótesis se recomienda seguir un procedimiento ordenado.

    Condición de la hipótesis

    Acción Posible

    Verdadera Falsa

    No rechaza Ho Acción Correcta Error tipo II

    Rechazar Ho Error tipo I Acción correcta

     Prueba dehipótesis

     Desde el punto de vistaestadístico una hipótesis

    es una suposición dealgo que se supone

    referente a una muestrao población.

    Las hipótesisestadísticas se

    dividen en

    Alterna (Ha)

    es la que elinvestigador

     supone.

    Nula (Ho) Es la contraparte dela alterna o bien laque se presume o

    carácteristicaestudiada.

     Paso 1.

     Datos

     Paso 2

     Planteamientode hipótesis

     Paso 3

    Regla dedecisión

     Paso 4

    EstadísticoCálculado

     Paso 5

     Decisión

     Paso 6

    Conclusión

    Error

    Tipo I

    Este error se conoce también

    como Error alfa. Alfa (α

    ) es laprobabilidad de cometer unError tipo I

    Tipo II

    La probabilidad decometererror tipo II es el valor de Beta, se llama Error tipo β o error de

    aceptación.

  • 8/16/2019 Resumen Final de Estadística

    21/23

    No RechazarHo.

    Se desea saber si es posible concluir que el consumo medio diario de calorías de la

    población rural de un país en desarrollo es de menos de 2000. Una muestra de 500

    individuos produjo un consumo medio de 1985 y una desviación estándar de 210. Alfa

    de 0.05 

    Paso 1 (Datos)

    n=500

     x=1985

    s= 210  Paso 2 (Planteo de hipótesis)

    Ho: µ≥ 2000 

    Ha: µ z crítico

    No rechaza Ho

    Paso 6 (Conclusión)

    Con un 95% se concluye que la media calórica de la población rural de un país en

    desarrollo es mayor o igual que 2000.

    Estadístico “P” –  PruebaEn toda prueba de hipótesis el estadístico “p” nos permite comparar la proporción de “p” con

    la significancia para poder tomar la decisión final.

    Condición general

    P ≤  ⇨ Rechaza HoP >  ⇨ No Rechaza Ho

    El valor de P, viene de z calculado

    Z crítico

  • 8/16/2019 Resumen Final de Estadística

    22/23

    Supuesta población

    qo= 1-po

    Población

    estimada

    Prueba de Hipótesis (t-student)

    t calculada  √ ⁄   t crítico=    Unilateral ⇨    

    Bilateral ⇨   ⁄  Prueba de hipótesis para la proporción de una población 

    ̂   

    Prueba de independencia(ji- cuadrado)

    Se puede establecer la asociación o relación que existe entre dos

    variables cualitativas.

    Todos los pasos de la prueba de hipótesis son iguales excepto el de

    estadístico calculado.

    Cuando las variables cualitativas son dipotómicas (2 categorías) los

    cuadros de contingencia son de “2x2” 

    Primero criterio Clasificación

    1 2 Totales

    Segundo Criterio 1 A B A+B

    Clasificación 2 C D C+D

    A+C B+ D n

    Para calcular el estadístico de prueba para una tabla de contingencia

    de 2x2. 

     Para buscar el valor de Ji –  crítico en la tabla se hace a través de los

    grados de libertad (gl). Y el valor de la significancia.

    gl= (número de filas -1) (número de columnas -1)

    gl= 1 ⇨ tablas de 2x2.Si Ji calculado > ji critico Se rechaza Ho

  • 8/16/2019 Resumen Final de Estadística

    23/23

    Valores Esperados

    Valores Observados

    Cantidad de elementos dentro la matriz

    Son unilaterales a la derecha únicamente.

    La distribución  no es simétricaEs significativa cuando se rechaza la hipótesis nula (Existe relación).

    Prueba de Ji- cuadrado

    matriz mayor 2x2Todos los pasos de la prueba de hipótesis son iguales excepto el de

    estadístico calculado.

    Se utiliza la siguiente fórmula para el cálculo del estadístico de prueba. 

      ∑

     

     

    Oi Ei Oi- Ei (Oi-Ei)² (Oi-Ei)² / Ei

    Valorobservado

    Ei =

    Al valor observado sele resta el resultado

    de la operaciónanterior.

    El resultado loelevamos al

    cuadrado

    El resultado en lacasilla anterior, divido

    lo de la segunda.