21

Click here to load reader

Distribuciones Bidimensionales y Multidimensionales

Embed Size (px)

Citation preview

Page 1: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

DISTRIBUCION DE FRECUENCIA BIDIMENSIONAL

1. Variable Estadística Bidimensional:

Una variable bidimensional es aquella que presenta simultáneamente dos características o variables del elemento en estudio, se representa en una tabla de doble entrada, también llamada “tabla de contingencia”

1.1. Tabla de Contingencia o Tabla de doble entrada:

Sea una población estudiada simultaneamente según dos caracteres X e Y; que representaremos genéricamente como (xi; yj ; nij), donde xi; yj, son dos valores cualesquiera y nij es la frecuencia absoluta conjunta del valor i-ésimo de X con el i-ésimo de Y.

Una forma de disponer estos resultados es la conocida como tabla de doble entrada o tabla de contingencia, la cual podemos representar como sigue:

Y

X

y1 y2 ….. yj ….. yk ni

x1 n11 n12 ….. n1j ….. n1k n1

x2 n21 n22 ….. n2j ….. n2k n2

.

.

.

.

.

.

.

.

.

.

….

.

.

.

.

.

….

.

.

.

.

.

.

.

ESTADISTICA Página 1

Page 2: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

Xi ni1 ni2 ….. nij ….. nik ni

.

.

.

.

.

.

.

.

.

.

….

.

.

.

.

.

….

.

.

.

.

.

.

.

xh nh1 nh2 ….. nhj ….. nhk nh

n. j n. 1 n. 2 ….. n. j ….. n. k n

En este caso, n11 nos indica el número de veces que aparece x1conjuntamente con y1;n12, nos indica la frecuencia conjunta de x1 con y2, etc.

2. Tipos de frecuencias en una Distribución Bidimensional:

2.1. Frecuencias Conjuntas:

Se representan por “nij”, y son las frecuencias incluidas en la tabla primitiva de entrada. Los subíndices i y j representan la fila y columna en la que está situada la frecuencia. Ejemplo:

Podemos mostrar dos variables:X que denota tres niveles: A, B, CY que denota cuatro meses: Enero, febrero, marzo, abril y mayo.

MesesNiveles

Enero Febrero Marzo Abril Mayo

ESTADISTICA Página 2

Page 3: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

A 4 6 7 8 8B 3 3 6 5 9C 9 7 7 13 14

Llamaremos N a la suma total de estas frecuencias. En el ejemplo, N es 109Ʃ (Niveles Meses) = 109

2.2. Frecuencias Marginales:

Llamaremos frecuencia marginal de un valor de X, a la que le corresponde a ese valor si no tenemos en cuenta la existencia de Y. En la práctica coincide con la suma de todas las frecuencias contenidas en la fila correspondiente a ese valor.

De la misma forma se define la frecuencia marginal en la variable Y, como la que tendría si no se tuviera en cuenta la X, o la suma de la columna correspondiente. Ejemplo:

Del ejemplo anterior se puede establecer que:

La frecuencia marginal del nivel B es 26B: 3+3+6+5+9 = 26

La frecuencia marginal del mes Marzo es 20Marzo: 7+6+7 = 20

2.3. Frecuencias Condicionadas:

Son las frecuencias que posee una variable si sólo consideramos un valor (o varios) de la otra variable. En la práctica se traduce a considerar sólo una fila o sólo una columna, según el valor elegido.

Las frecuencias condicionadas se representan con este símbolo: nx/y, que se puede leer como Frecuencia de x condicionada por y. Ejemplo:

En la tabla del ejemplo anterior la distribución de X condicionada a Marzo es la columna A=7, B=6, C=7.

Las frecuencias condicionadas son más representativas si se convierten en proporciones o porcentajes.

3. Distribución Marginal:

ESTADISTICA Página 3

Page 4: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

Al analizar una distribución bidimensional, uno puede centrar su estudio en el comportamiento de una de las variables, con independencia de cómo se comporta la otra. Estaríamos así en el análisis de una “distribución marginal”.

De cada distribución bidimensional se pueden deducir dos distribuciones marginales: una correspondiente a la variable x, y otra correspondiente a la variable y.

Distribución marginal de X

X n i.X X

X1 n1.X2 n2...... ...Xn-1 nn-1.Xn nn.

Distribución marginal de Y

Y n j.X X

Y1 n.1

Y2 n.2

..... ...Ym-1 nm-1

Ym nm

Por tanto, podemos decir:

4. Distribuciones Condicionadas:

Caso de independencia estadística

ESTADISTICA Página 4

Page 5: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

Al poner una restricción o condición a una de las dos variables, tenemos las distribuciones condicionadas. Se las suele representar como:

X/Y indica que el valor de X viene condicionado por YY/X indica que el valor de Y viene condicionado por X

4.1. Independencia estadística

Se dice que dos variables X e Y son independientes estadísticamente cuando la frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales en todos los casos, es decir:

Para todo i, j

5. Representaciones Gráficas

La forma más usual de representar gráficamente las distribuciones bidimensionales es el diagrama de dispersión o nube de puntos; sin embargo también se admiten los gráficos de barras y una representación espacial gráfica denominada estereograma.

5.1. Diagrama de dispersión o nubes de puntos

Se obtiene al considerar dos ejes coordenados, situando en el eje horizontal los valores de la variable X y en el vertical los de la variable Y; en las proximidades del par (xI,yI) se colocan tantos puntos como indica su frecuencia conjunta nij

ESTADISTICA Página 5

Page 6: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

5.2. Gráfico de Barras

ESTADISTICA Página 6

Page 7: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

5.3. Estereograma

DISTRIBUCION DE FRECUENCIA MULTIDIMENSIONAL

En muchas ocasiones interesa estudiar simultáneamente el comportamiento de (2 o más) en una población.

Es evidente que siempre se podrá estudiar cada característica por separado, a través de su correspondiente distribución de frecuencias y analizar su comportamiento a través de los indicadores ya estudiados de posición, dispersión, forma y concentración.Pero puede resultar necesario analizar, también el comportamiento conjunto de 2 o más de las características observadas.

Al estudiar conjuntamente las observaciones de todas las características (variables o atributos), se habla de una “distribución de frecuencias multidimensional”.

Dada una población de N individuos, de la que se disponen observaciones de varias características (supongamos cuantitativas, variables) éstas pueden, en principio representarse a través de un listado (matricial) similar a una base de datos en el que en cada fila aparecerá uno de los N individuos seguido de los valores que cada variable toma para cada individuo, lo que constituye un registro.

ESTADISTICA Página 7

Page 8: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

INDIVIDUOVARIABLE 1 ( X1)ASIGN.MATRICUL.

VARIABLE 2( X2)EDAD

VARIABLE 3 ( X3)ASIGN. APROBADAS

1º JUAN X11 8 X21 21 X31 7

2º PEDRO X12 7 X22 22 X32 6

3º MARÍA X13 9 X23 24 X33 6

4º ANA X14 9 X24 20 X34 5

5º LUIS X15 9 X25 19 X35 5

I. DISTRIBUCIONES BIDIMENSIONALES

Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo dos variables de cada elemento de la población.

En algunos experimentos las medidas que se obtienen son dobles, estas pertenecen a dos variables distintas, a las que llamaremos X e Y respectivamente.

Este tipo de estudios es muy frecuente y se manifiesta por ejemplo en los siguientes casos:

Comparación entre mortalidad y natalidad Ídem entre extensión y población de diversos países. Diferencias de renta entre la población en general y los titulados universitarios. Pruebas pretest y postest. Influencia de la latitud en la temperatura media. Ídem de las horas de estudio en la calificación en una asignatura, etc.

GRÁFICAS ESTADÍSTICAS

ESTADISTICA Página 8

Page 9: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

Las gráficas estadísticas son representaciones gráficas de los resultados que se muestran en una tabla estadística. Pueden ser de formas muy diversas, pero con cada tipo de gráfica se cumple un propósito. Por ejemplo, en los medios de comunicación, libros de divulgación y revistas especializadas se encuentran multitud de gráficas estadísticas en las que, con notable expresividad, se ponen de manifiesto los rasgos de la distribución que se pretende destacar. Los diagramas de barras, los diagramas de sectores, los histogramas y los polígonos de frecuencias son algunas de ellas.

1. Diagramas de barras:

En este tipo de gráfica, sobre los valores de las variables se levantan barras estrechas de longitudes proporcionales a las correspondientes. Se utilizan para representar variables cuantitativas discretas. El diagrama de barras siguiente representa la distribución del número de hijos de 43 familias:

2. Histograma y polígonos de frecuencia:

Los histogramas se utilizan para representar tablas de frecuencias con datos agrupados en intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de un rectángulo cuya altura es proporcional a la frecuencia correspondiente. El histograma que se muestra a continuación es el correspondiente a la tabla de frecuencias con intervalos adjunta (1.200 calificaciones distribuidas en 10 intervalos):

ESTADISTICA Página 9

Page 10: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.

3. Histograma y polígono de frecuencia acumulada:

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polígono. He aquí los que se obtienen de la tabla de 1.200 calificaciones:

4. Diagrama de Sectores:

En un diagrama de este tipo, los 360º de un círculo se reparten proporcionalmente a las frecuencias de los distintos valores de la variable. Resultan muy adecuados cuando hay pocos valores, o bien cuando el carácter que se estudia es cualitativo. El diagrama de sectores siguiente refleja el resultado de una encuesta (realizada a 300 personas) sobre los tipos de película preferidos por el público en general:

TIPOS DE GRÁFICAS ESTADÍSTICAS

ESTADISTICA Página 10

Page 11: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

1. Gráficos  de barras verticales:

Representan valores usando trazos verticales, aislados o no unos de otros, según la variable a graficar sea discreta o continua. Pueden usarse para representar:

• una serie

• dos o más series (también llamado de barras comparativas)

2. Gráficos de barras horizontales:

Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos.

• Para una serie

• Para dos o más series

ESTADISTICA Página 11

Page 12: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

3. Gráficos de barras proporcionales:

Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que componen un total. Las barras pueden ser:

• Verticales

• Horizontales

4. Gráficos de barras comparativas:

Se utilizan para comparar dos o más series, para comparar valores entre categorías. Las barras pueden ser:

• Verticales

• Horizontales

ESTADISTICA Página 12

Page 13: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

5. Gráficos de barras apiladas:

Se usan para mostrar las relaciones entre dos o más series con el total. Las barras pueden ser:

• Verticales

• Horizontales

6. Gráficos de líneas:

En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. Estos gráficos se utilizan para representar valores con grandes incrementos entre sí. Se pueden usar para representar:

• una serie

• dos o más series

ESTADISTICA Página 13

Page 14: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

7. Gráficos circulares:

Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar. Se pueden ser:

• En dos dimensiones

• En tres dimensiones

8. Gráficos de áreas:

En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un período de tiempo. Pueden ser:

• Para representar una serie

• Para representar dos o más series

• En dos dimensiones

ESTADISTICA Página 14

Page 15: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

• En tres dimensiones

9. Cartogramas:

Estos tipos de gráficos se utilizan para mostrar datos sobre una base geográfica. La densidad de datos se puede marcar por círculos, sombreado, rayado o color.

10. Gráficos Mixtos:

En estos tipos de gráficos se representan dos o más series de datos, cada una con un tipo diferente de gráfico. Son gráficos más vistosos y se usan para resaltar las diferencias entre las series.

Pueden ser:

• En dos dimensiones

ESTADISTICA Página 15

Page 16: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

• En tres dimensiones.

11- Histogramas:

Estos tipos de gráficos se utilizan para representa distribuciones de frecuencias. Algún software específico para estadística grafican la curva de gauss superpuesta con el histograma.

12. Dispersogramas:

Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un pictograma. Pueden ser:

ESTADISTICA Página 16

Page 17: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

• En dos dimensiones

• En tres dimensiones.

13. Pictogramas:

Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un pictograma. Pueden ser: En dos o en tres dimensiones.

Hasta ahora sólo hemos utilizado unos tipos de gráfico muy comunes como el gráfico de columnas por ejemplo. Sin embargo, hoy día Exceldispone de muchos más tipos de gráficos. Cada tipo de gráfico se diferencia de los demás por la clase de marcas de datos que utiliza. Por ejemplo, el gráfico de columnas utiliza columnas como marcas de datos; el de círculos, utiliza círculos; etc. El motivo de que haya tantos tipos de gráficos diferentes no es solamente estético. Cada uno de los tipos de gráficos está especialmente indicado para representar los datos de una manera distinta. Por lo tanto, si se quiere obtener la máxima eficacia al crear gráficos propios y presentar datos de la

ESTADISTICA Página 17

Page 18: Distribuciones Bidimensionales y Multidimensionales

DISTRIBUCION BIDIMENSIONAL: DISTRIBUCIÓNES MULTIDIMENSIONALES

mejor manera posible hay que tener esto muy en cuenta; que cada tipo de grafico esta destinado para una labor especifica.

CONCLUSIÓN

En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.

ESTADISTICA Página 18