DISTRIBUCIONES BIDIMENSIONALES


Cuando trabajamos en un estudio estadístico y observamos simultáneamente dos caracteres en un mismo individuo obtenemos pares de resultados, por ejemplo, al observar en una persona su edad y su peso. Los distintos valores de las modalidades que pueden adoptar estos caracteres forman un conjunto de pares, que representamos por (X, Y) y llamamos variable estadística bidimensional.

Los dos caracteres observados no tienen por qué ser de la misma clase, así nos podemos encontrar con las siguientes situaciones :

Tipos variables ( X, Y )

Ejemplo

Dos caracteres cualitativos Categórica / Categórica Sexo y color del pelo.
Dos caracteres cuantitativos Discreta / Discreta Número de hermanos y número de hijos.
Continua / Continua Perímetro craneal y perímetro torácico.
Discreta / Continua Pulsaciones y temperatura.
Uno cualitativo y otro cuantitativo Categórica / Discreta Sexo y número de libros leídos.
Categórica / Continua Color del pelo y talla.

Es decir, ahora nuestra unidad de estudio es el par (X, Y) y dos pares están repetidos cuando sus respectivos valores son iguales. Otro factor a tener en cuenta es que el número de modalidades distintas que adopta el carácter X no tiene por qué ser el mismo que el que adopta el carácter Y:

X = { x1, x2, x3, ..., xs }    ;    Y = { y1, y2, y3, ..., yt }

Ordenación de datos : Tablas

Parece que lo más lógico es ordenar éstos pares de datos en una tabla de doble entrada, donde tengan cabida los  s  valores de la variable  X  y los  t  valores de la variable  Y.

Donde  nij  es el número de veces que aparece repetido el par  (xi, yi)  y que llamaremos frecuencia absoluta del par  (xi, yi).

Una tabla de doble entrada también se puede expresar como una tabla simple, de forma que siempre es posible pasar de una a otra según convenga.

Las tablas simples reflejan el comportamiento de la variable estadística bidimensional (X, Y) a partir de los valores individuales que toman cada una de las variables estadísticas unidimensionales X e Y.

Observaciones

La frecuencia relativa del par  (xi, yi)  la denotamos por  fij
La suma de las frecuencias absolutas es igual al número de pares observados (N).
La suma de las frecuencias relativas es igual a la unidad.

Representaciones gráficas

Diagramas de dispersión

Es la representación sobre unos ejes cartesianos de los distintos valores de la variable (X, Y). En el eje de abscisas representamos los valores de X y en el de ordenadas los valores de Y, de tal forma que cada par viene representado por un punto del plano X×Y.

En el caso de que las dos variables estén agrupadas en intervalos el diagrama se construye mediante casillas que tienen dentro tantos puntos como el valor de la frecuencia absoluta correspondiente a los intervalos X e Y.

Si las variables que componen el par son una discreta y otra continua se utilizan las marcas de clase, siendo un caso similar al primero.

Los diagramas de dispersión también se conocen como nube de puntos.

diagramas de frecuencias

Como en un diagrama de dispersión no puede quedar reflejado las veces que se repite un par o un intervalo, hemos de recurrir a una representación en tres dimensiones de (X, Y). Dos son para la variable bidimensional y una dimensión para expresar las frecuencias.

La figura adjunta representa los datos del ejemplo 1. La variable X toma los valores 10, 15,... y la variable Y los valores 0, 1,2,...; en el eje Z están representadas las frecuencias absolutas del par (X, Y).

Distribuciones Marginales

Si en una tabla de doble entrada tenemos en cuenta solamente la variable  X  y el recuento de sus frecuencias, sin que para nada intervengan los valores de la Y, esta distribución se denomina distribución marginal de la variable X ,siendo  nxi  el número de elementos observados cuando la variable X es xi (frecuencia marginal del valor xi ). Análogamente cuando tomamos la variable Y, sin tener en cuenta para nada los valores de X.

De las frecuencias absolutas marginales se obtienen las frecuencias relativas marginales. Y de igual forma podemos obtener las medias, varianzas y desviaciones típicas marginales.

 

Distribuciones Condicionadas

En ocasiones podemos necesitar condicionar los valores de la variable Y a un determinado valor de X o viceversa. Estas distribuciones así obtenidas se denominan: distribución de la variable Y condicionada a X=xi  o distribución de la variable X condicionada a Y=yi .