DISTRIBUCIONES BIDIMENSIONALES
Cuando trabajamos en un estudio estadístico y observamos simultáneamente dos caracteres en un mismo individuo obtenemos pares de resultados, por ejemplo, al observar en una persona su edad y su peso. Los distintos valores de las modalidades que pueden adoptar estos caracteres forman un conjunto de pares, que representamos por (X, Y) y llamamos variable estadística bidimensional.
Los dos caracteres observados no tienen por qué ser de la misma clase, así nos podemos encontrar con las siguientes situaciones :
| Tipos | variables ( X, Y ) |
Ejemplo |
| Dos caracteres cualitativos | Categórica / Categórica | Sexo y color del pelo. |
| Dos caracteres cuantitativos | Discreta / Discreta | Número de hermanos y número de hijos. |
| Continua / Continua | Perímetro craneal y perímetro torácico. | |
| Discreta / Continua | Pulsaciones y temperatura. | |
| Uno cualitativo y otro cuantitativo | Categórica / Discreta | Sexo y número de libros leídos. |
| Categórica / Continua | Color del pelo y talla. |
Es decir, ahora nuestra unidad de estudio es el par (X, Y) y dos pares están repetidos cuando sus respectivos valores son iguales. Otro factor a tener en cuenta es que el número de modalidades distintas que adopta el carácter X no tiene por qué ser el mismo que el que adopta el carácter Y:
X = { x1, x2, x3, ..., xs } ; Y = { y1, y2, y3, ..., yt }
Ordenación de datos : Tablas
| Parece que lo más lógico es ordenar éstos pares de datos en una
tabla de doble
entrada, donde tengan cabida los s valores de la
variable X y los t valores de la variable
Y.
Donde nij es el número de veces que aparece repetido el par (xi, yi) y que llamaremos frecuencia absoluta del par (xi, yi). |
![]() |
| Una tabla de doble entrada también se puede
expresar como una tabla simple,
de forma que siempre es posible pasar de una a otra según convenga.
Las tablas simples reflejan el comportamiento de la variable estadística bidimensional (X, Y) a partir de los valores individuales que toman cada una de las variables estadísticas unidimensionales X e Y. |
![]() |
Observaciones
| La frecuencia relativa del par (xi, yi) la denotamos por fij | ![]() |
| La suma de las frecuencias absolutas es igual al número de pares observados (N). | ![]() |
| La suma de las frecuencias relativas es igual a la unidad. | ![]() |
Representaciones gráficas
| Diagramas de
dispersión
Es la representación sobre unos ejes cartesianos de los distintos valores de la variable (X, Y). En el eje de abscisas representamos los valores de X y en el de ordenadas los valores de Y, de tal forma que cada par viene representado por un punto del plano X×Y. En el caso de que las dos variables estén agrupadas en intervalos el diagrama se construye mediante casillas que tienen dentro tantos puntos como el valor de la frecuencia absoluta correspondiente a los intervalos X e Y. Si las variables que componen el par son una discreta y otra continua se utilizan las marcas de clase, siendo un caso similar al primero. |
Los diagramas de dispersión también se conocen como nube de puntos. |
| diagramas
de frecuencias
Como en un diagrama de dispersión no puede quedar reflejado las veces que se repite un par o un intervalo, hemos de recurrir a una representación en tres dimensiones de (X, Y). Dos son para la variable bidimensional y una dimensión para expresar las frecuencias. La figura adjunta representa los datos del ejemplo 1. La variable X toma los valores 10, 15,... y la variable Y los valores 0, 1,2,...; en el eje Z están representadas las frecuencias absolutas del par (X, Y). |
![]() |
Distribuciones Marginales
|
Si en una tabla de doble entrada tenemos en cuenta solamente la variable X y el recuento de sus frecuencias, sin que para nada intervengan los valores de la Y, esta distribución se denomina distribución marginal de la variable X ,siendo nxi el número de elementos observados cuando la variable X es xi (frecuencia marginal del valor xi ). Análogamente cuando tomamos la variable Y, sin tener en cuenta para nada los valores de X. De las frecuencias absolutas marginales se obtienen las frecuencias relativas marginales. Y de igual forma podemos obtener las medias, varianzas y desviaciones típicas marginales.
|
![]() |
Distribuciones Condicionadas
| En ocasiones podemos necesitar condicionar los valores de la variable Y a un determinado valor de X o viceversa. Estas distribuciones así obtenidas se denominan: distribución de la variable Y condicionada a X=xi o distribución de la variable X condicionada a Y=yi . | ![]() |