Ddistribución ndimensional

Dada una población de N individuos, de la que se disponen observaciones de varias características (supongamos cuantitativas, variables) éstas pueden, en principio representarse a través de un listado (matricial) similar a una base de datos en el que en cada fila aparecerá uno de los N individuos seguido de los valores que cada variable toma para cada individuo, lo que constituye un registro.(Cada variable es lo que en la terminología de las bases de datos se llama campo):

INDIVIDUO

VARIABLE 1 ( X₁)

ASIGN.MATRICUL.

VARIABLE 2( X₂)

EDAD

VARIABLE 3 ( X₃)

ASIGN. APROBADAS

Otra forma de representar los datos multidimensionales , especialmente útil en el caso bidimensional, es agrupando los datos por frecuencias.

En el caso bidimensional, consideraríamos una tabla de doble entrada para cada una de las variables,cada fila corresponde a un valor de la primera variable(x1i o bien xi) ,cada columna a un valor de la segunda variable(x_2j o bien y_j), y en cada celda aparecería la frecuencia de cada par de valores (n_ij).

Y(aprobadas) X(matricul.)	Y₁ 5	Y₂ 6	Y₃ 7	n_i.
X₁ 7	n₁₁ 0	n₁₂ 1	n₁₃ 0	n₁. 1
X₂ 8	n₂₁ 0	n₂₂ 0	n₂₃ 1	n₂. 1
X₃ 9	n₃₁ 2	n₃₂ 1	n₃₃ 0	n₃. 3

n.j

n.1

n.2

n.3

Una tabla de este tipo recibe el nombre de tabla de correlación ( ejemplo ) . Si, en lugar de estar representadas las observaciones de dos variables (cuantitativas), se tratara de dos atributos, con distintos niveles, hablaríamos de tabla de contingencia.

Cada una de las frecuencias nij que nos informa del número de individuos que toman el valor x_i para la variable x, e y_j para la variable y,recibe el nombre de frecuencia conjunta.

Si sumamos las frecuencias conjuntas a lo largo de una fila (i) se obtiene el número total de observaciones del valor de x, x_i , con independencia del valor que tome la otra variable:

Análogamente,si sumamos las frecuencias conjuntas a lo largo de una columna (j) se obtiene el número total de observaciones del valor de y, y_j , con independencia del valor que tome la otra variable: n._j= S _i n_ij = nº de observaciones de y_j

1º JUAN	X₁₁	8	X₂₁	21	X₃₁	7
2º PEDRO	X₁₂	7	X₂₂	22	X₃₂	6
3º MARÍA	X₁₃	9	X₂₃	24	X₃₃	6
4º ANA	X₁₄	9	X₂₄	20	X₃₄	5
5º LUIS	X₁₅	9	X₂₅	19	X₃₅	5