DISTRIBUCIÓN DE FRECUENCIAS MULTIDIMENSIONAL
ir a análisis multidimensional
Dada una población de N individuos, de la que se disponen observaciones de varias características (supongamos cuantitativas, variables) éstas pueden, en principio representarse a través de un listado (matricial) similar a una base de datos en el que en cada fila aparecerá uno de los N individuos seguido de los valores que cada variable toma para cada individuo, lo que constituye un registro.(Cada variable es lo que en la terminología de las bases de datos se llama campo):
INDIVIDUO | VARIABLE 1 ( X1) ASIGN.MATRICUL. |
VARIABLE 2( X2) EDAD |
VARIABLE 3 ( X3) ASIGN. APROBADAS |
1º JUAN | X11 | 8 | X21 | 21 | X31 | 7 |
2º PEDRO | X12 | 7 | X22 | 22 | X32 | 6 |
3º MARÍA | X13 | 9 | X23 | 24 | X33 | 6 |
4º ANA | X14 | 9 | X24 | 20 | X34 | 5 |
5º LUIS | X15 | 9 | X25 | 19 | X35 | 5 |
Otra forma de representar los datos multidimensionales , especialmente útil en el caso bidimensional, es agrupando los datos por frecuencias.
En el caso bidimensional, consideraríamos una tabla de doble entrada para cada una de las variables,cada fila corresponde a un valor de la primera variable(x1i o bien xi) ,cada columna a un valor de la segunda variable(x2j o bien yj), y en cada celda aparecería la frecuencia de cada par de valores (nij ).
Y(aprobadas) X(matricul.) |
Y1
5 |
Y2
6 |
Y3
7 |
ni. | |
X1
7 |
n11
0 |
n12
1 |
n13
0 |
n1. 1 |
|
X2
8 |
n21
0 |
n22
0 |
n23
1 |
n2. 1 |
|
X3
9 |
n31
2 |
n32
1 |
n33
0 |
n3. 3 |
n.j | n.1 2 |
n.2 2 |
n.3 1 |
N 5 |
Una tabla de este tipo recibe el nombre de tabla de correlación ( ejemplo ) . Si, en lugar de estar representadas las observaciones de dos variables (cuantitativas), se tratara de dos atributos, con distintos niveles, hablaríamos de tabla de contingencia.
Cada una de las frecuencias nij que nos informa del número de individuos que toman el valor xi para la variable x, e yj para la variable y,recibe el nombre de frecuencia conjunta.
Si sumamos las frecuencias conjuntas a lo largo de una fila (i) se obtiene el número total de observaciones del valor de x, xi , con independencia del valor que tome la otra variable:
ni.= Sj nij = nº de observaciones de xi
Las ni. se conocen como frecuencias marginales de la variable x.
Análogamente,si sumamos las frecuencias conjuntas a lo largo de una columna (j) se obtiene el número total de observaciones del valor de y, yj , con independencia del valor que tome la otra variable: n.j= S i nij = nº de observaciones de yj
Las n.j se conocen como frecuencias marginales de la variable y.