DISTRIBUCIÓN DE FRECUENCIAS MULTIDIMENSIONAL

ir a análisis multidimensional

Dada una población de N individuos, de la que se disponen observaciones de varias características (supongamos cuantitativas, variables) éstas pueden, en principio representarse a través de un listado (matricial) similar a una base de datos en el que en cada fila aparecerá uno de los N individuos seguido de los valores que cada variable toma para cada individuo, lo que constituye un registro.(Cada variable es lo que en la terminología de las bases de datos se llama campo):

INDIVIDUO VARIABLE 1 ( X1)

ASIGN.MATRICUL.

VARIABLE 2( X2)

EDAD

VARIABLE 3 ( X3)

ASIGN. APROBADAS

1º JUAN X11 8 X21 21 X31 7
2º PEDRO X12 7 X22 22 X32 6
3º MARÍA X13 9 X23 24 X33 6
4º ANA X14 9 X24 20 X34 5
5º LUIS X15 9 X25 19 X35 5

Otra forma de representar los datos multidimensionales , especialmente útil en el caso bidimensional, es agrupando los datos por frecuencias.

En el caso bidimensional, consideraríamos una tabla de doble entrada para cada una de las variables,cada fila corresponde a un valor de la primera variable(x1i o bien xi) ,cada columna a un valor de la segunda variable(x2j o bien yj), y en cada celda aparecería la frecuencia de cada par de valores (nij ).

 

Y(aprobadas)

X(matricul.)

Y1

5

Y2

6

Y3

7

  ni.
X1

7

n11

0

n12

1

n13

0

  n1.

1

X2

8

n21

0

n22

0

n23

1

  n2.

1

X3

9

n31

2

n32

1

n33

0

  n3.

3

n.j n.1

2

n.2

2

n.3

1

  N

5

Una tabla de este tipo recibe el nombre de tabla de correlación ( ejemplo ) . Si, en lugar de estar representadas las observaciones de dos variables (cuantitativas), se tratara de dos atributos, con distintos niveles, hablaríamos de tabla de contingencia.

Cada una de las frecuencias nij que nos informa del número de individuos que toman el valor xi para la variable x, e yj para la variable y,recibe el nombre de frecuencia conjunta.

Si sumamos las frecuencias conjuntas a lo largo de una fila (i) se obtiene el número total de observaciones del valor de x, xi , con independencia del valor que tome la otra variable:

                                        ni.= Sj nij = nº de observaciones de xi

                                        Las ni. se conocen como frecuencias marginales de la variable x.

Análogamente,si sumamos las frecuencias conjuntas a lo largo de una columna (j) se obtiene el número total de observaciones del valor de y, yj , con independencia del valor que tome la otra variable: n.j= S i nij = nº de observaciones de yj

Las n.j se conocen como frecuencias marginales de la variable y.