2.1 Codificación, ...


Codificación

Codificar datos es asignar números a las modalidades observadas o registradas de las variables que constituyen la base de datos, así como asignar código (valor numérico) a los valores faltantes (aquellos que no han sido registrados u observados). Ejemplo: Si la base de datos incluye la variable Sexo, hay que asignar un número a las mujeres y otro a los hombres. Si se trata de variables cuantitativas, hay que definir el número de decimales que van a ser registrados.

Introducción de datos

La primera cuestión a considerar es la disposición las variables y las unidades de observación (generalmente los individuos de los que se recoge los datos). Hay dos grandes disposiciones generales, la más frecuente consiste en disponer los casos (generalmente los individuos) por filas y las variables por columnas. Ejemplo:

La disposición anterior es típica de los diseños transversales o estáticos (los datos representan observaciones realizadas en un solo momento temporal). La siguiente disposición es utilizada habitualmente para diseños longitudinales (los datos son registrados a lo largo de intervalos temporales):

En la tabla anterior, las filas representan sujetos y las columnas (cigseg3, cigseg6 y cigseg12, cigfin) contienen el número de cigarrillos consumidos antes, durante y al acabar una terapia de tabaquismo.

Si el diseño es transversal pondremos las variables por columnas (una variable por columna) y si hay más de un grupo hay que decidir entre dos posibilidades en función de los análisis que queremos hacer: La primera consiste en introducir los datos de los grupos en columnas (una para los datos de cada grupo) y la segunda posibilidad consiste en introducir los datos de todos los grupos en la misma columna y definir una nueva variable donde introducimos los código de identificación de los grupos. Si el diseño es longitudinal lo habitual es que en las columnas representen los momentos temporales en que se observa las variables.

El paso siguiente consiste en introducir las características de variables y datos. En SPSS hay que activar la ventana "Vista de variables" clicando en la parte inferior de la pantalla. A continuación hay que introducir las características de cada variable en la fila: 1) Ajustar decimales. 2) Etiquetar las variables (en su caso). 4) Etiquetar los valores de las variables (en su caso). 5) Definir valores perdidos (en su caso). 5) Señalar la escala de medida.

Ejemplo: Generación de la página "Vista de variables" para una base de datos SPSS de la siguiente encuesta:

La vista de datos tiene la siguiente apariencia: (Si no la ves bien pon el ratón en la esquina inferior de la derecha, arrastra y haz más grande la imagen. Puedes hacer lo mismo desde la esquina a la izquierda para hacer la imagen más pequeña)

Para introducir los datos hay que ir a la página "Vista de datos" e introducir los datos desde las teclas numéricas (para hacer efectiva la grabación hay que pulsar la tecla de introducción para cada dato).

Depuración

Depurar una base de datos consiste en detectar los valores anómalos y tratarlos de manera que no distorsionen los resultados del análisis de datos. El tratamiento puede consistir en eliminarlos o asignarles números de código que los identifiquen. (Puedes consultar el detalle del procedimiento en el apartado "Depuración" del documento "Manual de informática")

Transformaciones

Una vez grabados, los datos pueden ser transformados para facilitar su análisis. Algunas de las transformaciones más corrientes consisten en recodificar variables, definir nuevas variables a partir de variables existentes, reemplazar los valores perdidos. (Puedes consultar algunos procedimientos en los apartados "Nuevas variables" y "Recodificar variables" del documento "Manual de informática")

Tratamiento de ficheros

Los ficheros pueden ser tratados para facilitar el análisis de los datos. Algunas de las operaciones más frecuentes son segmentar, añadir casos u otros archivos, muestreo, etc.