2 Codificació, depuració de dades, . . .
Codificació
Codificar dades consisteix a assignar números a les modalitats observades o registrades de les variables i assignar codi (valor numèric) als valors faltants (dades no registrades o observades). Exemple: en la variable "sexe" cal assignar un número a les dones i un altre als homes. En les variables quantitatives, cal definir el nombre de decimals que registrarem.
Introducció de dades
La primera qüestió que cal considerar és la disposició de les variables i els casos. La disposició més freqüent consisteix a posar els casos (generalment els individus) per fileres i les variables, per columnes. Exemple:
En aquesta disposició, les fileres representen casos i les columnes, variables, i és típica dels dissenys transversals o estàtics (les dades són recollides en un sol moment temporal). La disposició següent és l'habitualment utilitzada en els dissenys longitudinals (recollim dades al llarg d'intervals temporals i són especialment apropiats per a estudiar l'evolució del comportament):
En la taula anterior, les fileres representen subjectes i les columnes (cigseg3, cigseg6 i cigseg12, cigfin) contenen el nombre de cigarrets consumits abans, durant i en acabar una teràpia per al tabaquisme.
Una vegada introduïdes les dades, podem fer operacions com ara depuracions, ordenacions, transformacions, generació de variables noves, mostreig, generació de variables aleatòries i unes altres.
Si el disseny és transversal, posarem les variables per columnes (una variable per columna) i si tenim més d'un grup, cal decidir entre dues possibilitats en funció de les anàlisis que volem fer: la primera consisteix a introduir les dades dels grups en columnes (una per cada grup) i la segona possibilitat consisteix a introduir les dades de tots els grups en la mateixa columna i definir una variable nova els valors de la qual són els codis d'identificació dels grups. Si el disseny és longitudinal, les columnes representen els moments temporals en què observem les variables.
El pas següent consisteix a introduir les característiques de variables i dades. En el SPSS, cal activar la finestra "Vista de variables" clicant en la part inferior de la pantalla. Tot seguit, cal introduir les característiques de cada variable en la filera: 1) ajustar decimals, 2) etiquetar les variables (si s'escau), 3) etiquetar els valors de les variables (si s'escau), 5) definir valors perduts (si s'escau) i 6) marcar l'escala de mesurament.
Exemple
Generació de la pàgina "Vista de variables" per una base de dades SPSS de la següent enquesta:
1. Edat:
2. Génere:
1.Home ? 2. Dona?
3. Modalitat d'accés als estudis universitaris:
1. EGB? 2.Batxillerat LOGSE? 3. FPE? 4. Major 25 anys? 5. Altra titulació?
4. Cóm valoraríes els teus coneiximents a Matemátiques?
1.Gens 2.Molt poc 3.Poc 4 Ni poc ni masa 5. Bastant 6.Molt alts
5. Assenyala el teu grau d'acord POSANT UN NÚMERO DEL 1 AL 7 en les següents expressions:
1 M'agrada anar de vacances a la muntanya ( )
2 Cal introduïr més centrals eléctriques nuclears ( )
3 Deurìen prohibir el trànsit de vehiculs a les ciutats ( )
La vista de dades té el següent aspecte:
Per introduir les dades cal anar a la pàgina "Vista de datos" i introduir-les en les tecles numèriques (per fer efectiva la gravació cal polsar la tecla d'introducció per a cada dada).
Depuració
Depurar una base de dades consisteix a detectar els valors anòmals i tractar-los de manera que no pertorben els resultats de l'anàlisi de dades. El tractament pot consistir a eliminar-los o assignar números de codi que els identifiquen. (Podeu consultar el detall del procediment en l'apartat "Depuració" del document "MANUAL d'Informàtica".)
Transformacions
Una vegada gravades, les dades poden ser transformades per facilitar l'anàlisi. Les transformacions més habituals consisteixen a recodificar variables, definir variables noves a partir de variables existents i reemplaçar els valors perduts. (Podeu consultar els procediments en els apartats "Variables noves" i "Recodificar variables" en el document "MANUAL d'Informàtica").
Tractament
de fitxers
Els fitxers poden ser tractats per facilitar l'anàlisi de les dades. Les operacions més freqüents són segmentar, afegir casos o uns altres arxius, mostreig, etc.
(Podeu consultar el procediment de selecció de mostres aleatòries en l'apartat "Mostreig" del document "MANUAL d'Informàtica".)