Depurar e imputar
Unha vez rematados os traballos de campo hai que gravar os datos recollidos no cuestionario dunha folla de cálculo ou base de datos para o seu tratamento estatístico.
A forma habitual de traballar, cando se gravan os datos nunha folla de cálculo é que cada fila corresponda a un individuo da mostra e cada columna sexa unha variable.
É aconsellable que exista unha columna na táboa que identifique de xeito único cada individuo da mostra.
Os cuestionarios poden conter erros que, no caso de non seren detectados durante a recollida, haberá que tratar de depurar a posteriori. Nalgún caso incluso pode ser necesario volver a contactar coa persoa enquisada. Por exemplo, non é posible que unha persoa, nunha pregunta sobre coñecemento do galego, manifeste que non entende o galego e que despois, no apartado de uso, manifeste que habitualmente fala en galego. Unha das dúas variables é errónea.
Outro problema que pode aparecer é que algunhas das preguntas do cuestionario estean sen cubrir. Por exemplo, se preguntamos o número de horas semanais que ven televisión en galego, pode ocorrer que moitos alumnos non respondan a esta pregunta.¿Que se pode facer neste caso?
- Non considerar estes alumnos á hora de explotar os resultados.
- Se son moitos os alumnos que non responden poderíamos desbotar a idea de explotar esta variable.
- Imputar o número de horas para os alumnos que non responderon, por exemplo asignándolle a media de horas dos alumnos que contestaron. Tamén se pode asignar a media dos alumnos que comparten certas características co alumno ao que se lle quere imputar as horas.
Hoxe en día, existen programas complexos que utilizan distintas técnicas estatísticas para a imputación de datos.
Cando se gravan os datos recollidos no cuestionario nunha base de datos ou nunha folla de cálculo é recomendable codificar as variables en lugar de utilizar literais.
Por exemplo, se queremos gravar o sexo do alumno podemos utilizar unha codificación do tipo:
- 1 para os homes
- 6 para as mulleres
Deste xeito evitamos que os valores aparezan mal escritos ou o fagan de forma distinta para unha mesma categoría: homes, home, H, varóns, varones, V, ...