CORPUS PRESEVAL
I. LA TRANSCRIPCIÓN
A la hora de determinar la representación escrita de los materiales lingüísticos orales, proceso al que se someten los corpora sociolingüísticos (Caravedo, 1996), se plantearon varias alternativas: aplicar el sistema de transcripción utilizado para el español coloquial por el grupo Val.Es.Co. (Briz, 1995), utilizar una transliteración ortográfica simple, acorde con la tradición escrita (ortografía y signos de puntuación) como la realizada en el Macrocorpus de la norma lingüística culta (Samper et alii, 1998) o seguir algun otro modelo que se ajustara a una representación fonética de la oralidad (Llisterri, 1996, 1997) (1).
Asumiendo la premisa de que un sistema de transcripción será adecuado siempre que se ajuste al objeto de estudio y a la finalidad para la que se emplea, valoramos las distintas posibilidades y, considerando que nuestro objetivo es recoger muestras representativas de lengua hablada, optamos por una transcripción ancha respecto de la utilizada para la conversación coloquial (Briz y Grupo Val.Es.Co., 2002) y que traduce la señal sonora a un sistema de transcripción estándar que permite integrar nuestro corpus en otras bases textuales electrónicas con leves ajustes.
La transcripción de las grabaciones ha sido realizada mediante una transliteración ortográfica ampliada con ciertas representaciones: pausas, autocorrecciones, énfasis, estilo directo, etc. (2), utilizando el procesador de textos Word , y que se corresponde con las convenciones acordadas en las Primeras Jornadas de Sociolingüística Hispánica (Alcalá, 2003). Los alumnos que han participado como oyentes en las entrevistas (receptores secundarios presentes en las interacciones comunicativas), han realizado la primera transcripción. Posteriormente, todas las conversaciones transcritas han sido sometidas a varios filtros o revisiones por investigadores diferentes con objeto de corregir errores en la calidad de la transliteración y aplicar correctamente los criterios de transcripción establecidos (3).
Las convenciones fundamentales que hemos empleado son:
: Cambio de hablante.
A: Intervención de un participante identificado como A.
- Correcciones, vacilaciones, palabras cortadas.
[ Lugar donde se inicia un solapamiento o superposición.
] Final de habla simultánea.
/ Pausa corta, inferior al medio segundo.
// Pausa entre medio segundo y un segundo.
/// Pausa de un segundo o más.
( 3” ) Silencio (lapso o intervalo); se indica el número de segundos en las pausas superiores a un segundo.
Juan , Sagunto Los nombres propios, apodos, siglas y marcas, excepto las convertidas en marcas lexicalizadas, aparecen con la letra inicial en mayúscula.
REINA Pronunciación marcada o enfática (palabra o sílaba).
((luego)) Transcripción dudosa.
(( )) Fragmento indescifrable.
((...)) Interrupciones de la grabación.
cansa(d)o, pa(ra) Reconstrucción o recuperación de un a unidad léxica que se ha pronunciado incompleta.
(chasquido) (risas) Anotaciones que aparecen al margen de los enunciados y se consideran sonidos significativos para la interpretación del texto. En el caso de las risas, si acompañan a lo dicho, se transcribe el enunciado y en nota a pie se indica “entre risas”.
aa Alargamientos vocálicos.
nn Alargamientos consonánticos.
… Suspensión voluntaria.
mm, ee Elementos paralingüísticos.
¡ ! Exclamaciones o admiraciones.
¿ ? Interrogaciones. También para los apéndices: ¿no?, ¿eh? ¿verdad?
letra cursiva Reproducción e imitación de emisiones: estilo directo, cita textual, etc.
notas a pie de página Anotaciones pragmalingüísticas que ofrecen información sobre las circunstancias de la enunciación o bien añaden informaciones necesarias para la correcta interpretación: gestos, traducción de fragmentos en valenciano, correspondencia en lengua extranjera de la palabra transcrita, localización de topónimos, siglas, etc.
Observaciones:
Los antropónimos y topónimos que posibilitan la identificación de los hablantes se han sustituido por otros.
Las incorrecciones gramaticales (fónicas, morfosintácticas y léxicas) no aparecen marcadas por lo general.
Los signos de acentuación se usan según la norma académica.
En el etiquetado (parte IV) aparecen los antropónimos y topónimos reales, así como las incorrecciones gramaticales marcadas con sic .
Somos conscientes de las valoraciones que pueda ofrecer esta decisión, pero el criterio adoptado garantiza que la transcripción realizada permite al lector reconstruir lo más fielmente posible la interacción comunicativa desarrollada. Cada grabación va acompañada de su ficha técnica, donde queda reflejada la información relevante para el objeto de la investigación, exceptuando los datos identificadores (nombre y apellidos) del informante.
El grado (relativo) de estructuración de la entrevista condiciona la alternancia de turnos; no obstante, existen algunas superposiciones, como puede comprobarse en los textos transcritos, producidas en lugares de transición pertinentes tales como pausa, menor fuerza articulatoria y entonativa, etc.
A continuación presentamos el modelo de ficha técnica utilizada para la obtención del corpus.
FICHA TÉCNICA
Código del informante: (ciudad, nº de orden, nivel de estudios, edad, sexo y lengua habitual)
a) Datos identificadores de la grabación
Clave de la entrevista (iniciales del entrevistador, año y nº de orden) :
Fecha de la grabación (mes y año):
Entrevistador:
Datos del entrevistador (grado de instrucción, edad, sexo, lengua habitual):
Lugar de grabación:
Tiempo de la grabación:
Interacción:
Tema s :
Observaciones sobre la grabación: (lugar, audiencia, ruidos, incidencias, etc.):
Otros participantes:
b) Datos del informante
Nombre y apellidos:
Sexo:
Lugar de nacimiento:
Fecha de nacimiento:
Fecha de llegada a la ciudad o área m etropolitana (en su caso) :
Domicilio (barrio, calle, ...) :
Condiciones de alojamiento (1, 2, 3) :
Lugar de nacimiento del padre:
Lugar de nacimiento de la madre:
Lugar de nacimiento del cónyuge:
Modo de vida (1, 2, 3) :
Grado de instrucción (indicar estudios completos y años de escolarización):
Profesión:
Ingresos (1, 2, 3, 4, 5) :
Breve descripción del modo de vida:
Viajes:
Lecturas:
Televisión y radio:
Idiomas:
Lengua materna:
Lengua habitual (funciones y usos):
Observaciones sobre el informante:
c) Datos personales del oyente
Nombre y apellidos:
Sexo:
Lugar de nacimiento:
Fecha de nacimiento:
Fecha de llegada a la ciudad (en su caso) :
Modo de vida:
Grado de instrucción:
Profesión:
Relación con el informante y otros oyentes:
Observaciones sobre el oyente:
d) Notas de campo