www.tlab.it

Preparación del corpus


Cada corpus que debe ser analizado, para ser importado a T-LAB, tiene que ser en el formato ASCII/ANSI (sólo texto) con la extensión "txt".

En el caso de un único texto (o corpus considerado como único texto), T-LAB no necesita nada más.

Cuando, en cambio, el corpus está formado por varios textos y hay códigos que hacen referencia a algunas variables del corpus, en la fase de preparación se tienen que respetar dos tipos de criterios:

a) criterios estructurales;

b) criterios formales.

NOTA:

- tanto función Juntar los textos que la macro MS Excel incluida en el paquete de instalación T-LAB (véase la carpeta “…\My Documents\T-LAB”) permiten una rápida y automática transformación de los textos a analizar en un corpus codificado y listo para ser importado (véase abajo);

- en todo caso, aconsejamos una revisión ortográfica del material a analizar. Por otra parte, si algunas siglas importantes se espacian por medio de la puntuación (por ejemplo "N.U.") se recomienda su transformación en una sola secuencia (por ejemplo "NU" o " N_U"), porque, en la fase de la normalización, T-LAB interpreta los signos de puntuación como separadores;
- al término de la fase de preparación se recomienda crear una nueva carpeta de trabajo en cuyo interior sólo se encuentre el archivo corpus a importar.