Preparazione del Corpus
Ogni corpus da analizzare, per essere importato in T-LAB, deve essere in formato solo testo con estensione .txt.
Nel caso di un unico testo (o di un corpus trattato come unico testo) T-LAB non richiede ulteriori accorgimenti.
Quando, invece, il corpus è costituito da più testi e vengono utilizzate codifiche che rinviano all'uso di qualche variabile, nella fase di preparazione si richiede che vengano rispettati due tipi di criteri:
b) criteri formali.
N.B.:
Sia la funzione Assembla Testi che la macro MS Excel inclusa nel pacchetto di installazione T-LAB consentono una rapida ed automatica trasformazione dei testi da analizzare in un corpus codificato e pronto per essere importato (vedi sotto);

Prima dell'importazione, è consigliabile una revisione ortografica del materiale da analizzare. Inoltre, se alcune sigle rilevanti sono intervallate da punteggiatura (ad es. "O.N.U." o "M.P.I.") se ne raccomanda la trasformazione in stringhe unitarie (as es. "ONU" o "O_N_U", "MPI" o "M_P_I"); ciò in quanto, nella fase di normalizzazione, T-LAB interpreta i segni di punteggiatura come separatori;
Al termine della fase di preparazione si raccomanda di creare una nuova cartella di lavoro con al suo interno il solo file corpus da importare.