Indici di associazione
In T-LAB gli indici di associazione (o di similarità) sono utilizzati per analizzare le co-occorrenze delle unità lessicali (LU, lexical units) all'interno dei contesti elementari (EC, elementary contexts), cioè dati binari del tipo presenza/assenza.
Ad esempio, dati due LU e dieci EC, possiamo costruire il seguente esempio:

Gli stessi dati possono essere rappresentati nel modo seguente:

Generalizzando e utilizzando le lettere dell'alfabeto:

Le formule corrispondenti ai tre indici di associazione usati da T-LAB sono le seguenti:

N.B.: Nel caso di dati binari, il coefficiente del coseno corrisponde al coefficiente di Ochiai.
Applicando queste formule al nostro esempio, otteniamo i seguenti coefficienti:
Jaccard = 0.333; Dice = 0.600; Coseno = 0.507.
Ipotizzando
di aver ottenuto indici di associazione delle relazioni tra dieci LU, possiamo
costruire la tabella seguente:

Di fatto, T-LAB costruisce ed analizza tabelle analoghe di dimensioni N x N (dove N può corrispondere a varie centinaia di colonne), sia mediante Multidimensional Scaling che mediante Cluster Analysis.