Index d'association
Dans T-LAB les indices d'association (ou de similarité) sont utilisés pour analyser les cooccurrences des unités lexicales (LU, lexical units) à l'intérieur des contextes élémentaires (EC, elementary contexts), c'est-à-dire des données binaires du type présence/absence.
Par exemple,
étant donnés deux LU et dix EC, nous pouvons construire l'exemple
suivant

Les mêmes données peuvent être représentées de la façon suivante:

En généralisant et en utilisant les lettres de l'alphabet:

Les formules correspondantes aux trois indices d'associations utilisés par T-LAB sont les suivantes:

N.B.: La forme binaire du cosinus correspond au coefficient d'Ochiai.
En appliquant ces formules à notre exemple, nous obtenons les coefficients suivants:
Jaccard = 0.333; Dice = 0.600; Coseno = 0.507.
En faisant
l'hypothèse d'avoir obtenu des indices d'association des relations entre
dix LU, nous pouvons construire le tableau suivant:

De fait, T-LAB construit et analyse des tableaux analogues de dimensions N x N (où N peut correspondre à diverses centaines de colonnes), aussi bien à travers Multidimensional Scaling qu'à travers Cluster Analysis.