Índices de Asociación
En T-LAB los índices de asociación (o de similitud) se utilizan para analizar las co-ocurrencias de las unidades lexicales (LU, lexical units) en el interior de los contextos elementales (EC, elementary contexts), es decir datos binarios del tipo presencia/ausencia.
Por ejemplo,
dadas dos LU y diez EC, se puede crear el siguiente ejemplo

Los mismos datos se pueden representar del siguiente modo:

Generalizando y usando las letras del alfabeto:

Las fórmulas correspondientes a los tres índices de asociación usados por T-LAB son las siguientes:

NOTA: La forma binaria del coseno corresponde al coeficiente de Ochiai.
Aplicando estas fórmulas a nuestro ejemplo, obtenemos los siguientes coeficientes:
Jaccard = 0.333; Dice = 0.600; Coseno = 0.507.
Suponiendo
que se han obtenido los coeficientes de las relaciones entre diez LU, podemos
crear la siguiente tabla:

De hecho, T-LAB crea y analiza tablas análogas de dimensiones N x N (en la que N puede corresponder a varios centenares de columnas), tanto con Multidimensional Scaling como con Cluster Analysis.