www.tlab.it

Análisis de Correspondencias


Esta herramienta de T-LAB tiene como finalidad la de destacar las semejanzas y diferencias entre unidades del contexto.

En particular, en T-LAB, el Análisis de Correspondencias permite analizar tres tipos de tablas:

(A) tablas palabras por categorías de variables con los valores de ocurrencias;
(B) tablas contextos elementales por palabras con los valores de de co-ocurrencias;
(C) tablas documentos por palabras con los valores de de ocurrencias.

Para analizar las tablas (A) lemas (o palabras) por variables, el corpus se debe componer de un mínimo de tres textos o debe ser codificado con algunas variables (no menos de tres categorías).

Las variables son enumeradas en un box apropiado y pueden ser usadas de una en una.
Después de cada selección, en secuencia, se muestra la tabla de contingencia y hay que hacer clic en el botón analiza (véase abajo).

Como resultado del análisis se obtienen tablas, a partir de las cuales se pueden producir los gráficos que - en planos cartesianos - muestran las relaciones entre los subconjuntos del corpus y entre las unidades lexicales (palabras o lemas).
En particular, según los casos, los tipos de gráficos disponibles muestran las relaciones entre variables activas, entre variables ilustrativas, entre lemas o entre lemas y variables.

Todos los gráficos pueden ser maximizados y personalizados usando la caja de diálogo apropiada (botón derecho del ratón). Por otra parte, cuando las categorías variables son 3 o más, sus relaciones se pueden explorar en 3D (véase abajo).

Para explorar las varias combinaciones de los ejes factoriales, es suficiente seleccionarlos en los boxes apropiados ("Eje X", "Eje Y").

En T-LAB las características de cada polo factorial (las oposiciones mostradas en los ejes de los gráficos) se marcan usando dos medidas: las Contribuciones Absolutas, cuyo umbral es 1/N (N = filas de la tabla analizada) y los Valores Test ("Valeur Test"), cuyo umbral es +/- 1.96.

Usando el gráfico "autovalores" es posible apreciar la importancia relativa de cada factor, es decir el porcentaje de variancia que explican.


Finalmente, un clic en el botón "Resultados Completos" permite que usted visione y guarde el archivo que contiene todos los resultados del análisis: valores propios, coordenadas, contribuciones absolutas y relativas, valores test.

Todas las tablas de contingencia pueden ser fácilmente exploradas y nos permiten crear varios tipos de gráficos. Además, haciendo clic en específicas células de la tabla (véase abajo), es posible crear un archivo HTML que incluye todos los contextos elementales en que la palabra en la fila está presente en el subconjunto correspondiente.

Además, sucesivamente es posible efectuar una Cluster Analysis.

En los análisis de tablas (B) y (C), esas están constituidas por tantas líneas como las unidades de contextos (max 10.000) y tantas columnas como palabras clave seleccionadas (max 1.500).


El algoritmo de cálculo y los output son análogos a los del análisis unidades lexicales por variables, sólo que - en este caso - para limitar el tiempo de elaboración, T-LAB se limita a extraer los 10 primeros factores: un número más que suficiente para resumir la variabilidad de los datos.