www.tlab.it

Palabras Asociadas y Mapas Conceptuales


Esta herramienta T-LAB permite analizar dos tipos de relaciones concernientes las co-ocurrencias de palabras:

A - entre las palabras-clave seleccionadas (lemas o categorías), si sus cantidad no excede los100 elementos (mínimo 10);
B - entre (y dentro) clusters (es decir Núcleos Temáticos), si la cantidad de palabras-clave seleccionadas excede los 100 elementos (máximo 1.500).

El usuario puede seleccionar el índice de asociación a ser utilizado y, sólo en el caso de la opción B, puede seleccionar tanto la cantidad máxima de clusters a obtener (de 50 a 100) como la cantidad máxima de palabras clave por cluster.

El proceso de cálculo empleado prevé los pasos siguientes:

1- construcción de una matriz de co-ocurrencias (palabra x palabra);
2- cálculo de los índices de asociación (Coseno, Dice o Jaccard);
3- clustering jerárquico de la matriz de la desemejanza;
4- construcción de una segunda matriz de co-ocurrencias (cluster x cluster);

5- representación gráfica de las relaciones a través del multidimensional scaling y del análisis de correspondencias.

N.B:
- en los casos "A" (véase arriba), dado que la cantidad de laspalabras-clave seleccionadas no excede los 100 elementos, T-LAB no realiza los pasos 3-4;

- la calidad de resultados depende de una cuidadosa selección de palabras clave;
- puesto que las multi-palabras (multiwords) no catalogadas por T-LAB son casos específicos de co-ocurrencia y que la opción "B" trata esos como unos pequeños racimos (ej. "Twin" + "Towers"), se aconseja de resolver estos casos durante la fase de importación. En todo caso, sin la repetición de la importación del corpus, es posible realizar cambios por medio de la función Personalización del Diccionario (ej. asignando la etiqueta "Twin_Towers" a los dos diversos items "Twin" + "Towers").

Al término del análisis automático, están disponibles cuatro tipos de gráficos que pueden ser personalizados.

1 - Mapa MDS

2 - Análisis Factorial de Correspondencias

3 - Diagrama de Asociaciones

4 - Mapa con las medidas de Centralidad y Densidad (solo después de un cluster análisis)

En detalle, los resultados obtenidos por el Análisis de Correspondencias se pueden visualizar usando las coordenadas de los primeros diez ejes (véase "A" abajo). Puesto que T-LAB nos permite verificar los Valores Test de cada factor (véase "B" abajo), esto tipo de output se puede utilizar para una cuidadosa interpretación de las relaciones entre clusters y/o entre palabras clave.

Los gráficos pueden ser explorados y modificados de las maneras siguientes:

ACCIÓN
RESULTADO
clic en una etiqueta de la tabla o del gráfico
diagrama de las asociaciones correspondientes
clic en un ítem de la columna "ELE" (véase "A" abajo)
lista con los elementos del cluster
clic en el botón "Substituye" (véase "B" abajo)
nueva etiqueta atribuida al cluster
clic en el botón "Etapas de agregación" (véase "C" abajo)
agregaciones en el cluster
clic en botón derecho del ratón
caja de diálogo para personalizar los gráficos

 

Las tablas disponibles son tres y pueden ser exportadas en formato HTML y XLS:

1 - la tabla "Miembros" se refiere a la agregación jerárquica de palabras dentro de cada cluster;

2 - la tabla "Resumen" (véase abajo) incluye las medidas siguientes:

- ECQ = cantidad de contextos elementales en los cuales dos o más palabras del cluster son co-ocurrentes;
- Centrality (Centralidad) = media de índices de asociación referentes a las relaciones entre clusters;
- Density (Densidad) = media de índices de asociación de palabras dentro de cada cluster.

3 - la tabla "Índices de asociación" (véase abajo) incluye medidas de las relaciones de semejanza entre (between) y dentro (within) los clusters.

Between
Within

 

N.B.:
- cuando un cluster análisis no se ha hecho, la tabla "Miembros" no está disponible, la tabla "Resumen" se simplifica y la tabla "Índices de asociación" se refiere solamente a las co-ocurrencias de palabras;
- al final del análisis, el diccionario de Núcleos Temáticos (es decir la lista de las etiquetas asignadas a cada cluster de las palabras) se puede exportar y, después de una cuidadosa revisión, puede ser importado por medio de la función Personalización del Diccionario. De esta manera el usuario podrá realizar algunos análisis de segundo orden (es decir análisis concernientes "temas" o "conceptos").