Configuración Automática
La elección de esta opción implica que en los análisis siguientes se utilizarán las Palabras Clave seleccionadas automáticamente por T-LAB.
La lista automática incluye hasta 1500 unidades lexicales pertenecientes a las categorías gramaticales que son más densas de significado: nombres, verbos, adjetivos y adverbios.
El criterio
de selección varía en función del tipo de corpus analizado.
Si el corpus se compone de un único texto T-LAB selecciona simplemente
las unidades lexicales con los valores más altos de ocurrencia.
Si el corpus
se compone de dos o más textos T-LAB
utiliza el algoritmo ilustrado en la nota siguiente:
a) selecciona las palabras con valores de frecuencia superiores al umbral mínimo;
b) aplica el TF-IDF o el test del
chi-cuadrado a todos los cruces de cada palabra seleccionada para todos
los textos analizados;
c) selecciona las palabras con los valores más altos en el TF-IDF o en
el test de chi cuadrado, o sea esas palabras que, en el texto, hacen la diferencia.
La lista de palabras clave seleccionadas por T-LAB se puede verificar utilizando la opción Memo (véase abajo).
