www.tlab.it

Multi-Palabras (Multi-Words)


Esta opción permite crear/modificar las listas de Multi-Palabras (Multi-Words) en la ventana siguiente.

Cada lista (archivo Multiwords.txt) tiene que ser compuesta de N líneas (máximo 5000), cada una con un conjunto de dos o más palabras (longitud máxima: 50 caracteres, sin signos de puntuación).

He aquí algunas líneas de Multiwords.txt en el formato correcto:

transporte público
sistema de información
banco de órganos

etc etc

Chascando en el botón "Aplicar esta lista... ", el usuario puede producir una rápida transformación de las multi-palabras presentes en un corpus en cadenas que pueden ser reconocidas y clasificadas por T-LAB (por ej. "sistema de información" es transformado en "sistema_de_información").

Después del funcionamiento, esta opción genera un nuevo archivo (New_Corpus.txt) que, correctamente retitulado, puede ser analizado por T-LAB.

Para verificar/utilizar listas de Multi-Palabras durante la importación de un nuevo corpus el usuario tiene que seleccionar la opción "Avanzado" en la ventana siguiente: