Personalización del Diccionario
La opción
Personalización del Diccionario abre una
ventana en la que el usuario puede realizar algunas operaciones en el diccionario
del corpus.
Para los propósitos de los análisis siguientes, su
uso es opcional.
El usuario puede volver a denominar o agrupar los lemas disponibles; además,
puede exportar el diccionario construido (incluso para modificarlo) o importar
un diccionario personalizado (también proporcionado
por terceros).

El punto de partida es una tabla (el Diccionario del Corpus) con todas las correspondencias palabra/lema, sus respectivas ocurrencias en el corpus y algunas etiquetas que se refieren a la lematización automática (columna "INF").
Antes de
cualquier operación, seleccionando palabras específicas (doble
clic) y usando el botón "contextos", es posible comprobar sus
concordancias (véase abajo).

Las operaciones
posibles, aún persiguiendo finalidades diversas (revisión
de las lematizaciones y/o usos de plantillas para el análisis del contenido),
todas se traducen en una reorganización de la base de datos T-LAB,
y por tanto en tablas diferentes para el análisis de los datos. De ello
se desprende que todas las operaciones se deben realizar en las palabras (lemas
o categorías) consideradas interesantes para los análisis sucesivos.
T-LAB,
de hecho, pone a disposición otra opción, Configuración
Personalizada, con la cual los usuarios pueden decidir qué lemas
"conservar" y cuáles "descartar".
Las dos funciones (Personalización del Diccionario
y Configuración Personalizada) se
relacionan mucho entre ellas y el usuario puede moverse fácilmente de
acá para allá, también para cambiar su elecciones.
En Personalización del Diccionario hay dos modalidades de funcionamiento:
- "uno por uno", con los cambios directos en la columna "lema" (seleccionar y digitar) ;
- "por grupos", con la posibilidad de mover las palabras seleccionadas (doble clic) al box de la derecha y, sucesivamente, volverlas a denominar usando la opción "substituye".
En el segundo caso, la nueva etiqueta puede ser definida usando uno de los lemas seleccionados (haga clic en un elemento presente en el box de "renombrar/agrupar") o escribiendo en "etiqueta".
Para importar
un diccionario personalizado, su
file - llamado Dictio.diz
o
Dictionary.diz - debe residir en el directorio
del corpus en análisis.
Este puede componerse de "n" líneas, cada una con un par de
cadenas, separadas por medio del carácter ";".
La longitud máxima de una cadena (palabra, lema o categoría) es
50 caracteres y en su interior no debe haber ni espacios en blanco ni apostrófos.
Para cada par, la primera cadena - la de izquierda - indica la etiqueta (lema
o categoría) definida por el usuario, la segunda indica la palabra (caso
Dictio.diz) o el lema (caso
Dictionary.diz) correspondiente ya presente en
el diccionario T-LAB.
He aquí algunos ejemplos:
| (Fichero Dictio.diz) | (Fichero Dictionary.diz) |
|
CARGAR;carga ------ |
BIOTECH;biotech
|
Según el tipo de
fichero que usted importa, los cambios serán como sigue:
![]() |
![]() |
ATENCIÓN:
- El botón con el icono del disquete permite guardar
un fichero (Dictio.diz),
listo para ser reutilizado, también después de las modificaciones
del usuario;
- Mediante la opción guarde su configuración
(véase Configuración Personalizada)
lo mismo corpus - sin necesidad de una importación adicional - puede
ser analizado con varios diccionarios (hasta un máximo de 10);
- Mediante la opción corpus lematizado es
posible exportar una copia del corpus (archivo .txt) en la cual cada palabra
será substituida por el lema correspondiente;
- Cuando se ha modificado el diccionario, los análisis siguientes (en
el mismo corpus) están disponibles solamente como
configuración personalizada.