T-LAB Home
T-LAB 10.2 - HELP ON-LINE Prev Page Prev Page
T-LAB
Introduzione
T-LAB: cosa fa e cosa consente di fare
Requisiti e Prestazioni
Preparazione del Corpus
Preparazione del Corpus
Criteri Strutturali
Criteri Formali
File
Importare un singolo file...
Preparare un Corpus (Corpus Builder)
Aprire un Progetto Esistente
Impostazioni di Analisi
Impostazioni Automatiche e Personalizzate
Personalizzione del Dizionario
Analisi delle Co-occorrenze
Associazioni di Parole
Co-Word Analysis e Mappe Concettuali
Confronti tra Coppie
Analisi delle Sequenze e Network Analysis
Concordanze
Co-occurrence Toolkit
Analisi Tematiche
Analisi Tematica dei Contesti Elementari
Modellizazione dei Temi Emergenti
Classificazione Tematica di Documenti
Classificazione Basata su Dizionari
Testi e Discorsi come Sistemi Dinamici
Analisi Comparative
Analisi delle Specificità
Analisi delle Corrispondenze
Analisi delle Corrispondenze Multiple
Cluster Analysis
Singular Value Decomposition
Strumenti Lessico
Text Screening / Disambiguazioni
Vocabolario
Stop-Words
Locuzioni e Multi-Words
Segmentazione delle parole
Altri Strumenti
Gestione Variabili e Modalità
Ricerca Avanzata nel Corpus
Classificazione di Nuovi Documenti
Contesti Chiave di Parole Tematiche
Esportare Tabelle Personalizzate
Editor
Importare-Esportare una lista degli Identificativi
Glossario
Analisi delle Corrispondenze
Catene Markoviane
CHI quadro
Cluster Analysis
Codifica
Contesto Elementare
Corpus e Sottoinsiemi
Disambiguazione
Documento Primario
Forma e Lemma
Graph Maker
IDnumber
Indici di Associazione
Isotopia
Lemmatizzazione
Lessia e Lessicalizzazione
MDS
Multiwords
N-grammi
Naïve Bayes
Normalizzazione del Corpus
Nuclei Tematici
Occorrenze e Co-occorrenze
Omografia
Parole Chiave
Polarità fattoriali
Profilo
Soglia di Frequenza
Specificità
Stop Word List
Tabelle Dati
TF-IDF
Unità di Analisi
Unità di Contesto
Unità Lessicale
Valore Test
Variabili e Modalità
Bibliografia
www.tlab.it

Personalizzazione del Dizionario


L'opzione Personalizzazione del Dizionario apre una finestra per eventuali interventi sul dizionario del corpus.

L'utilizzatore può ridenominare o raggruppare i lemmi disponibili (vedi sotto opzione '3'); ; inoltre può esportare il dizionario costruito (vedi sotto opzione '4') o importare un dizionario personalizzato (vedi sotto opzione '5').

Il punto di partenza è costituito da una tabella (il Dizionario del Corpus) che riporta le seguenti informazioni:

- corrispondenze forma/lemma;
- occorrenze di ogni forma nel corpus;
- alcune etichette che si riferiscono alla lemmatizzazione automatica (colonna "INF").

Prima di ogni intervento, selezionando una specifica forma e usando il tasto destro del mouse, è possibile verificare le concordanze (Key-Word-in-Context) che interessano (vedi sopra opzione'2').

In ogni caso, prima di ogni intervento, dopo aver cliccato il tab selezione delle parole chiave, devono essere attivate le impostazioni personalizzate (vedi sopra opzione '1').

Gli interventi possibili, pur se diversi nelle loro intenzionalità (revisione delle lemmatizzazioni e/o applicazioni di griglie per l'analisi del contenuto), si traducono tutti in una riorganizzazione del database T-LAB e quindi in diverse tabelle per l'analisi dei dati.
Ne deriva che tutti gli interventi vanno effettuati sulle forme (lemmi o categorie) ritenute interessanti ai fini delle analisi successive. T-LAB, infatti, rende disponibile un'ulteriore funzione - Impostazioni Personalizzate (vedi Impostazioni Personalizzate) - attraverso la quale gli utilizzatori possono decidere quali lemmi "tenere" e quali "mettere fuori".
Le due funzioni (Personalizzazione del Dizionario e Impostazioni Personalizzate) sono molto integrate tra loro e l'utente può agevolmente muoversi dall'una all'altra, anche per cambiare le proprie scelte.

In Personalizzazione del Dizionario, per cambiare le label (o 'lemmi') attribuite alle parole, sono previste due modalità di intervento:

- una del tipo "uno-per-uno" con modifiche dirette sulla colonna "LEMMA" (selezionare e digitare);

- una che consente di spostare le selezioni sul box a destra (click su un qualunque item) e, successivamente, di ridenominarle attraverso l'uso dell'opzione "rinomina". (N.B.: In questo caso, la nuova label può essere definita utilizzando uno dei lemmi selezionati o digitando nel box "nuova label"; vedi sopra opzione '3');

- una che prevede l'importazione di un dizionario personalizzato, riservata agli utilizzatori esperti che dispongono di loro liste per classificare le parole presenti in uno o più corpus (vedi sopra opzione '5').

N.B.: L'uso del tasto destro nel box Rinominare/Raggruppare abilita un menu contestuale che consente tre operazioni: a) verificare le concordanze (KeyWord-in-Context) dell'item selezionato; b) rimuovere l'item selezionato dal box; c) rimuovere tutti gli item selezionati dal box.

Per l'importazione di un dizionario personalizzato si richiede che l'utilizzatore abbia predisposto un file Dictio.diz o un file Dictionary.diz, i quali possono essere costituiti da "n" righe, ciascuna con una coppia di stringhe separate dal carattere ";" .
In entrambi i casi, la lunghezza massima di ogni stringa (parola, lemma o categoria) è di 50 caratteri e, al suo interno, non devono essere presenti né spazi vuoti (blank) né apostrofi.

Per ogni coppia, la prima stringa - quella a sinistra - indica la label (lemma o categoria) definita dall'utilizzatore, la seconda la parola (caso Dictio.diz) o il lemma (caso Dictionary.diz) corrispondente già presente nel dizionario T-LAB.

Ecco qualche esempio:

(File Dictio.diz) (File Dictionary.diz)

ACCOGLIERE;accogliamo
ACCOGLIERE;accogliate
ACCOGLIERE;accoglie
ACCOGLIERE;accoglie

 

------
PREPARARE;preparerà

PREPARARE;preparerai
PREPARARE;prepareranno

PREPARARE;preparerebbe

ACCOGLIENZA;accoglienza
ACCOGLIENZA;accogliere
ACCOGLIENZA;accogliente

------
PENSIERO_ASTRATTO;concettualizzare

PENSIERO_ASTRATTO;analisi
PENSIERO_ASTRATTO;analizzare

PENSIERO_ASTRATTO;interpretare

A seconda del tipo di file importato, i cambiamenti nel dizionario del corpus seguiranno una logica diversa (vedi sotto).

 

N.B.:
- Utilizzando l'opzione corpus lemmatizzato è possibile esportare una copia del corpus (file .txt) in cui ogni forma è sostituita con il corrispondente lemma.