T-LAB Home
T-LAB 7.3 HELP ON-LINE Prev Page Prev Page
T-LAB
Introduzione
T-LAB: cosa fa e cosa consente di fare
Requisiti e Prestazioni
Preparazione del Corpus
Preparazione del Corpus
Criteri Strutturali
Criteri Formali
File
Nuovo Corpus
Assembla Testi da Importare
Corpus Esistente
Impostazioni di Analisi
Impostazioni Automatiche
Impostazioni Personalizzare
Analisi delle Co-occorrenze
Associazioni di Parole
Co-Word Analysis e Mappe Concettuali
Confronti tra Coppie
Analisi delle Sequenze
Concordanze
Analisi Tematiche
Analisi Tematica dei Contesti Elementari
Modellizazione dei Temi Emergenti
Sequenze di Temi
Contesti Chiave di Parole Tematiche
Classificazione Tematica di Documenti
Analisi Comparative
Analisi delle Specificità
Analisi delle Corrispondenze
Analisi delle Corrispondenze Multiple
Cluster Analysis
Tabelle di Contingenza
Strumenti Lessico
Stop-Words
Locuzioni e Multi-Words
Vocabolario
Disambiguazioni
Personalizzione del Dizionario
Utilities
Editor
Memo
Gestione Variabili e Modalità
Crea Sub-Corpus
Glossario
Analisi delle Corrispondenze
Catene Markoviane
CHI quadro
Cluster Analysis
Codifica
Contesto Elementare
Corpus e Sottoinsiemi
Disambiguazione
Documento Primario
Forma e Lemma
GraphML
IDnumber
Indici di Associazione
Isotopia
Lemmatizzazione
Lessia e Lessicalizzazione
MDS
Multiwords
Naïve Bayes
Normalizzazione del Corpus
Nuclei Tematici
Occorrenze e Co-occorrenze
Omografia
Parole Chiave
Polarità fattoriali
Profilo
Soglia di Frequenza
Specificità
Stop Word List
Tabelle Dati
TF-IDF
Unità di Analisi
Unità di Contesto
Unità Lessicale
Valore Test
Variabili e Modalità
Bibliografia
www.tlab.it

Personalizzazione del Dizionario


L'opzione Personalizzazione del Dizionario apre una finestra per eventuali interventi sul dizionario del corpus.

L'utilizzatore può ridenominare o raggruppare i lemmi disponibili; inoltre può esportare il dizionario costruito (anche per modificarlo) o importare un dizionario personalizzato (anche fornito da terze parti).

In ogni caso, dal momento in cui il dizionario viene modificato, le analisi successive (sullo stesso corpus) sono disponibili solo nella modalità impostazioni personalizzate.

Il punto di partenza è costituito da una tabella (il Dizionario del Corpus) che riporta le seguenti informazioni:

- corrispondenze forma/lemma;
- occorrenze di ogni forma nel corpus;
- alcune etichette che si riferiscono alla lemmatizzazione automatica (colonna "INF").

Prima di ogni intervento, selezionando una specifica forma (doppio click) e cliccando il pulsante contesti, è possibile verificare le concordanze che interessano (vedi sotto).

Gli interventi possibili, pur se diversi nelle loro intenzionalità (revisione delle lemmatizzazioni e/o applicazioni di griglie per l'analisi del contenuto), si traducono tutti in una riorganizzazione del database T-LAB e quindi in diverse tabelle per l'analisi dei dati.
Ne deriva che tutti gli interventi vanno effettuati sulle forme (lemmi o categorie) ritenute interessanti ai fini delle analisi successive. T-LAB, infatti, rende disponibile un'ulteriore funzione - Impostazioni Personalizzate - attraverso la quale gli utilizzatori possono decidere quali lemmi "tenere" e quali "mettere fuori".
Le due funzioni (Personalizzazione del Dizionario e Impostazioni Personalizzate) sono molto integrate tra loro e l'utente può agevolmente muoversi dall'una all'altra, anche per cambiare le proprie scelte.

In Personalizzazione del Dizionario sono previste due modalità di intervento:

- una del tipo "uno-per-uno" con modifiche dirette sulla colonna "LEMMA" (selezionare e digitare);

- una del tipo "a gruppi", con la possibilità di spostare le selezioni (doppio click) sul box a destra e, successivamente, di ridenominarle attraverso l'uso dell'opzione "sostituisci".

Nel secondo caso, la nuova label può essere definita utilizzando uno dei lemmi selezionati (click su un item presente nel box "rinomina raggruppa") o digitando nel box "nuova label".

Per l'importazione di un dizionario personalizzato si richiede che nella cartella del corpus in analisi risieda un file Dictio.diz o un file Dictionary.diz.
Entrambi possono essere costituiti da "n" righe, ciascuna con una coppia di stringhe separate dal carattere ";" .
In entrambi i casi,
la lunghezza massima di ogni stringa (parola, lemma o categoria) è di 50 caratteri e, al suo interno, non devono essere presenti né spazi vuoti (blank) né apostrofi.
Per ogni coppia, la prima stringa - quella a sinistra - indica la label (lemma o categoria) definita dall'utilizzatore, la seconda la parola (caso Dictio.diz) o il lemma (caso Dictionary.diz) corrispondente già presente nel dizionario T-LAB.

Ecco qualche esempio:

(File Dictio.diz) (File Dictionary.diz)

ACCOGLIERE;accogliamo
ACCOGLIERE;accogliate
ACCOGLIERE;accoglie
ACCOGLIERE;accoglie

 

------
PREPARARE;preparerà

PREPARARE;preparerai
PREPARARE;prepareranno

PREPARARE;preparerebbe

ACCOGLIENZA;accoglienza
ACCOGLIENZA;accogliere
ACCOGLIENZA;accogliente

------
PENSIERO_ASTRATTO;concettualizzare

PENSIERO_ASTRATTO;analisi
PENSIERO_ASTRATTO;analizzare

PENSIERO_ASTRATTO;interpretare

A seconda del tipo di file importato, i cambiamenti nel dizionario del corpus seguiranno una logica diversa (vedi sotto).

 

N.B.:
- Il pulsante con l'icona del dischetto consente di salvare un file
(Dictio.diz) pronto per essere ri-utilizzato, anche dopo essere stato modificato dall'utente;
- Usando l'opzione salva impostazioni (vedi Impostazioni Personalizzate), lo stesso corpus - senza bisogno di ulteriori importazioni - può essere analizzato con vari dizionari (fino a un massimo di 10);

- Utilizzando l'opzione corpus lemmatizzato è possibile esportare una copia del corpus (file .txt) in cui ogni forma è sostituita con il corrispondente lemma.