T-LAB Home
T-LAB 10.2 - HELP ON-LINE Prev Page Prev Page
T-LAB
Introduzione
T-LAB: cosa fa e cosa consente di fare
Requisiti e Prestazioni
Preparazione del Corpus
Preparazione del Corpus
Criteri Strutturali
Criteri Formali
File
Importare un singolo file...
Preparare un Corpus (Corpus Builder)
Aprire un Progetto Esistente
Impostazioni di Analisi
Impostazioni Automatiche e Personalizzate
Personalizzione del Dizionario
Analisi delle Co-occorrenze
Associazioni di Parole
Co-Word Analysis e Mappe Concettuali
Confronti tra Coppie
Analisi delle Sequenze e Network Analysis
Concordanze
Co-occurrence Toolkit
Analisi Tematiche
Analisi Tematica dei Contesti Elementari
Modellizazione dei Temi Emergenti
Classificazione Tematica di Documenti
Classificazione Basata su Dizionari
Testi e Discorsi come Sistemi Dinamici
Analisi Comparative
Analisi delle Specificità
Analisi delle Corrispondenze
Analisi delle Corrispondenze Multiple
Cluster Analysis
Singular Value Decomposition
Strumenti Lessico
Text Screening / Disambiguazioni
Vocabolario
Stop-Words
Locuzioni e Multi-Words
Segmentazione delle parole
Altri Strumenti
Gestione Variabili e Modalità
Ricerca Avanzata nel Corpus
Classificazione di Nuovi Documenti
Contesti Chiave di Parole Tematiche
Esportare Tabelle Personalizzate
Editor
Importare-Esportare una lista degli Identificativi
Glossario
Analisi delle Corrispondenze
Catene Markoviane
CHI quadro
Cluster Analysis
Codifica
Contesto Elementare
Corpus e Sottoinsiemi
Disambiguazione
Documento Primario
Forma e Lemma
Graph Maker
IDnumber
Indici di Associazione
Isotopia
Lemmatizzazione
Lessia e Lessicalizzazione
MDS
Multiwords
N-grammi
Naïve Bayes
Normalizzazione del Corpus
Nuclei Tematici
Occorrenze e Co-occorrenze
Omografia
Parole Chiave
Polarità fattoriali
Profilo
Soglia di Frequenza
Specificità
Stop Word List
Tabelle Dati
TF-IDF
Unità di Analisi
Unità di Contesto
Unità Lessicale
Valore Test
Variabili e Modalità
Bibliografia
www.tlab.it

Vocabolario del Corpus


Questo strumento T-LAB consente di verificare in Vocabolario del corpus e dei suoi sottoinsiemi (vedi sotto opzione '1').
Inoltre fornisce alcune misure della ricchezza lessicale.

La tabella Vocabolario è una lista che include le "parole" (cioè i word types), le loro occorrenze (cioè i word tokens), i corrispondenti lemmi e alcune categorie utilizzate da T-LAB (vedi Glossario/Lemmatizzazione).

L'utilizzatore può agevolmente selezionare (vedi sotto opzione '2' ) le unità lessicali che appartengono a ciascuna categoria, consultare la relativa tabella ed esportarla in formato .xls (vedi sotto opzione '3').

Inoltre, usando il tasto destro del mouse, è possibile verificare le concordanze (Key-Word-in-Context) di ogni parola (vedi sotto opzione '4').


Le misure della ricchezza lessicale sono cinque:

Type/Token ratio (TTR);
Root TTR (Guiraud, 1960), ottenuta dividendo la quantità dei type per la radice quadrata dei token;
Corrected TTR (Carroll, 1964), ottenuta dividendo la quantità dei type per la radice quadrata di due volte la quantità dei token;
Log TTR (Herdan, 1960), ottenuta dividendo il logaritmo dei type per il logaritmo dei token;
Hapax/Types ratio.

N.B.:
- Hapax (i.e. Hapax Legomena) sono parole (type) che occorrono una sola volta nel corpus;
- quando vengono analizzati sottoinsiemi del corpus, tutte le misure della ricchezza lessicale non includono le stop words.