T-LAB 10.2 - HELP ON-LINE - Strumenti per l'Analisi dei Testi

T-LAB 10.2 - HELP ON-LINE

T-LAB

Introduzione

T-LAB: cosa fa e cosa consente di fare

Requisiti e Prestazioni

Preparazione del Corpus

Preparazione del Corpus

Criteri Strutturali

Criteri Formali

File

Importare un singolo file...

Preparare un Corpus (Corpus Builder)

Aprire un Progetto Esistente

Impostazioni di Analisi

Impostazioni Automatiche e Personalizzate

Personalizzione del Dizionario

Analisi delle Co-occorrenze

Associazioni di Parole

Co-Word Analysis e Mappe Concettuali

Confronti tra Coppie

Analisi delle Sequenze e Network Analysis

Co-occurrence Toolkit

Analisi Tematiche

Analisi Tematica dei Contesti Elementari

Modellizazione dei Temi Emergenti

Classificazione Tematica di Documenti

Classificazione Basata su Dizionari

Testi e Discorsi come Sistemi Dinamici

Analisi Comparative

Analisi delle Specificità

Analisi delle Corrispondenze

Analisi delle Corrispondenze Multiple

Cluster Analysis

Singular Value Decomposition

Strumenti Lessico

Text Screening / Disambiguazioni

Locuzioni e Multi-Words

Segmentazione delle parole

Altri Strumenti

Gestione Variabili e Modalità

Ricerca Avanzata nel Corpus

Classificazione di Nuovi Documenti

Contesti Chiave di Parole Tematiche

Esportare Tabelle Personalizzate

Importare-Esportare una lista degli Identificativi

Glossario

Analisi delle Corrispondenze

Catene Markoviane

Cluster Analysis

Contesto Elementare

Corpus e Sottoinsiemi

Disambiguazione

Documento Primario

Indici di Associazione

Lemmatizzazione

Lessia e Lessicalizzazione

Normalizzazione del Corpus

Nuclei Tematici

Occorrenze e Co-occorrenze

Polarità fattoriali

Soglia di Frequenza

Unità di Analisi

Unità di Contesto

Unità Lessicale

Variabili e Modalità

www.tlab.it

Vocabolario del Corpus

Questo strumento T-LAB consente di verificare in Vocabolario del corpus e dei suoi sottoinsiemi (vedi sotto opzione '1').
Inoltre fornisce alcune misure della ricchezza lessicale.

La tabella Vocabolario è una lista che include le "parole" (cioè i word types), le loro occorrenze (cioè i word tokens), i corrispondenti lemmi e alcune categorie utilizzate da T-LAB (vedi Glossario/Lemmatizzazione).

L'utilizzatore può agevolmente selezionare (vedi sotto opzione '2' ) le unità lessicali che appartengono a ciascuna categoria, consultare la relativa tabella ed esportarla in formato .xls (vedi sotto opzione '3').

Inoltre, usando il tasto destro del mouse, è possibile verificare le concordanze (Key-Word-in-Context) di ogni parola (vedi sotto opzione '4').

Le misure della ricchezza lessicale sono cinque:

Type/Token ratio (TTR);
Root TTR (Guiraud, 1960), ottenuta dividendo la quantità dei type per la radice quadrata dei token;
Corrected TTR (Carroll, 1964), ottenuta dividendo la quantità dei type per la radice quadrata di due volte la quantità dei token;
Log TTR (Herdan, 1960), ottenuta dividendo il logaritmo dei type per il logaritmo dei token;
Hapax/Types ratio.

N.B.:
- Hapax (i.e. Hapax Legomena) sono parole (type) che occorrono una sola volta nel corpus;
- quando vengono analizzati sottoinsiemi del corpus, tutte le misure della ricchezza lessicale non includono le stop words.