T-LAB 10.2 - HELP ON-LINE - Strumenti per l'Analisi dei Testi

T-LAB 10.2 - HELP ON-LINE

T-LAB

Introduzione

T-LAB: cosa fa e cosa consente di fare

Requisiti e Prestazioni

Preparazione del Corpus

Preparazione del Corpus

Criteri Strutturali

Criteri Formali

File

Importare un singolo file...

Preparare un Corpus (Corpus Builder)

Aprire un Progetto Esistente

Impostazioni di Analisi

Impostazioni Automatiche e Personalizzate

Personalizzione del Dizionario

Analisi delle Co-occorrenze

Associazioni di Parole

Co-Word Analysis e Mappe Concettuali

Confronti tra Coppie

Analisi delle Sequenze e Network Analysis

Co-occurrence Toolkit

Analisi Tematiche

Analisi Tematica dei Contesti Elementari

Modellizazione dei Temi Emergenti

Classificazione Tematica di Documenti

Classificazione Basata su Dizionari

Testi e Discorsi come Sistemi Dinamici

Analisi Comparative

Analisi delle Specificità

Analisi delle Corrispondenze

Analisi delle Corrispondenze Multiple

Cluster Analysis

Singular Value Decomposition

Strumenti Lessico

Text Screening / Disambiguazioni

Locuzioni e Multi-Words

Segmentazione delle parole

Altri Strumenti

Gestione Variabili e Modalità

Ricerca Avanzata nel Corpus

Classificazione di Nuovi Documenti

Contesti Chiave di Parole Tematiche

Esportare Tabelle Personalizzate

Importare-Esportare una lista degli Identificativi

Glossario

Analisi delle Corrispondenze

Catene Markoviane

Cluster Analysis

Contesto Elementare

Corpus e Sottoinsiemi

Disambiguazione

Documento Primario

Indici di Associazione

Lemmatizzazione

Lessia e Lessicalizzazione

Normalizzazione del Corpus

Nuclei Tematici

Occorrenze e Co-occorrenze

Polarità fattoriali

Soglia di Frequenza

Unità di Analisi

Unità di Contesto

Unità Lessicale

Variabili e Modalità

TF-IDF

Questa misura, proposta da Salton (1989) nell'ambito dell'Information Retrieval, consente di valutare l'importanza di un termine (unità lessicale) all'interno di un documento (unità di contesto).

La sua formula è la seguente:

w i,j = tf i,j x idf i (Term Frequency x Inverse Document Frequency)

Dove:

tf i,j = numero delle occorrenze di i (un termine) all'interno di j (un documento)
df i = numero dei documenti che contengono i
N = totale dei documenti che costituiscono il corpus in analisi

Il valore tf i,j (Term Frequency) può essere normalizzato nel modo seguente:

tf i,j = tf i,j / Max (f i,j )

dove Max (f i,j ) è la frequenza massima di i (un qualunque termine) all'interno di j (documento).