T-LAB 10.2 - HELP ON-LINE - Strumenti per l'Analisi dei Testi

T-LAB 10.2 - HELP ON-LINE

T-LAB

Introduzione

T-LAB: cosa fa e cosa consente di fare

Requisiti e Prestazioni

Preparazione del Corpus

Preparazione del Corpus

Criteri Strutturali

Criteri Formali

File

Importare un singolo file...

Preparare un Corpus (Corpus Builder)

Aprire un Progetto Esistente

Impostazioni di Analisi

Impostazioni Automatiche e Personalizzate

Personalizzione del Dizionario

Analisi delle Co-occorrenze

Associazioni di Parole

Co-Word Analysis e Mappe Concettuali

Confronti tra Coppie

Analisi delle Sequenze e Network Analysis

Co-occurrence Toolkit

Analisi Tematiche

Analisi Tematica dei Contesti Elementari

Modellizazione dei Temi Emergenti

Classificazione Tematica di Documenti

Classificazione Basata su Dizionari

Testi e Discorsi come Sistemi Dinamici

Analisi Comparative

Analisi delle Specificità

Analisi delle Corrispondenze

Analisi delle Corrispondenze Multiple

Cluster Analysis

Singular Value Decomposition

Strumenti Lessico

Text Screening / Disambiguazioni

Locuzioni e Multi-Words

Segmentazione delle parole

Altri Strumenti

Gestione Variabili e Modalità

Ricerca Avanzata nel Corpus

Classificazione di Nuovi Documenti

Contesti Chiave di Parole Tematiche

Esportare Tabelle Personalizzate

Importare-Esportare una lista degli Identificativi

Glossario

Analisi delle Corrispondenze

Catene Markoviane

Cluster Analysis

Contesto Elementare

Corpus e Sottoinsiemi

Disambiguazione

Documento Primario

Indici di Associazione

Lemmatizzazione

Lessia e Lessicalizzazione

Normalizzazione del Corpus

Nuclei Tematici

Occorrenze e Co-occorrenze

Polarità fattoriali

Soglia di Frequenza

Unità di Analisi

Unità di Contesto

Unità Lessicale

Variabili e Modalità

www.tlab.it

Forma e Lemma

I software per l'analisi dei testi, in primo luogo, riconoscono le cosiddette forme grafiche, ovvero le stringhe di caratteri separati da spazi vuoti.
Poi, a seconda degli algoritmi implementati o a seconda delle categorie utilizzate dagli studiosi, si passa ai lessemi, ai lemmi, alle parole chiave, etc.

Nei dizionari linguistici che consultiamo, ogni voce corrisponde a un lemma che - generalmente - definisce un insieme di parole con la stessa radice lessicale (o lessema) e che appartengono alla stessa categoria grammaticale (verbo, aggettivo, etc.).

Le tabelle T-LAB, per tutte le unità lessicali presenti nel database del corpus, riportano due informazioni:

- la prima, denominata forma, contiene la trascrizione delle unità lessicali (singole parole, lessie o multiword) come "stringhe" riconosciute dal software;

- la seconda, denominata lemma, contiene le label (o tag) con la quali sono state raggruppate e classificate le unità lessicali.

A seconda dei casi, il lemma può essere:

- il risultato del processo di lemmatizzazione automatica;
- una voce di un dizionario personalizzato;
- una categoria che indica un gruppo di sinonimi;
- una categoria di analisi del contenuto;
- etc.