T-LAB Home
T-LAB 7.3 HELP ON-LINE Prev Page Prev Page
T-LAB
Introduzione
T-LAB: cosa fa e cosa consente di fare
Requisiti e Prestazioni
Preparazione del Corpus
Preparazione del Corpus
Criteri Strutturali
Criteri Formali
File
Nuovo Corpus
Assembla Testi da Importare
Corpus Esistente
Impostazioni di Analisi
Impostazioni Automatiche
Impostazioni Personalizzare
Analisi delle Co-occorrenze
Associazioni di Parole
Co-Word Analysis e Mappe Concettuali
Confronti tra Coppie
Analisi delle Sequenze
Concordanze
Analisi Tematiche
Analisi Tematica dei Contesti Elementari
Modellizazione dei Temi Emergenti
Sequenze di Temi
Contesti Chiave di Parole Tematiche
Classificazione Tematica di Documenti
Analisi Comparative
Analisi delle Specificità
Analisi delle Corrispondenze
Analisi delle Corrispondenze Multiple
Cluster Analysis
Tabelle di Contingenza
Strumenti Lessico
Stop-Words
Locuzioni e Multi-Words
Vocabolario
Disambiguazioni
Personalizzione del Dizionario
Utilities
Editor
Memo
Gestione Variabili e Modalità
Crea Sub-Corpus
Glossario
Analisi delle Corrispondenze
Catene Markoviane
CHI quadro
Cluster Analysis
Codifica
Contesto Elementare
Corpus e Sottoinsiemi
Disambiguazione
Documento Primario
Forma e Lemma
GraphML
IDnumber
Indici di Associazione
Isotopia
Lemmatizzazione
Lessia e Lessicalizzazione
MDS
Multiwords
Naïve Bayes
Normalizzazione del Corpus
Nuclei Tematici
Occorrenze e Co-occorrenze
Omografia
Parole Chiave
Polarità fattoriali
Profilo
Soglia di Frequenza
Specificità
Stop Word List
Tabelle Dati
TF-IDF
Unità di Analisi
Unità di Contesto
Unità Lessicale
Valore Test
Variabili e Modalità
Bibliografia
www.tlab.it

Nuovo Corpus


L'opzione Nuovo corpus avvia il processo d'importazione, tramite il quale T-LAB trasforma il file testo predisposto dall'utilizzatore in un insieme di tabelle integrate nel database di sessione.

Le fasi principali di questo processo sono le seguenti:

Per avviare il processo, in primo luogo bisogna selezionare il file da importare (vedi immagine seguente):

Successivamente compare una finestra di riepilogo (vedi immagini seguenti) in cui possono essere effettuate alcune scelte.

N.B.:
- Poiché i trattamenti preliminari determinano il tipo e la quantità delle unità di analisi (cioè quali e quante unità di contesto e quali e quante unità lessicali), scelte diverse in questa fase comportano risultati diversi delle successive analisi (vedi sotto opzioni avanzate). Per questa ragione, tutti gli output T-LAB mostrati nel manuale e nell'help hanno solo valore indicativo.

1 - LEMMATIZZAZIONE AUTOMATICA

La lemmatizzazione automatica è abilitata solo per la lingua in uso.
Il risultato del processo di lemmatizzazione può essere verificato tramite la funzione Vocabolario e può essere modificato tramite la funzione Personalizzazione del Dizionario.
Se l'utilizzatore intende analizzare testi di lingue diverse, si consiglia di selezionare l'opzione "other".

2 - SEGMENTAZIONE DEI TESTI IN CONTESTI ELEMENTARI

A seconda della scelta dell'utilizzatore, i contesti elementari per il calcolo delle co-occorrenze possono essere di quattro tipi: frasi, frammenti di lunghezza comparabile, paragrafi e testi brevi (es. risposte a domande aperte).
Il risultato del processo di segmentazione può essere verificato tramite il file corpus_segments.dat.

3 - VERIFICA DELLE PAROLE MULTIPLE (MULTI-WORDS)

L'opzione "Base" abilita l'uso automatico della lista multi-words di T-LAB.

Diversamente, l'opzione "Avanzata", abilitata solo in caso di lemmatizzazione automatica, consente di verificare e modificare la lista delle multi-words presenti nel corpus e non incluse nel dizionario T-LAB (vedi immagine seguente). Inoltre è possibile importare e usare altre liste predisposte dall'utilizzatore (file Multiwords.txt).


4 - VERIFICA DELLE PAROLE VUOTE (STOP-WORDS)

L'opzione "Base" abilita l'uso automatico della lista parole vuote di T-LAB.

Diversamente, l'opzione "Avanzata" consente di verificare e modificare la lista delle parole vuote presenti nel corpus.
Inoltre è possibile importare e usare altre liste predisposte dall'utilizzatore (file Stopwords.txt).

 

5 - SELEZIONE DELLE PAROLE CHIAVE

Le opzioni disponibili consentono di scegliere il metodo di selezione (TF-IDF o Chi-quadro) e il numero massimo di unità lessicali da includere nella lista usata da T-LAB per analizzare i testi con impostazioni automatiche.