|
www.tlab.it
Impostazioni
Automatiche
La scelta (reversible) di questa opzione comporta che
nelle analisi seguenti verranno utilizzate le Parole Chiave selezionate automaticamente da
T-LAB.
La lista automatica include fino a
un massimo di 3000 unità lessicali appartenenti alle
categorie grammaticali che sono più dense di significato: nomi,
verbi, aggettivi e avverbi.
Il criterio di selezione varia in funzione del tipo di
file in analisi.
Se il corpus è costituito da un unico testo, le unità
lessicali selezionate sono semplicemente quelle con i più elevati
valori di occorrenza.
Se il corpus è costituito da due o più testi
T-LAB applica il seguente
algoritmo:
a) seleziona le parole con valori di occorrenza superiori
alla soglia minima;
b) calcola i valori del TF-IDF o
applica il test del CHI quadro a tutti gli
incroci di ogni parola selezionata per tutti i testi in analisi
(N.B.: Nel caso del CHI quadro, il numero massimo dei testi è
500);
c) seleziona le parole con i valori maggiori bel metodo
utilizzato (TF-IDF o CHI quadro), ovvero seleziona quelle parole
che, nel corpus, fanno la differenza.
La lista delle parole chiave selezionate da
T-LAB può essere verificata
tramite la funzione Memo (vedi
sotto).

|