T-LAB Home
T-LAB 7.3 HELP ON-LINE Prev Page Prev Page
T-LAB
Introduzione
T-LAB: cosa fa e cosa consente di fare
Requisiti e Prestazioni
Preparazione del Corpus
Preparazione del Corpus
Criteri Strutturali
Criteri Formali
File
Nuovo Corpus
Assembla Testi da Importare
Corpus Esistente
Impostazioni di Analisi
Impostazioni Automatiche
Impostazioni Personalizzare
Analisi delle Co-occorrenze
Associazioni di Parole
Co-Word Analysis e Mappe Concettuali
Confronti tra Coppie
Analisi delle Sequenze
Concordanze
Analisi Tematiche
Analisi Tematica dei Contesti Elementari
Modellizazione dei Temi Emergenti
Sequenze di Temi
Contesti Chiave di Parole Tematiche
Classificazione Tematica di Documenti
Analisi Comparative
Analisi delle Specificità
Analisi delle Corrispondenze
Analisi delle Corrispondenze Multiple
Cluster Analysis
Tabelle di Contingenza
Strumenti Lessico
Stop-Words
Locuzioni e Multi-Words
Vocabolario
Disambiguazioni
Personalizzione del Dizionario
Utilities
Editor
Memo
Gestione Variabili e Modalità
Crea Sub-Corpus
Glossario
Analisi delle Corrispondenze
Catene Markoviane
CHI quadro
Cluster Analysis
Codifica
Contesto Elementare
Corpus e Sottoinsiemi
Disambiguazione
Documento Primario
Forma e Lemma
GraphML
IDnumber
Indici di Associazione
Isotopia
Lemmatizzazione
Lessia e Lessicalizzazione
MDS
Multiwords
Naïve Bayes
Normalizzazione del Corpus
Nuclei Tematici
Occorrenze e Co-occorrenze
Omografia
Parole Chiave
Polarità fattoriali
Profilo
Soglia di Frequenza
Specificità
Stop Word List
Tabelle Dati
TF-IDF
Unità di Analisi
Unità di Contesto
Unità Lessicale
Valore Test
Variabili e Modalità
Bibliografia
www.tlab.it

Cluster Analysis


Insieme di tecniche statistiche il cui obiettivo è costituito dall'individuare raggruppamenti di oggetti che abbiano due caratteristiche complementari:

  • A) al loro interno, la massima somiglianza tra gli elementi che li costituiscono (gli oggetti appartenenti a ciascun cluster);

  • B ) tra di loro, la massima differenza.

Nel linguaggio della statistica, le caratteristiche "A" e "B" corrispondono rispettivamente alla varianza interna (within cluster variance) e a quella esterna (between cluster variance).

In generale, i metodi della Cluster Analysis vengono distinti in due tipi:

  • Hierarchical methods, i cui algoritmi ricostruiscono l'intera gerarchia degli oggetti in analisi (il cosiddetto "albero"), vuoi in senso ascendente, vuoi in senso discendente;
  • Partitioning methods, i cui algoritmi prevedono che l'utilizzatore abbia preventivamente definito il numero di cluster in cui l'insieme degli oggetti in analisi va diviso.

In T-LAB sono utilizzati algoritmi di entrambi i tipi.

In particolare:

Alcune delle pubblicazioni citate in Bibliografia consentono di approfondire sia aspetti generali dei vari metodi (Bolasco S., 1999; Lebart L., A. Morineau, M. Piron, 1995), sia aspetti specifici concernenti le mappe di Kohonen (Kohonen T., 1989) e il metodo bisecting K-means (Steinbach, M., G. Karypis, V. Kumar, 2000; Savaresi S.M., D.L. Boley, 2001)