www.tlab.it

Mots Associés et Cartes Conceptuelles


Cet outil T-LAB nous permet d'analyser deux types de relations concernant les co-occurrences des mots:

A - entre les mots-clés (lemmes ou catégories) sélectionnés, si leur quantité n'excède pas 100 éléments (minimum 10);
B - entre (et à l'intérieur de) clusters (c.-à-d. noyaux thématiques), si la quantité des mots-clés
sélectionnés excède 100 éléments (maximum 1.500).

L'utilisateur peut choisir l'index d'association à employer et, seulement pour l'option B, aussi bien la quantité maximum de clusters à obtenir (de 50 a 100) que la quantité maximum de mots-clés par cluster.

Le processus de calcul inclut les étapes suivantes:

1- construction d'une matrice des cooccurrences (mot x mot);
2- calcul des index d'association (Cosinus, Dice ou Jaccard);
3- classification hiérarchique;
4- construction d'une deuxième matrice des cooccurrences (cluster x cluster);

5- représentation de graphique par multidimensional scaling et analyse de correspondances.

N.B:
- dans le second cas (A), parce que la quantité des mots-clés n'excède pas 100 éléments, T-LAB n'effectue pas les étapes 3-4;
- la qualité des résultats dépend d'une bon choix des mots clés;
- puisque les lexies (multi-words) non classifiées par T-LAB sont des cas spécifiques de cooccurrence et l'option "B" les traite comme des petits faisceaux (ex. "Twin" + "Towers"), il est recommandé de résoudre ces cas pendant la phase de prétraitement. Dans tous les cas, sans répéter l'importation de corpus, il est possible de faire des changements au moyen de l'outil Personnalisation du Dictionnaire (par exemple en assignant l'étiquette "Twin_Towers" aux deux items différents "Twin" + "Towers");
- tous les tableaux de données peuvent être vérifiés en cliquant sur les boutons appropriés (voir ci-dessous).



Après l'analyse automatique, l'utilisateur peut visualiser quatre types de diagrammes et - en employant le bouton droit de la souris - ouvrir une fenêtre de dialogue qui permet plusieurs personnalisations.

1 - Carte MDS

2 - Analyse Factorielle des Correspondances

3 - Diagramme des Associations

4 - Carte avec les mesures de Centralité et Densité (seulement après une cluster analysis)

En particulier, les résultats obtenus par l'Analyse des Correspondances peuvent être représentés en utilisant les coordonnées des dix premiers axes (voir "A" ci-dessous). Puisque T-LAB nous permet de vérifier les Valeurs Test de chaque facteur (voir "B" ci-dessous), ce genre de output peut être employé pour une interprétation attentive des rapports entre les clusters et/ou entre les mots-clés.

Les diagrammes peuvent être explorés et personnalisés de manières suivantes:

ACTION
RÉSULTAT
clic sur un item du tableau
ou sur un point du graphique
diagramme des associations
double clic sur une étiquette de la colonne
"CLUSTER" (voir "A" ci-dessous )
liste avec les éléments du cluster
clic sur le bouton "Replacer" (voir "B" ci-dessous)
nouvelle étiquette assignée au cluster
clic sur le bouton "étapes d'agrégation" (voir "C" ci-dessous)
étapes d'agrégation dans le cluster
bouton droit de la souris
personnalisations des graphiques

Les tableaux disponibles sont de trois types et peuvent être exportés dans les formats HTML et XLS:

1 - le tableau "Membres des classes" (voir ci-dessous) concerne l'agrégation hiérarchique des mots dans chaque cluster;

2 - le tableau "Sommaire" (voir ci-dessous) inclut les mesures suivantes:

- ECQ = quantité de contextes élémentaires dans lesquels deux mots (ou plus) de chaque cluster sont co-occurrentes;
- Centrality = moyenne des index d'association concernant les rapports entre clusters;
- Density = moyenne des index d'association des mots dans chaque cluster.

3 - le tableau "Index d'Association" (voir ci-dessous) inclut des mesures de similitude concernant les rapports entre (between) et dans (within) les clusters.

Between
Within

N.B.:
- Quand la cluster analysis n'a pas été réalisée, le tableau "Membres des classes" n'est pas disponible, le tableau "Sommaire" est simplifié et le tableau "Index d'Association" concerne seulement les co-occurrences des mots;
- Lorsqu'on quitte cette analyse, le dictionnaire des noyaux thématiques (c.-à-d. la liste des étiquettes assignées à chaque faisceau de mots) peut être exporté et, après une attentive révision, peut être importé en utilisant l'outil Personnalisation du Dictionnaire. De cette façon l'utilisateur pourra réaliser quelques analyses du deuxième ordre (c.-à-d. analyses qui concernent "thèmes" ou "concepts").