T-LAB Home
T-LAB 10.2 - AIDE EN LIGNE Prev Page Prev Page
T-LAB
Introduction
Ce que T-LAB fait et ce qu' il vous permet de faire
Conditions requises et performances
Préparation du Corpus
Préparation du Corpus
Critères Structuraux
Critères Formels
Fichier
Importer un unique fichier...
Préparer un Corpus (Corpus Builder)
Ouvrir un Project Existant
Configurations d'Analyse
Configurations Automatiques Personalisées
Personnalisation du Dictionnaire
Analyse des Co-occurrences
Associations de Mots
Analyse des Mots Associés et Cartes Conceptuelles
Comparaisons entre paires de Mots-Clés
Analyse des Séquences et Analyse des Réseaux
Concordances
Co-occurrence Toolkit
Analyse Thématiques
Analyse Thématique des Contextes Élémentaires
Modélisation des Thèmes Émergents
Classification Thématique des Documents
Classification Basée sur ded Dictionnaires
Textes et Discours comme Systèmes Dynamiques
Analyses Comparatives
Analyse des Spécificités
Analyse des Correspondances
Analyse des Correspondances Multiples
Classification (Cluster Analysis)
Décomposition en Valeurs Singulières
Outils Lexique
Text Screening / Désambiguïsations
Vocabulaire du Corpus
Liste de Mots vides
Listes de Locutions
Segmentation de Mots
Autres Outils
Variable Manager
Recherche Avancée dans le Corpus
Classification des Nouveaux Documents
Contextes Clé de Mots Thématiques
Exporter des Tableaux Personnalisées
Editeur
Importer-Exporter une liste des Identificateurs
Glossaire
Analyse des Correspondances
Chaînes de Markov
Chi-Deux
Classification (Cluster Analysis)
Codage
Contextes élémentaires
Corpus et Sous-ensembles
Désambiguïsation
Document Primaire
Graph Maker
Homographes
IDnumber
Index d'Association
Isotopie
Lemmatisation
Lexie et Lexicalization
MDS
Mots-Clés
Mots et Lemmes
Multiwords
N-grammes
Naïve Bayes
Normalisation
Noyaux Thématiques
Occurrences et Cooccurrences
Polarités Factorielles
Profil
Seuil de Fréquence
Spécificités
Stop Word List
Tableaux de Données
Unité d'Analyse
Unité de Contexte
Unité Lexicale
TF-IDF
Valeur-Test
Variables et Modalités
Bibliographie
www.tlab.it

Mots Associés et Cartes Conceptuelles


N.B.: Les images de cette section font référence à une version précédente de T-LAB. En T-LAB 10, l'aspect est légèrement différent. En outre: a) quand la 'sélection automatique des mots-clés' est sélectionnée, dans la carte MDS des différentes couleurs sont utilisées pour indiquer différents clusters d'éléments; b) la technique de visualisation appelée t-SNE (t-Distributed Stochastic Neighbor Embedding) a été ajoutée; c) un nouveau bouton (Graph Maker) qui permet à l'utilisateur de créer plusieurs graphiques dynamiques en format HTML est disponible; d) le bouton droit sur les graphiques ou sur les tableaux avec les mots-clés rend disponible certaines options additionnelles; e) une galerie d'images à accès rapide qui fonctionne comme un menu supplémentaire permet de basculer entre les différentes sorties en un seul clic.
Certaines de ces nouvelles fonctionnalités sont mises en évidence dans l'image ci-dessous.

Cet outil T-LAB nous permet d'analyser deux types de relations concernant les co-occurrences des mots:

A - entre les mots-clés(lemmes ou catégories) sélectionnés, si leur quantité n'excède pas 500 éléments (minimum 10);
B - entre (et à l'intérieur de) clusters (c.-à-d. noyaux thématiques), si la quantité des mots-clés
sélectionnés excède 100 éléments (maximum 3.000).

L'utilisateur peut choisir l'index d'association à employer et, seulement pour l'option B, aussi bien la quantité maximum de clusters à obtenir (de 50 a 100) que la quantité maximum de mots-clés par cluster.

Le processus de calcul inclut les étapes suivantes:

1- construction d'une matrice des cooccurrences (mot x mot);
2- calcul des index d'association sélectionnés (Cosinus, Dice, Jaccard, Equivalence, Inclusion, Information Mutuelle);
3- classification hiérarchique;
4- construction d'une deuxième matrice des cooccurrences (cluster x cluster);

5- représentation de graphique par multidimensional scaling et analyse de correspondances.

N.B:
- dans le cas (A) (voir ci-dessus), l'utilisateur peut revoir et personnaliser la sélection des mots-clés (voir l'image suivante) et
T-LAB n'effectue pas les passages 3 et 4;


- la qualité des résultats dépend d'une bon choix des mots clés;
- puisque les lexies (multi-words) non classifiées par T-LAB sont des cas spécifiques de cooccurrence et l'option "B" les traite comme des petits faisceaux (ex. "Twin" + "Towers"), il est recommandé de résoudre ces cas pendant la phase de prétraitement. Dans tous les cas, sans répéter l'importation de corpus, il est possible de faire des changements au moyen de l'outil Personnalisation du Dictionnaire (par exemple en assignant l'étiquette "Twin_Towers" aux deux items différents "Twin" + "Towers");
- tous les tableaux de données peuvent être vérifiés en cliquant sur les boutons appropriés (voir ci-dessous).



Après l'analyse automatique, l'utilisateur peut visualiser quatre types de diagrammes et - en employant le bouton droit de la souris - ouvrir une fenêtre de dialogue qui permet plusieurs personnalisations.

1 - Carte MDS

2 - Analyse Factorielle des Correspondances

3 - Diagramme des Associations

4 - Carte avec les mesures de Centralité et Densité (seulement après une cluster analysis)

En particulier, les résultats obtenus par l'Analyse des Correspondances peuvent être représentés en utilisant les coordonnées des dix premiers axes (voir "A" ci-dessous). Puisque T-LAB nous permet de vérifier les Valeurs Test de chaque facteur (voir "B" ci-dessous), ce genre de output peut être employé pour une interprétation attentive des rapports entre les clusters et/ou entre les mots-clés.

Les diagrammes peuvent être explorés et personnalisés de manières suivantes:

ACTION
RÉSULTAT
clic sur un item du tableau
ou sur un point du graphique
diagramme des associations
double clic sur une étiquette de la colonne
"CLUSTER" (voir "A" ci-dessous )
liste avec les éléments du cluster
clic sur le bouton "Replacer" (voir "B" ci-dessous)
nouvelle étiquette assignée au cluster
clic sur le bouton "étapes d'agrégation" (voir "C" ci-dessous)
étapes d'agrégation dans le cluster
bouton droit de la souris
personnalisations des graphiques

Une autre fenêtre T-LAB (voir image suivante, étape 1) permet de créer des fichiers graphiques qui peuvent être édités avec un logiciel pour l'analyse des reseaux tel que Gephi, Pajek, Ucinet, yEd et d'autres. Dans ce cas, les options disponibles sont les suivantes: sélectionner les items (c'est-à-dire les "nœuds") à insérer dans les graphiques (voir ci-dessous, étapes 2 et 3), exporter la matrice correspondante de proximité (voir ci-dessous, étape 4), sélectionner les liens en base à leurs index d'association et exporter le type de fichier choisi (voir ci- dessous, étape 5).

N.B.: En T-LAB 10 la fenêtre suivante a été remplacée par l’outil Graph Maker.

Par exemple, un fichier .gml exporté par T-LAB peut permettre de réaliser un graphique comme le suivant.

Les tableaux exportables avec cet instrument T-LAB sont de trois types:

1 - le tableau "Membres des classes" (voir ci-dessous) concerne l'agrégation hiérarchique des mots dans chaque cluster;

2 - le tableau "Sommaire" (voir ci-dessous) inclut les mesures suivantes:

- ECQ = quantité de contextes élémentaires dans lesquels deux mots (ou plus) de chaque cluster sont co-occurrentes;
- Centrality = moyenne des index d'association concernant les rapports entre clusters;
- Density = moyenne des index d'association des mots dans chaque cluster.

3 - le tableau "Index d'Association" (voir ci-dessous) inclut des mesures de similitude concernant les rapports entre (between) et dans (within) les clusters.

Between
Within

N.B.:
- Quand la cluster analysis n'a pas été réalisée, le tableau "Membres des classes" n'est pas disponible, le tableau "Sommaire" est simplifié et le tableau "Index d'Association" concerne seulement les co-occurrences des mots;
- Lorsqu'on quitte cette analyse, le dictionnaire des noyaux thématiques (c.-à-d. la liste des étiquettes assignées à chaque faisceau de mots) peut être exporté et, après une attentive révision, peut être importé en utilisant l'outil Personnalisation du Dictionnaire. De cette façon l'utilisateur pourra réaliser quelques analyses du deuxième ordre (c.-à-d. analyses qui concernent "thèmes" ou "concepts").