T-LAB Home
T-LAB 7.3 AIDE EN LIGNE Prev Page Prev Page
T-LAB
Introduction
Ce que T-LAB fait et ce qu' il vous permet de faire
Conditions requises et performances
Préparation du Corpus
Préparation du Corpus
Critères Structuraux
Critères Formels
Fichier
Nouveau
Fusionner les Textes
Ouvrir
Configurations d'Analyse
Configuration Automatique
Configuration Personalisée
Analyse des Co-occurrences
Associations de Mots
Analyse des Mots Associés et Cartes Conceptuelles
Comparaisons entre paires de Mots-Clés
Analyse des Séquences
Concordances
Analyse Thématiques
Analyse Thématique des Contextes Élémentaires
Modélisation des Thèmes Émergents
Séquences de Thèmes
Contextes Clé de Mots Thématiques
Classification Thématique des Documents
Analyses Comparatives
Analyse des Spécificités
Analyse des Correspondances
Analyse des Correspondances Multiples
Classification (Cluster Analysis)
Tableaux de Contingences
Outils Lexique
Liste de Mots vides
Listes de Locutions
Vocabulaire du Corpus
Désambiguïsations
Personnalisation du Dictionnaire
Utilités
Editeur
Memo
Variable Manager
Créer un Sous-Corpus
Glossaire
Analyse des Correspondances
Chaînes de Markov
Chi-Deux
Classification (Cluster Analysis)
Codage
Contextes élémentaires
Corpus et Sous-ensembles
Désambiguïsation
Document Primaire
GraphML
Homographes
IDnumber
Index d'Association
Isotopie
Lemmatisation
Lexie et Lexicalization
MDS
Mots-Clés
Mots et Lemmes
Multiwords
Naïve Bayes
Normalisation
Noyaux Thématiques
Occurrences et Cooccurrences
Polarités Factorielles
Profil
Seuil de Fréquence
Spécificités
Stop Word List
Tableaux de Données
Unité d'Analyse
Unité de Contexte
Unité Lexicale
TF-IDF
Valeur-Test
Variables et Modalités
Bibliographie
www.tlab.it

Nouveau


L'option Nouveau corpus entame le processus d'importation, à travers lequel T-LAB transforme le fichier texte préétabli par l'utilisateur en un ensemble de tableaux intégrés dans le database de session.

Les phases principales de ce processus sont les suivantes:

Pour entamer le processus, en premier lieu il faut sélectionner le fichier à importer (voir image suivante):

Ensuite une fenêtre apparaît (voir ci-dessous) dans laquelle l'utilisateur peut faire ses choix.

N.B.:
- Puisque les options de prétraitement déterminent le type et la quantité d'unités d'analyse (c.-à-d. des unités de contexte et des unités lexicales), les différents choix de l'utilisateur déterminent différents résultats de l'analyse. Pour cette raison, tous les outputs de T-LAB (c.-à-d. graphiques et tableaux) montrés dans le manuel et dans l'aide en ligne sont simplement indicatifs.

1 - LEMMATISATION AUTOMATIQUE

La lemmatisation automatique est habilitée seulement pour la langue correspondante à l'interface de l'utilisateur.

Le résultat du processus de lemmatisation peut être vérifié avec la fonction Vocabulaire et peut être modifié avec la fonction Personnalisation du Dictionnaire.

2 - SEGMENTATION DES TEXTES (CONTEXTES ÉLÉMENTAIRES)

Selon le choix de l'utilisateur, les types de contextes élémentaires utilisés pour le calcul des co-occurrences peuvent être les suivants: énoncés, fragments de longueur comparable, paragraphes ou textes courts (ex. réponses aux questions ouvertes).

Le fichier corpus_segments.dat permet à l'utilisateur de vérifier le résultat de la segmentation du corpus.

3 - EXAMEN DES MULTIWORDS

L'option "Élémentaire" active l'utilisation automatique de la liste Multi-Words de T-LAB.

Différemment l'option "Avancé", habilitée seulement avec la lemmatisation automatique, permet à l'utilisateur de vérifier et de modifier la liste des Multi-Words non inclus dans le dictionnaire de T-LAB.
Il est aussi possible d'importer et d'employer d'autres fichiers Multiwords.txt.


4 - EXAMEN DES STOPWORDS

L'option "Élémentaire" active l'utilisation automatique de la liste Stop-Words de T-LAB.

Différemment l'option "Avancé" permet à l'utilisateur de vérifier et modifier la liste des Stop-Words présentes dans le corpus à analyser.
Il est aussi possible d'importer et d'employer autres fichiers StopWords.txt.


 

5 - SÉLECTION DES MOTS-CLÉS

Les options disponibles nous permettent de choisir la méthode de choix (TF-IDF ou Chi-deux ) et la quantité maximum d'unités lexicales à inclure dans une liste employée par T-LAB pour analyser les textes avec les configurations automatiques.