T-LAB Home
T-LAB 7.3 AIDE EN LIGNE Prev Page Prev Page
T-LAB
Introduction
Ce que T-LAB fait et ce qu' il vous permet de faire
Conditions requises et performances
Préparation du Corpus
Préparation du Corpus
Critères Structuraux
Critères Formels
Fichier
Nouveau
Fusionner les Textes
Ouvrir
Configurations d'Analyse
Configuration Automatique
Configuration Personalisée
Analyse des Co-occurrences
Associations de Mots
Analyse des Mots Associés et Cartes Conceptuelles
Comparaisons entre paires de Mots-Clés
Analyse des Séquences
Concordances
Analyse Thématiques
Analyse Thématique des Contextes Élémentaires
Modélisation des Thèmes Émergents
Séquences de Thèmes
Contextes Clé de Mots Thématiques
Classification Thématique des Documents
Analyses Comparatives
Analyse des Spécificités
Analyse des Correspondances
Analyse des Correspondances Multiples
Classification (Cluster Analysis)
Tableaux de Contingences
Outils Lexique
Liste de Mots vides
Listes de Locutions
Vocabulaire du Corpus
Désambiguïsations
Personnalisation du Dictionnaire
Utilités
Editeur
Memo
Variable Manager
Créer un Sous-Corpus
Glossaire
Analyse des Correspondances
Chaînes de Markov
Chi-Deux
Classification (Cluster Analysis)
Codage
Contextes élémentaires
Corpus et Sous-ensembles
Désambiguïsation
Document Primaire
GraphML
Homographes
IDnumber
Index d'Association
Isotopie
Lemmatisation
Lexie et Lexicalization
MDS
Mots-Clés
Mots et Lemmes
Multiwords
Naïve Bayes
Normalisation
Noyaux Thématiques
Occurrences et Cooccurrences
Polarités Factorielles
Profil
Seuil de Fréquence
Spécificités
Stop Word List
Tableaux de Données
Unité d'Analyse
Unité de Contexte
Unité Lexicale
TF-IDF
Valeur-Test
Variables et Modalités
Bibliographie

Seuil de fréquence


Pendant la phase de prétraitement T-LAB calcule un seuil de fréquence pour choisir les mots (formes ou lemmes) à insérer dans la liste des mots-clés, utilisée dans les analyses à configuration automatique.

De toute façon, afin de garantir la fiabilité de tous les calculs statistiques, le seuil minimum T-LAB est fixé à la valeur 4.


Pour ce calcul on emploie un algorithme documenté dans un des livres de la bibliographie (Bolasco, 1999).
Il se déroule selon les étapes suivantes:
- détection de la gamme de basse fréquence qui, à partir de la fréquence minimum ("1") est définie par le premier "saut" dans les valeurs croissantes d'occurrences;
- choix de valeur- seuil qui, selon des tailles du corpus, correspond à la valeur minimum dans le premier ou dans le deuxième décile de la gamme (10% ou 20%).