|
www.tlab.it
Nouveau
L'option Nouveau corpus entame le processus
d'importation, à travers lequel T-LAB transforme le fichier texte
préétabli par l'utilisateur en un ensemble de tableaux intégrés
dans le database de session.
Les phases principales de ce processus sont les
suivantes:
Pour entamer le processus, en premier lieu il faut
sélectionner le fichier à importer (voir image
suivante):
Ensuite une
fenêtre apparaît (voir ci-dessous) dans laquelle l'utilisateur peut
faire ses choix.
N.B.: -
Puisque les options de prétraitement déterminent le type
et la quantité d'unités d'analyse (c.-à-d. des unités de contexte
et des unités lexicales), les différents choix de l'utilisateur
déterminent différents résultats de l'analyse. Pour cette raison,
tous les outputs de T-LAB (c.-à-d. graphiques et tableaux)
montrés dans le manuel et dans l'aide en ligne sont simplement
indicatifs.
1 - LEMMATISATION AUTOMATIQUE
La lemmatisation automatique
est habilitée seulement pour la langue correspondante à l'interface
de l'utilisateur.
Le résultat du processus de lemmatisation peut être
vérifié avec la fonction Vocabulaire et
peut être modifié avec la fonction Personnalisation du Dictionnaire.
2 - SEGMENTATION DES TEXTES (CONTEXTES ÉLÉMENTAIRES)
Selon le choix de l'utilisateur, les types de contextes
élémentaires utilisés pour le calcul des co-occurrences peuvent être les suivants:
énoncés, fragments de longueur comparable, paragraphes ou textes
courts (ex. réponses aux questions ouvertes).
Le fichier corpus_segments.dat permet à
l'utilisateur de vérifier le résultat de la segmentation du
corpus.
3 - EXAMEN DES MULTIWORDS
L'option "Élémentaire" active l'utilisation automatique
de la liste Multi-Words de
T-LAB.
Différemment l'option "Avancé", habilitée seulement avec
la lemmatisation automatique, permet à l'utilisateur de vérifier et
de modifier la liste des Multi-Words non inclus dans le
dictionnaire de T-LAB.
Il est aussi possible d'importer et d'employer d'autres fichiers Multiwords.txt.
4 - EXAMEN DES STOPWORDS
L'option "Élémentaire" active l'utilisation automatique
de la liste Stop-Words de
T-LAB.
Différemment l'option "Avancé" permet à l'utilisateur de
vérifier et modifier la liste des Stop-Words présentes dans le corpus à
analyser.
Il est aussi possible d'importer et d'employer autres fichiers StopWords.txt.
5 - SÉLECTION DES
MOTS-CLÉS
Les options disponibles nous
permettent de choisir la méthode de choix (TF-IDF ou Chi-deux ) et la
quantité maximum d'unités lexicales à inclure dans une liste
employée par T-LAB
pour analyser les textes avec les configurations automatiques.
|