T-LAB 10.2 - AIUDA EN RED - T-LAB Instrumentos para el análisis de textos

T-LAB 10.2 - AIUDA EN RED

T-LAB

Introducción

Qué hace y qué permite hacer

Requisitos y prestaciones

Preparación del corpus

Preparación del corpus

Criterios Estructurales

Criterios Formales

Archivo

Importar un único archivo...

Preparar un Corpus (Corpus Builder)

Abrir un projecto ya existente

Configuraciones de Análisis

Configuración Automática y Personalizada

Personalización del Diccionario

Análisis de Co-ocurrencias

Asociaciones de Palabras

Análisis de Co-Palabras y Mapas Conceptuales

Comparaciones entre Parejas de Palabras-Clave

Análisis de Secuencias y Análisis de Redes

Co-occurrence Toolkit

Análisis Temáticos

Análisis Temático de Contextos Elementales

Modelización de Temas Emergentes

Clasificación Temática de Documentos

Clasificación Basada en Diccionarios

Textos y Discursos como Sistemas Dinámicos

Análisis Comparativos

Análisis de Especificidades

Análisis de Correspondencias

Análisis de Correspondencias Múltiples

Cluster Analysis

Descomposición de Valores Singulares

Herramientas Léxico

Text Screening / Desambiguaciónes

Palabras Vacías

Segmentación de Palabras

Otras Herramientas

Variable Manager

Búsqueda avanzada en el Corpus

Clasificación de Nuevos Documentos

Contextos Clave de Palabras Temáticas

Exportar Tablas Personalizadas

Importar-Exportar una lista de Identificadores

Glosario

Análisis de Correspondencias

Cadenas de Markov

Cluster Analysis

Contextos Elementales

Corpus y Subconjuntos

Desambiguación

Documentos Primarios

Índices de Asociación

Lexia y Lexicalización

Multiwords (Multi-Palabras)

Normalización del Corpus

Núcleos Temáticos

Ocurrencias y Co-ocurrencias

Palabras y Lemas

Polos de Factores

Tablas de Datos

Umbral de Frecuencia

Unitad de Análisis

Unidad de Contexto

Variables y Modalidades

www.tlab.it

Contextos Elementales

Durante la fase de la importación, T-LAB lleva a cabo una segmentación del corpus en contextos elementales, para facilitar las exploraciones del usuario y, sobre todo, para efectuar los análisis que requieren el cómputo de las co-ocurrencias.

Según la elección del usuario, los contextos elementales pueden ser:

1 - Frases

Contextos elementales que terminan con signos de puntuación (.?!) y que no superan longitud máxima de 1.000 caracteres.

2 - Fragmentos

Contextos elementales de longitud comparable y compuestos de uno o más enunciados.

En este caso, las reglas de segmentación usadas por T-LAB son las siguientes:

- considerar como contexto elemental cada secuencia de palabras interrumpida por el punto y a parte y cuyas dimensiones sean inferiores a la longitud de 400 caracteres;

- en el caso en el que, dentro de la longitud máxima, no haya ningún punto y a parte, buscar, en el orden, otros signos de puntuación (? ! ; : ,). Si no se encontraran, segmentar en base a un criterio estadístico, pero sin truncar las unidades lexicales.

3 - Párrafos

Contextos elementales que terminan con signos de puntuación (.?!) y retorno del carro (longitud máxima: 2.000 caracteres).

4 - Textos Breves

Esta opción se permite solamente cuando la longitud máxima de textos no supera los 2.000 caracteres (por ejemplo, las respuestas a preguntas abiertas).

NOTA:

- El fichero corpus_segments.dat contiene el resultado de la segmentación del corpus;
- En T-LAB, la opción concordancias permite verificar los contextos elementales en los que está presente cada palabra (o lema).