Multi-Words (Locuzioni e Poliformi)
Questa opzione consente di creare/modificare liste di Multiwords.
Ogni lista (file Multiwords.txt ) è costituita da N linee (max 5.000), ciascuna con una sequenza di due o più parole (lunghezza massima: 50 caratteri, senza segni di punteggiatura).
La struttura del file Multiwords.txt è quella di un semplice elenco, come l'esempio seguente:
ordine pubblico
servizio sanitario nazionale
val di fassa
forze dell'ordine
etc etc
Un click sul pulsante "Applica questa lista " consente una rapida trasformazione delle parole multiple presenti in un corpus in altrettante stringhe che possono essere riconosciute e classificate da T-LAB (per es. "ministro dell'interno" viene trasformato in "ministro_dell_interno").
Al termine
della trasformazione, è disponibile un nuovo file (New_Corpus.txt)
che, opportunamente rinominato, può essere importato con T-LAB.
Per verificare/usare liste di Multiwords durante la fase di importazione di
un nuovo corpus è sufficiente selezionare
l'opzione "Avanzata" nella finestra seguente:
