www.tlab.it

Soglia di frequenza


Nella fase di importazione T-LAB calcola una soglia di frequenza minima per selezionare le parole (forme o lemmi) da inserire nelle analisi del menu configurazioni automatiche e, in particolare, per costruire l'elenco delle Parole-Chiave.

In ogni caso, per garantire l'affidabilità di alcuni calcoli statistici, la soglia minima T-LAB è fissata a 4.


Per questo calcolo viene utilizzato un algoritmo documentato in uno dei volumi in bibliografia (Bolasco S., 1999), e che prevede i seguenti passi:

- individuazione del range delle frequenze basse, che - a partire dalla frequenza minima ("1") - è definito dal primo "salto" nei valori crescenti delle occorrenze;

- scelta del valore di soglia che, a seconda delle dimensioni del corpus, viene fatto corrispondere al valore minimo nel primo o nel secondo decile (10% o 20%) del range.