Fondamenti: schemi di rappresentazione e trasformazioni

July, 2016


Il contenuto seguente rappresenta il prosieguo di quanto esposto in Fondamenti: selezione attributi e rappresentazione dei documenti.

In sintesi: i documenti nel corpus sono rappresentati come vettori in uno spazio M-dimensionale, con M pari al numero di attributi selezionati e indicizzati nel vocabolario V. Ad ogni attributo è associato un peso. Numerose sono le metriche di pesatura utilizzabili per calcolare il valore dei pesi degli attributi.

Per esempio, nello schema di rappresentazione BOW (bag of words), il peso wij è un numero intero che esprime la frequenza statistica (cioè il numero di occorrenze) dell’attributo i-esimo nel documento j-esimo.

In questo post tratteremo in modo specifico di altre metriche di pesatura che realizzano delle trasformazioni pari-dimensionali ossia delle variazione delle rappresentazioni vettoriali con mantenimento nel numero di attributi M.

Continua a leggere l’articolo originale schemi di rappresentazione e trasformazioni sul mio vecchio blog.

Fondamenti: schemi di rappresentazione e trasformazioni - July 7, 2016 - lorenzo toscano
To Top