Come generare un corpus, a tema, in Italiano, da Wikipedia e… in pochi secondi

August, 2016


Talvolta può essere necessario operare, per scopi dimostrativi o altre ragioni, su un corpus di dimensioni modeste consistente di documenti redatti in una lingua specifica (non necessariamente l’Inglese) e calati su argomenti particolari. In questo post propongo un notebook ipython con il codice per generare un corpus siffatto riducendo al minimo le complicazioni tecniche e i tempi di produzione. La sorgente che utilizziamo per i contenuti è Wikipedia.

Continua a leggere l’articolo originale come generare un corpus, a tema, in Italiano, da Wikipedia e… in pochi secondi sul mio vecchio blog.

Come generare un corpus, a tema, in Italiano, da Wikipedia e… in pochi secondi - August 7, 2016 - lorenzo toscano
To Top