Causalità, dati e apprendimento automatico

July, 2016


L’apprendimento automatico include una varietà di algoritmi e metodologie il cui fine è la modellazione delle variazioni di una o più grandezze assunte come variabili dipendenti (o esplicative) in funzione delle variazioni di altre grandezze dette variabili indipendenti.

Ogni modello è costruito a partire dai dati. I dati sono generalmente un sottoinsieme dei valori ammissibili delle grandezze in esame e sono sempre misurati sotto specifiche condizioni operative (che dovrebbero essere sufficientemente rappresentative di ciò che si vuole analizzare).

Il paradigma classico della programmazione del software prevede che, partendo dalla conoscenza dei dati di input, si debba poi codificare con un linguaggio di programmazione (p.e. Python o qualsiasi altro possiamo immaginare) il processo di trasformazione dell’input nell’output desiderato. I meccanismi di causalità che regolano la trasformazioni degli ingressi nelle uscite devono quindi essere ben noti al programmatore che è chiamato ad esprimerli in forma algoritmica.

Diversamente, il paradigma di programmazione che sottende ai sistemi di apprendimento automatico non richede la codifica esplicita (e manuale!) dei meccanismi di causalità e sposta il focus esclusivamente sui dati. Nei software di apprendimento automatico, le causalità tra i dati sono dedotte in modo approssimativo ed automatico (secondo approcci matematici specifici per ogni algoritmo di ML e spesso iterativi) e sono implicitamente codificate in parametri che contribuiscono al funzionamento del modello stesso (p.e. coefficienti di polinomi, etc..).

Continua a leggere l’articolo originale causalità, dati e apprendimento automatico sul mio vecchio blog.

Causalità, dati e apprendimento automatico - July 7, 2016 - lorenzo toscano
To Top