Sviluppo di metodi di classificazione gerarchici, poliedrali e combinati basati sulla classe di modelli discrete support vector machines
Progetto L¿obiettivo principale della ricerca è costituito dall¿estensione della classe dei modelli discrete support vector machines (DSVM), che si presentano sotto forma di modelli di programmazione intera mista e costituiscono una efficace variante discreta delle tradizionali support vector machines (SVM), nell¿ambito della statistical learning theory.
La ricerca si orienterà secondo tre direzioni principali. In primo luogo, si svilupperanno metodi di classificazione gerarchici e poliedrali in grado di fornire predizioni accurate sulla base di un numero esiguo di esempi di riferimento. Tali metodi si propongono di generare regioni di classificazione poliedrali, che possono rivelarsi estremamente efficaci per realizzare separazioni non lineari. Inoltre, operando nello spazio in cui sono definite le osservazioni, tali metodi non ricorrono a trasformazioni preliminari che mappano gli esempi dal dominio originale a un dominio di dimensione più elevata. Questa caratteristica contribuisce a preservare il significato degli attributi che descrivono le osservazioni e a favorire l¿interpretazione delle regole di classificazione generate.
In secondo luogo, sarà investigato lo sviluppo di modelli di classificazione combinati basati sull'unione dei metodi DSVM e SVM. La combinazione di metodi di classificazione, unitamente all'impiego di strategie bagging e boosting, rappresentano modi efficaci per migliorare l'accuratezza e la capacità di apprendimento di un insieme di classificatori elementari.
In terzo luogo, si svilupperanno modelli di classificazione basati sull¿impiego dei metodi DSVM per risolvere particolari classi di problemi in ambito biologico, quali la predizione della struttura tridimensionale e della funzione di una proteina dall¿ analisi della sequenza primaria degli aminoacidi e la predizione delle funzioni genomiche a partire da dati di microarray.