Gli attuali sistemi di riconoscimento di volti sono disegnati per lavorare su immagini di piccole dimensioni (100x100 pixel per l¿intera faccia), prive di ombre e raffiguranti volti con espressione neutra. Un¿importante richiesta è quella di operare su immagini a colori ad alta risoluzione e acquisite in ambito non vincolato, cioè con sfondo e condizioni di illuminazione arbitrarie.
Abbiamo proposto [arca06] un algoritmo di identificazione di volti in cui la caratterizzazione del volto si basa su un¿analisi locale e multiscala dell'immagine.
La nostra tecnica dà risultati buoni a patto che le componenti del volto siano correttamente localizzate (attualmente otteniamo il 96% di identificazioni corrette su una galleria di 600 soggetti). Pertanto intendiamo migliorare l¿attuale metodo di localizzazione del volto e delle sue componenti (occhi, bocca, naso).
L¿algoritmo da noi proposto per la localizzazione precisa degli occhi utilizza classificatori (Support Vector Machines) basati su kernel Gaussiani. Le prestazioni sono state valutate su un numero elevato di immagini di basi dati standard e, sebbene i risultati siano buoni, riteniamo ci sia un significativo spazio di miglioramento. L¿obiettivo è raffinare la precisione con cui viene individuato il centro degli occhi poiché la loro localizzazione permette di ricavare con buona confidenza la posizione delle altre caratteristiche facciali a patto che l¿output del classificatore sia preciso e del tutto affidabile. D¿altra parte, nessun classificatore può garantire il 100% di riconoscimento e l¿assenza di falsi positivi, perciò è utile ricorrere a più classificatori in grado di localizzare le altre parti significative del volto (bocca, naso) e comporne gli output tenendo conto delle informazioni di scala e posizione fornite da ciascuno di essi. Questo procedimento permetterebbe di scartare le configurazioni incoerenti e dunque di aumentare l¿affidabilità dell¿intero sistema, in special modo in presenza di occlusioni, di variazioni di posa e di espressione. Circa la composizione dell¿output dei classificatori, l¿idea è di selezionare, tra le possibili configurazioni di posizioni delle componenti, quelle che risultano ¿geometricamente plausibili¿.
Per realizzare un sistema di riconoscimento robusto in contesti non controllati, è auspicabile che esso sia in grado di riconoscere anche soggetti con espressione non neutra.
Poiché gli algoritmi di apprendimento sono un elemento essenziale per la soluzione del problema, intendiamo esplorare tecniche di ¿apprendimento attivo¿ studiando in particolare algoritmi ¿on-line¿ che permettono di approssimare l¿iperpiano delle Support Vector Machines su un dato training set tramite la tecnica del campionamento selettivo. Ciò è stato dimostrato essere utile per contrastare il problema di overfitting su dati molto rumorosi.
Verrà anche analizzata la possibilità di implementare gli algoritmi su architetture dedicate (sistemi embedded).