Ottimizzazione di tecniche multivariate per la estrazione di segnali rari dal fondo nell'analisi statistica di grandi campioni di dati in Fisica Subnucleare
Progetto Moderni esperimenti in fisica subnucleare accumulano una quantita' enorme di dati. Si pensi che nell'esperimento BaBar sono sinora stati accumulati 465 milioni di coppie B-antiB e una qualunque analisi di questi dati comporta anche l'analisi di una statistica 3 0 4 volte superiore di dati simulati. La ricerca di eventi rari in questi campioni di dati necessita dell'utilizzo di tecniche statistiche multivariate. Alcune di queste tecniche (quali ad esempio boosted decision tree e random forest), sviluppate in anni recenti, non hanno ancora trovato applicazione nel settore della fisica subnucleare.
Bisogna quindi iniziare a confrontare le varie tecniche di separazione del segnale dal fondo.
Un altro aspetto importante di questa indagine e' la ricerca di un set minimo ottimale di variabili discriminanti per l'analisi multivariata che rendano piu' veloce l'analisi dei dati senza apprezzabile perdita di informazione.