Valutazione della ripetibilità del Whole Genome Genotyping (WGG) nell¿identificazione di marker associabili al rischio di cancro
Progetto INTRODUZIONE E OBIETTIVI. Gli esperimenti basati sull¿analisi con microarray portano spesso a risultati scarsamente ripetibili. Scopo di questa ricerca è valutare quanto le stime di frequenza allelica ottenute, tramite microarray, su pool biologici siano affette dalla variabilità tecnica e da quella di campionamento e quanto gli effetti di tale variabilità si riverberino sull¿identificazione delle differenze di distribuzione degli alleli tra casi e controlli.
MATERIALI. Presso l¿Istituto Nazionale dei Tumori di Milano, sono stati condotti due studi, relativo ciascuno a un pool di 200 casi di adenocarcinoma polmonare e a un pool di 200 controlli appaiati per età, sesso e abitudine al fumo di sigaretta. L¿analisi del materiale genetico (DNA genomico, estratto da sangue periferico) è stata eseguita via WGG usando la tecnologia dei BeadChips. Si sono misurate in duplicato le frequenze alleliche relative a oltre 315 mila marker.
METODI STATISTICI. Per ogni marker, la componente di varianza tecnica sarà ricavata per confronto tra le frequenze alleliche derivate dalle repliche entro esperimento. La componente di varianza dovuta al campionamento sarà essere ricavata per confronto tra le frequenze alleliche medie derivate dai due esperimenti. La stime di tali componenti saranno ottenute con il metodo della massima verosimiglianza ristretta. Le differenze nelle distribuzioni alleliche tra casi e controlli saranno saggiate con il test esatto di Fisher. Il grado di concordanza tra repliche o tra esperimenti nell¿identificare i marker per i quali la distribuzione allelica differisce tra casi e controlli sarà espresso come coefficiente kappa pesato di Cohen. Le performance di differenti schemi sperimentali e strategie di analisi nell¿assicurare la ripetibilità dei risultati saranno valutate con tecniche di simulazione. Le analisi e le simulazioni saranno effettuate approntando software specifico (scritto in linguaggio SAS) atto alla gestione dell¿elevatissimo numero di marker esaminati.
RISULTATI ATTESI. Ci si attende che la correlazione tra repliche entro esperimento sia maggiore di quella tra esperimenti. Infatti, la varianza tra esperimenti include sia una componente di varianza tecnica sia una componente dovuta al campionamento. Quest¿ultima, benché possa essere teoricamente derivata dall¿assunto di distribuzione binomiale di campioni tratti da una popolazione omogenea, potrebbe risultare molto maggiore perché la popolazione dei casi e quella dei controlli potrebbero essere disomogenee nella distribuzione delle frequenze alleliche. A causa dell¿elevato numero di marker esaminati ci si attende che gran parte delle differenze significative tra casi e controlli sia effetto del caso o non sia associato al rischio di cancro. Tuttavia, l¿eventuale identificazione degli stessi marker in due esperimenti differenti costituirebbe un forte indizio del coinvolgimento di tali marker nel processo di carcinogenesi.