L'elettroforesi bidimensionale è una tecnica molto usata in biologia molecolare che richiede il confronto di numerose mappe proteiche di campioni di controllo e trattati. Le mappe sono immagini popolate da macchie di intensità variabile; nell'analisi bisogna misurare l'esatta posizione e l'intensità delle macchie.
Dovremo studiare mappe con anche mille macchie/proteine, non trattabili manualmente. Occorre uno strumento automatico capace di analizzare le immagini e dare una risposta per la maggioranza dei dati, evidenziando le poche che richiedono un intervento umano.
Purtroppo le immagini sono deformate e le macchie corrispondenti alle stesse proteine non cadono nella stessa posizione geometrica. Occorre stabilire un sistema di coordinate locali o ricondurre tutte le immagini alla stessa metrica. Allineate le immagini e normalizzate le intensità, i confronti indicano quali proteine sono espresse in quale caso, ed assieme a quali altre.
Il progetto prevede di partire dalle immagini digitalizzate, riportarle ad una metrica comune, determinare le proteine e classificare i risultatati.
Ci sono due strade:
a) Deformare le immagini e renderle sovrapponibili con una tecnica già usata per sezioni di organuli riprese al microscopio elettronico e basata sulla cross-correlazione e sul ricampionamento. Si tratta di dividere le immagini in aree sempre più piccole, correlare le aree corrispondenti e determinare la nuova posizione del centro. La posizione dei centri definisce un reticolo di distorsione che guida il ricampionamento. Le immagini verranno poi segmentate con un algoritmo di watershed per trovare le regioni corrispondenti alle macchie. L'intensità e l'estensione delle regioni permetterà di misurare il peso molecolare e la quantità di proteina legate alla macchie.
b) Partire dalle immagini originarie e misurare posizione e intensità delle macchie come esposto sopra. Avremo una descrizione vettoriale delle mappe, anche se le deformazioni geometriche non permettono di associare banalmente i vettori. Ci aspettiamo però che le macchie siano correlate in modo topologico. Riconoscendo i pattern principali nei diagrammi vettoriali, sarà ancora possibile mettere le mappe in relazione fra loro.
Collaboriamo con ricercatori dell'Università del Piemonte Orientale che studiano le variazioni dei profili di espressione proteici in differenti organismi tra cui l'ameba, organismo molto utilizzato negli studi di biologia molecolare per via del genoma completamente sequenziato.
I contatti sono già avviati ed abbiamo verificato la bontà del processo di digitalizzaione, che fornisce immagini a 16 bit, accurate nella risoluzione dei livelli di grigio. Le macchie infatti, sono molto scure ed occorrono scanner capaci di trattare immagini di densità ottica 4.
Prima studieremo quale strategia sia in grado di fornire risultati stabili e costanti e valuteremo l'incidenza di tutti i parametri in gioco. Poi metteremo a punto un'applicazione utilizzabile anche da non esperti.