Devo essere sincero, mi ritengo dipendente da Google Maps, senza di questo non potrei trovare facilmente il mio negozio di scarpe preferito o recarmi in luoghi dove non sono mai stato prima. Non penso di avere un pessimo senso di orientamento ma a furia di usare una mappa per muovermi in città non mi pongo neanche più il problema su quale strada prendere per andare da un punto A ad un punto B, mi lascio semplicemente guidare dalle indicazioni dettate dal mio smartphone. Perché vi parlo di questo? Semplicemente perché anche per un bioinformatico le mappe sono estremamente importanti, queste infatti permettono di muoversi nel genoma di un organismo in modo semplice senza correre il rischio di perdersi. Ad esempio, grazie ad una buona mappa del genoma umano, posso facilmente scoprire in che cromosoma e a che altezza di questo si trova il gene che controlla il colore dei nostri occhi. In fondo una mappa non è altro che una rappresentazione grafica che ci permette di orientarci negli oggetti presenti in uno spazio, che nel nostro caso sono le diverse componenti genetiche presenti nel genoma di un organismo.

Occorre precisare che possiamo usufruire di diverse tipologie di mappe per orientarci nel DNA di un organismo. Esistono infatti:

  • Le mappe genetiche. Spiegare in modo semplice come si costruiscono le mappe genetiche e perché sono utili è complicato, ma permettetemi di fare un esempio esplicativo. Mio padre è un medico ed esercita la sua professione in uno studio privato che è situato proprio sotto casa. Spesso i pazienti chiamano per sapere dove è situato quest’ultimo, e nonostante io indichi loro il nome della via è necessario essere più dettagliato nelle indicazioni. Allora la cosa più semplice da fare è dare loro dei riferimenti geografici che si avvicinano in modo progressivo alla sede di destinazione. Ad esempio, dico loro se conoscono la scuola posta di fronte al negozietto di alimentari vicino al suo studio, poi dico che entrati in una stradina dovrebbero trovarsi vicino ad un cancello bianco e così via fino ad arrivare allo studio. Bene, costruire una mappa genetica prevede un processo abbastanza simile, infatti si prendono come riferimento numerose sequenze di DNA la cui posizione è nota al fine di creare una rappresentazione più dettagliata possibile del genoma di un organismo. Ognuna di queste sequenze prende il nome di marcatore molecolare ma cerchiamo di essere un più tecnici. Quando si costruisce una mappa genetica si vuole semplicemente individuare, in modo approssimativo, la posizione di specifici geni e QTL (Quantitative Trait Loci) che controllano dei caratteri (qualitativi e quantitativi) di interesse. Per individuare la posizione di questi si calcola l’associazione e dunque la distanza relativa ai marcatori molecolari mappati e presi come riferimento. In modo schematico potremmo dire che per costruire una mappa genetica è necessario:
    1. Mappare i marcatori molecolari mediante l’analisi di associazione. Per farlo si osserva come i marcatori molecolari sono ereditati all’interno di una progenie (una popolazione di individui ottenuti dalla riproduzione sessuata a partire da due genitori). In particolare bisogna valutare le frequenze di ricombinazione (FR) o di crossing over tra due marcatori molecolari per volta per determinare la distanza reciproca, espressa in centiMorgan, o cM, (1 % di FR = 1 cM), e la loro posizione a livello di un cromosoma. La frequenza di ricombinazione descrive infatti il grado di associazione tra due marcatori, dunque più vicini ed associati sono due marcatori molecolari minore sarà la frequenza di ricombinazione tra questi e pertanto saranno maggiormente ereditati insieme nella progenie. Spero di non avervi confuso, ma è necessario essere ancora un pò più precisi. Per mappare i marcatori molecolari è necessaria una popolazione segregante, ovvero una progenie di individui, ottenuti dall’incrocio tra due genitori, in cui è possibile notare le frequenze di segregazione dei marcatori molecolari su cui vengono effettuati diversi test statistici al fine di ottenere dati, analizzati mediante specifici software come Mapmaker 3.0 o JoinMap, utili alla comprensione di come questi dove questi sono posizionati.
    2. Una volta compresa la posizione dei marcatori molecolari è possibile mappare i diversi geni/QTL a loro associati. Infatti misurando l’associazione tra uno o più marcatori molecolari ed un determinato fenotipo di un carattere (qualitativo o quantitativo) è possibile stimare la posizione del gene o del QTL che controlla proprio quel carattere. Ad esempio, uno dei geni che controlla il colore degli occhi è il gene Oca2. Si può stimare la sua posizione nel genoma umano semplicemente prendendo come riferimento la posizione di marcatori molecolari noti, che essendo molto vicini ed associati al gene Oca2, sono ereditati insieme. Conoscendo la posizione di questi marcatori molecolari possiamo presupporre che il gene è poco lontano da questi. Anche in questo caso è necessario usare software e test statistici specifici. Non penso sia saggio parlare dei test statistici impiegati in tal caso perché rischierei di annoiarvi più di quanto non abbia già fatto. Ciò che però vorrei farvi capire è che il processo di mappaggio dei geni e QTL che controllano specifici tratti di interesse prende il nome di “Linkage Disequilibrium Mapping”.
Foto di una mappa genetica del genoma di caffe dove possiamo osservare diversi geni/QTL mappati e con le distanze reciproche indicate in cM. Inoltre i geni/QTL più vicini tra loro vanno a costituire un Linkage Group (LG) e una buona mappa genetica presenta un numero di LG pari al numero di cromosomi dell’organismo studiato. Fonte M. Paillard 9 P. Lashermes 9 V. P6tiard
Construction of a molecular linkage map in coffee
.
  • Le mappe fisiche. Sono la rappresentazione grafica di diverse sequenze di DNA cromosomico la cui distanza è espressa in base pair (bp), paia di basi in italiano. Queste distanze non sono più relative come nel caso delle mappe genetiche ma sono distanze reali ottenute mediante il sequenziamento del genoma o della maggior parte di questo. I passaggi chiave per la costruzione di una mappa fisica sono:
    1. Costruzione di una libreria, ovvero un insieme di frammenti di DNA genomico prelevato dal tessuto di un organismo di cui vogliamo ottenere la mappa fisica.
    2. Sequenziamento dei frammenti della libreria. Questo passaggio consente di leggere la successione nucleotidica dei frammenti di DNA della libreria al fine di avere le sequenze “lette” in file fasta o fastq. Queste sequenze prendono il nome di “reads” e la loro lunghezza varia in base alla tecnica di sequenziamento usata.
    3. Assemblaggio delle “reads”. In questa ultima fase si ha la costruzione definitiva della mappa fisica. Infatti per assemblaggio delle reads si intende il processo di ordinamento delle sequenze di DNA ottenute dal sequenziamento al fine di costruire la sequenza dell’intero genoma dell’organismo, che in fondo, non è altro che la mappa fisica. L’ordinamento delle reads può essere eseguito in seguito al loro allineamento su di un genoma di riferimento di quell’organismo già presente in un database, in tal caso si parla di risequenziamento, oppure allineando le reads ottenuta dal sequenziamento tra loro con l’aiuto ad esempio di un Optical map, ovvero una mappa di riferimento di costituita da DNA linearizzato e marcato in specifici facilitando in tal modo la disposizione delle reads. Per l’allineamento e l’assemblaggio delle reads vengono impiegati diversi strumenti bioinformatici come ad esempio CAP3, Velvet o MaSuRCA v3.1.3 che usano diversi tipi di algoritmi di cui vi parlerò nel dettaglio in uno dei prossimi articoli.
Fonte: A 4-gigabase physical map unlocks the structure and evolution of the complex genome of Aegilops tauschii, the wheat D-genome progenitor. Ae. tauschii genome circle maps. The inner circle (#1) contains the physical maps of the Ae. tauschii chromosomes each with its short arm tip at 0 Mb. Circle #2 contains heat maps of recombination rates, circle #3 contains gene density heat maps, circle #4 contains heat maps of only genes collinear with the B. distachyon, rice, or sorghum pseudomolecules, and circle #5 shows global synteny with the rice chromosomes symbolizing 12 ancestral chromosomes. In circle #5, the active Ae. tauschii centromeres are white, inferred extinct centromeres are black, and the locations of current and inferred ancient telomeres are diagrammed by thick bars. Thirty-megabase windows sliding by 1 Mb were used in the heat map construction. The heat map units for circle #2 are cM/Mb and for circles #3 and #4 are numbers of genes and gene fragments discovered in the extended sequences per megabase of the physical maps.
  • Le mappe citologiche. Le mappe citologiche sono delle rappresentazioni grafiche dei cromosomi del genoma di un individuo. Queste sono ottenute utilizzando dei coloranti che consentono di ottenere specifici profili di bandeggio, ovvero delle bande colorate che evidenziano specifici tratti cromosomici.

Ok, devo ammettere che oggi mi sono lasciato un pò prendere la mano, vi chiedo scusa per la lunghezza dell’articolo ma credetemi non è facile semplificare e sintetizzare un argomento così vasto e complesso, chiedo pertanto venia anche agli esperti del settore che hanno sicuramente ritenuto troppo semplificato l’argomento ma cercando di arrivare anche a chi non sa molto di biologia molecolare ritengo necessarie le semplificazioni.

Vi invito ad iscrivervi al blog se non volete perdervi i prossimi articoli e a lasciare un commento qui sotto. Vi ricordo inoltre che potete seguirmi anche su Instagram.

Ciao e a presto.