Nel mezzo del cammin della mia tesi
mi ritrovai per una tecnica oscura,
ché la dose di reagenti era confusa.

Ahi quanto a dir qual era è cosa dura
questo campione selvaggio e aspro e forte
che nel pensier rinnova la paura!

Se Dante fosse stato un biologo penso che la divina commedia sarebbe iniziata così.

Invece a reinterpretare le sue parole sono stato io. In questi giorni ho avuto il doloroso piacere di estrarre del DNA da piante di Solanum linnaeanum. Si, avete letto bene, ho detto doloroso piacere. È un po’ un controsenso ma di fatto è così. Basta vedere l’immagine riportata qui sotto per capire che toccare le foglie di questa pianta, parente della malenzana (Solanum melongena), è decisamente doloroso, in compenso estrarre il DNA da questa è davvero divertente.

Solanum linneanum (“Solanum linnaeanum Hepper & P.-M.L. Jaeger {ID 7382} – Morella di Sodoma”. In Acta Plantarum, Forum. Disponibile on line (data di consultazione: Oct 2020 ): https://www.floraitaliae.actaplantarum.org/viewtopic.php?f=95&t=7657)

Ad ogni modo, mentre combattevo con la pianta spinescente mi sono ricordato di tutte quelle volte che ho cercato di spiegare a qualcuno, non addetto ai lavori, che con determinati programmi è possibile mettere a nudo la sequenza di DNA di un qualunque organismo vivente. Spesso quel qualcuno mi guardava con aria confusa. In effetti mi rendo conto che, a prima vista, questo concetto può essere un po’ astratto, in fondo il DNA è una molecola che si trova nelle cellule, come è possibile ricavarne una sequenza? E poi, cosa si intende per sequenza di DNA? Ho dunque deciso di spiegarvi, in modo semplice, come si passa dal DNA di un organismo al computer che ci permettere di leggere la sequenza di lettere (A, T, C, G) che lo descrive.

Il DNA è una molecola organica, di grosse dimensioni, costituita da diversi nucleotidi, chiamiamoli mattoncini, che a loro volta sono composti da altre molecole, molto più piccole del DNA, chiamate basi azotate. Queste custodiscono le istruzioni sul funzionamento della cellula e quindi dell’intero organismo. Immaginate il DNA di un individuo come un manuale relativo al suo funzionamento. Questo manuale è scritto con un alfabeto di quattro lettere,ovvero A (Adenina), T (Timina), C (Citosina) e G (Guanina).

Adenina, Timina, Citosina e Guanina sono appunto le basi azotate che troviamo nei nucleotidi del DNA.

Attraverso un processo detto sequenziamento è possibile ottenere l’intera sequenza del DNA di un individuo, ovvero la successione delle lettere suddette. Potremmo dunque dire che attraverso il sequenziamento si ottiene l’intero manuale DNA scritto in file facilmente utilizzabili dal computer al fine di ricavare diverse informazioni relative all’organismo da cui il DNA è stato estratto.

Per ottenere però la sequenza del DNA è necessario partire dal laboratorio ed arrivare al computer.

Cerco di farvela semplice, sperando che chi lavora nel settore mi conceda questa semplificazione. I passaggi chiave per passare dal DNA della cellula al computer sono sostanzialmente due:

  1. L’estrazione del DNA, ovvero il processo che ti permette di isolare il DNA dal resto delle componenti cellulari di un organismo. Proprio come io ho estratto il DNA dalle foglie della pianta “assassina”.  Per farlo si possono preparare specifici reagenti in laboratorio o utilizzare dei kit appositamente costruiti per lo scopo. Ad esempio io ho impiegato un kit, ovvero E.Z.N.A.® Plant DNA Kit.
  2. Il sequenziamento del DNA. Le tecniche di sequenziamento sono davvero tantissime e parlarne ora appesantirebbe, e non poco, la lettura. Basta che sappiate che il sequenziamento è un processo per noi cruciale. Questo permette infatti di ricavare la sequenza di tutte le basi azotate che si trovano nel DNA estratto tramite uno strumento definito sequenziatore. In tale fase si passa dunque dalla molecola di DNA al file contenente il messaggio del DNA. Non so se ho reso l’idea ma è proprio attraverso il sequenziamento che passiamo dalla cellula al computer.

Solitamente i laboratori che non possiedono un sequenziatore spediscono il DNA estratto a dei centri specializzati nel sequenziamento; un esempio a tal proposito è Novogene (https://en.novogene.com/).  Questi centri sequenziano il DNA che gli viene spedito e, sotto pagamento, restituiscono un hard disk con il file contenente la sequenza del DNA dell’organismo. Questi file hanno l’estensione .sra e saranno poi proprio questi il punto di partenza delle analisi bioinformatiche. Questi file devono prima però essere ripuliti al fine di ottenere dei file (fasta o fastq, di cui parlerò nel dettaglio in un prossimo articolo) in cui la sequenza di DNA è priva di “contaminazioni” dovute alla tecnica di sequenziamento usata.

Spero che ora abbiate più chiaro il modo in cui si ottengono le sequenze di DNA su cui un bioinformatico lavora quotidianamente al fine di trovare un senso a tutto l’insieme di dati che si trova davanti e rispondendo così alle diverse domande che è lecito porsi quando siamo di fronte ad un fenomeno biologico. Attenzione però, il bioinformatico non lavora solo con il DNA ma anche con altre molecole, altrettanto fondamentali, come RNA, proteine e metaboliti vari prodotti dai diversi processi che avvengono nella cellula, di cui parlerò più avanti.

Ciao a tutti. A presto.