La tecnica di sequenziamento Sanger è stata messa a punto da Frederick Sanger, il quale vinse un Nobel per questo, e collaboratori nel 1977. Per molto tempo questa tecnica di sequenziamento è stata la tecnica di riferimento per il sequenziamento di DNA o cDNA, inizialmente basandosi su un approccio gerarchico di sequenziamento e successivamente usando un approccio shot gun. Oggigiorno il sequenziamento Sanger è stato in parte sostituito da metodi di sequenziamento di nuova generazione. Tuttavia questa tecnica rimane ampiamente utilizzata per il sequenziamento di porzioni ridotte di genoma o semplicemente per il sequenziamento di una sequenza target di interesse.

Esistono due metodi di sequenziamento Sanger che differiscono per il procedimento e per il tipo di sequenziatore usato, ovvero il sequenziamento Sanger effettuato mediante sequenziatore a gel di acrilammide oppure con sequenziatore capillare. Quest’ultimo è ormai il più usato quindi, con lo scopo di rendere più “serena” la lettura, ho deciso di parlarvi nel dettaglio esclusivamente di questo. Se volete comunque saperne di più del sequenziamento Sanger con sequenziatore a gel di acrilammide potete vedere il video riassuntivo della tecnica di sequenziamento Sanger su gel qui sotto riportato.

Parliamo ora nel dettaglio del sequenziamento Sanger con sequenziatore capillare. Questa tecnica segue tre passaggi fondamentali:

  1. Costruzione della libreria per il sequenziamento Sanger.
  2. Reazione di sequenziamento.
  3. Separazione dei sotto-frammenti mediante elettroforesi.

Analizziamo i diversi passaggi separatamente:

Costruzione della libreria per il sequenziamento Sanger

Un requisito importante per il sequenziamento di una molecola di DNA o cDNA è la costruzione di una libreria, come ho detto nell’articolo Il sequenziamento, l’insieme dei frammenti di DNA o cDNA ottenuti da un genoma o trascrittoma da sequenziare, prende il nome di libreria.

Una libreria può essere di due tipi a seconda del materiale biologico che si va a sequenziare:

  • Libreria genomica, ovvero l’insieme di tutti i frammenti di DNA la cui somma ci permette di ottenere l’intero genoma dell’organismo o di una porzione di questo.
  • Libreria a cDNA o trascrittomica, ovvero l’insieme dei cDNA prodotti per trascrizione inversa degli mRNA che insieme costituiscono il trascrittoma dell’organismo o una parte di questo.

Per costruire una libreria di cDNA o DNA che deve essere impiegata per il sequenziamento mediante sequenziatore capillare Sanger vengono effettuati i seguenti passaggi:

  1. Estrazione e frammentazione del DNA o cDNA che può essere effettuata mediante una digestione parziale con enzimi di restrizione, ovvero utilizzando degli enzimi di restrizione posti in condizioni non ottimali di restrizione affinché si formino dei frammenti di DNA (o cDNA) in parte sovrapponibili a partire dalle diverse copie di DNA o cDNA estratto (vedi immagine A), oppure mediante sonicazione, ovvero una frammentazione meccanica che consiste nell’utilizzo di onde d’urto per la rottura del DNA in frammenti in parte sovrapponibili(vedi immagine B). Inoltre, nella sonicazione i frammenti vengono danneggiati pertanto è necessario riparare le estremità, si parla infatti di “end repairing“. In entrambi i casi è necessario dunque ottenere frammenti sovrapponibili di DNA o cDNA al fine di riuscire poi a riordinare le sequenze dei frammenti (reads) durante l’assemblaggio con appositi software bioinformatici.

Quando viene effettuata la frammentazione del DNA o cDNA da sequenziare è possibile inoltre scegliere la dimensione media dei frammenti che costituiranno la libreria andando a regolare i tempi e le condizioni di reazione, nel caso in cui viene effettuata una digestione chimica con enzimi di restrizione oppure gestendo i tempi e l’intensità di sonicazione, nel caso in cui viene effettuata una frammentazione meccanica.

2. Clonaggio all’interno di un vettore. Dopo aver ottenuto i frammenti questi vengono inseriti all’interno di vettori di clonaggio, cioè delle molecole di DNA a doppia elica (dsDNA) in cui viene inserito del DNA esogeno capace di replicare autonomamente in una cellula ospite. Tutti i vettori di clonaggio devono avere le seguenti caratteristiche:

  • Possedere uno o più siti di restrizione (polylinker o multiple cloning site) necessari all’inserimento del DNA esogeno, ovvero i singoli frammenti di DNA della libreria.
  • Possedere un origine di replicazione, ovvero i geni che controllano la replicazione autonoma del vettore all’interno dell’organismo ospite.
  • Possedere uno o più geni marker di selezione, necessari per il riconoscimento e la selezione delle cellule trasformate e dunque contenente il vettore.

Occorre considerare che per inserire il frammento all’interno del vettore è necessario che il primo abbia delle estremità complementari alle estremità del sito del vettore interessato dal taglio di uno specifico enzima di restrizione (immagine C). Per avere questa complementarietà è essenziale impiegare lo stesso enzima di restrizione utilizzato per tagliare il vettore anche per la frammentazione del DNA al fine di ottenere i frammenti che costituiranno la libreria. Se invece la frammentazione del DNA da sequenziare è meccanica, ovvero i frammenti sono ottenuti per sonicazione, è necessario aggiunge ai questi adattatori complementari al sito di taglio nel vettore (vedi immagine D). In ogni modo l’enzima che permette il legame tra il frammento di DNA e il vettore prende il nome di ligasi.

Esistono diversi tipi di vettori di clonaggio ma i più importanti sono:

  1. I plasmidi, ovvero molecole di DNA a doppio filamento extra-cromosomico e rappresentano circa il 2-3% del genoma batterico
  2. I BACs, plasmidi di grandi dimensioni creati sfruttando il plasmide F tipico dei batteri, cioè il plasmide che contiene al suo interno i geni F ovvero i fattori di fertilità per la coniugazione batterica. Questi vettori consentono di contenere e clonare dei frammenti che hanno una lunghezza massima di 300 000 bp e risultano pertanto i vettori più adatti per la formazione di librerie di genomi di grandi dimensioni.
  3. I YACs, ovvero vettori costituiti da DNA a doppio filamento che risulta essere un ibrido tra DNA plasmidico batterico e DNA di lievito. Quando in questi vettori viene inserito un frammento formano dei mini-cromosomi artificiali e lineari che sono poi inseriti in Saccaromyces cereviseae. I vettori YACs possono contenere frammenti con una lunghezza massima di 2 Mbp.

3. Trasformazione degli organismi unicellulari con i vettori di clonaggio. I vettori di clonaggio dotati dei frammenti di DNA proventi dal DNA o cDNA da sequenziare vengono inseriti in batteri o lieviti a seconda del tipo di vettore. In particolare i vettori plasmidici sono inseriti in Escherichia coli mediante shock termico mentre i vettori BACs e YACs sono inseriti rispettivamente in E. coli e in S. cereviseae mediante elettroporazione.

4. Messa in coltura e coltura delle cellule trasformate con opportuni mezzi di crescita, il che permette il clonaggio dei vettori e dunque dei frammenti di DNA in essi inseriti.

5. Selezione delle cellule correttamente trasformate, ovvero quelle cellule che avranno i vettori contenenti i frammenti di DNA.

6. Estrazione dei vettori di clonaggio contenenti i frammenti di DNA clonati grazie alla riproduzione del batterio o lievito.

Immagine che descrive in sintesi il processo di creazione di una libreria genomica per il sequenziamento Sanger.

Reazione di sequenziamento

Una volta ottenuta la libreria di DNA o cDNA si può procedere con la reazione di sequenziamento. Proprio in questa fase viene usato il sequenziatore Sanger capillare. Ma vediamo nel dettaglio come avviene la reazione di sequenziamento Sanger capillare.

I reagenti necessari per la reazione di sequenziamento sono:

  • Frammenti della libraria in vettori di clonaggio estratti dal batterio o dal lievito impiegati durante il clonaggio.
  • DNA polimerasi (Taq Polimerasi)
  • Primer universale di sequenziamento, complementare ad una porzione del vettore di clonaggio usato per la costruzione della libraria.
  • dNTPs (deossinucleotidi)
  • ddNTPs (di-deossinucleotidi, mancano dell’OH al 3’), questi sono definiti terminatori perché, se sono inseriti in una catena polinucleotidica da parte della DNA polimerasi, determinano l’interruzione della replicazione a causa della mancanza del gruppo OH a cui si dovrebbe legare un nucleotide successivo. Solitamente i terminatori sono presenti in minore quantità nella miscela di reazione rispetto ai deossinucleotidi, in particolare il loro rapporto è di 1:100 (1 terminatore ogni 100 deossinucleotidi). Un altro aspetto fondamentale da considerare è che i terminatori sono anche “marcati” con 4 molecole fluorescenti differenti, una per ogni base azotata (A,C,G,T), che assorbono la luce ad una lunghezza d’onda di 490 nm ma che emettono luce per fluorescenza ad una lunghezza d’onda differente il che ci permette di distinguere le diverse basi azotate del frammento in sequenziamento in funzione della luce emessa.

Ma ecco come avviene nel dettaglio la reazione di sequenziamento:

All’interno di una eppendorf che contiene uno specifico frammento della libreria avvengono i passaggi sotto riportati, pertanto alla fine della reazione di sequenziamento otterremo una eppendorf per ogni determinato frammento della libreria, ciascuna contenente il prodotto della reazione di sequenziamento di quel frammento. Ciò che possiamo anticipare è che la reazione di sequenziamento si ispira al processo di replicazione che avviene a carico del DNA nella cellula.

  • Appaiamento tra il primer di sequenziamento e i vettori di clonaggio in cui sono contenute le diverse copie di uno specifico frammento.
  • La DNA polimerasi inizia ad aggiungere deossinucleotidi fino a quando casualmente viene aggiunto un terminatore (di-deossinucleotidi), il quale determina l’interruzione della replicazione del frammento da sequenziare.
  • Si ripetono diverse volte i primi due passaggi, cosicché da un frammento da sequenziare si formeranno tutti i possibili sotto-frammenti con una lunghezza compresa tra la lunghezza del primer più un nucleotide e 800/1000 bp. Questi sotto-frammenti sono ottenuti per interruzione della replicazione nel momento in cui si inserisce una delle quattro tipologie di terminatori presenti nella miscela di reazione. Tutti i frammenti che vengono prodotti per i diversi cicli di sequenziamento a partire da uno stesso frammento della libreria differiscono tra loro di un nucleotide poiché, pur essendo che il terminatore si aggiunge in modo casuale, il numero di cicli di sequenziamento che vengono effettuati permettono ai terminatori di legarsi in tutte le possibili posizioni comprese ed incluse tra il primo nucleotide e l’ultimo nucleotide dopo 800/1000 bp.

Separazione dei sotto-frammenti mediante elettroforesi

Questa fase consente la separazione dei diversi sotto-frammenti ottenuti dal sequenziamento Sanger di uno specifico frammento della libreria. La eppendorf contenete il prodotto della reazione di sequenziamento viene posta su di un sostegno che riesce ad ospitare fino a 96 eppendorf, per tale ragione il sequenziatore sanger capillare ci permette di sequenziare contemporaneamente fino a 96 diversi frammenti di una libreria. Inoltre, il contenuto di ciascuna eppendorf viene posto nei pozzetti di un supporto, e ciascun pozzetto è collegato ad un capillare. All’interno di ciascun capillare vi è un gel in cui i frammenti di DNA o cDNA di ciascun pozzetto si muovono secondo la differenza di potenziale presente tra le estremità del capillare stesso. Inoltre ciascun capillare viene illuminato da un laser con un lunghezza d’onda di 490 nm, al fine di stimolare l’emissione di luce per fluorescenza da parte delle molecole fluorescenti associate ai terminatori. A ciascun terminatore diverso sono associate differenti molecole fluorescenti ed è proprio per questo che è possibile ricostruire la sequenza del frammento durante il sequenziamento. Inoltre alla fine della lettura dei diversi segnali di fluorescenza da parte di un apposito rilevatore posto all’interno del sequenziatore, un software elabora un cromatogramma, ovvero un tracciato che mette in evidenza i diversi picchi di fluorescenza corrispondenti ai diversi nucleotidi della sequenza. Il software infatti dopo aver letto la fluorescenza procede con l’identificazione delle basi azotate corrispondenti ai diversi picchi mediante un processo definito base calling. Il primo output prodotto direttamente dal software è un file con estensione *.scf o *.ab1 nel quale è conservato il cromatogramma dei frammenti della libreria sequenziati. Successivamente il file contenente il cromatogramma permette di generare due file:

1) File fasta, il quale contiene la sequenza di basi azotate del frammento sequenziato.

2) File qual che contiene informazioni riguardo la qualità della sequenza ottenuta dal sequenziamento. Infatti in questo file si trovano valori di qualità corrispondenti a ciascun picco del cromatogramma, calcolati sulla base di diversi parametri come la forma, la posizione e la risoluzione dei singoli picchi del cromatogramma. Nel file qual i valori di qualità sono riportati come valori numerici separati ognuno da uno spazio.

Immagine recuperata da wikipedia, dove viene schematizzato il processo di sequenziamento Sanger capillare

Come abbiamo detto il sequenziatore costruisce dunque un cromatogramma da cui si ricava la sequenza nucleotidica (fino a 800-1000 bp) del DNA o cDNA che abbiamo sequenziato. È necessario però considerare che osservare il cromatogramma è sempre molto utile poiché ci permette di capire se ci sono stati dei problemi nel corso del sequenziamento. I problemi che possono verificarsi durante il sequenziamento sono diversi, pertanto andiamo a vederne qualcuno nel dettaglio:

  • Le prime 50 bp che vengono rilevate dal sequenziatore a volte non sono corrette poiché in questa prima fase il segnale di fluorescenza è indistinguibile dal rumore di fondo che può essere presente a causa della migrazione anomala di piccoli frammenti di DNA che contengono agglomerati di molecole fluorescenti (vedi immagine sotto riportata). Per ovviare a questo problema è possibile impiegare dei primer di sequenziamento complementari ad una porzione del vettore di clonaggio che si trova circa 50 nucleotidi a monte del punto in cui è inserito il frammento da sequenziare. In tal modo gli agglomerati di molecole fluorescenti sono relativi ai 50 nucleotidi del vettore di clonaggio e non al nostro frammento di interesse preservando in tal modo la sequenza nucleotidica del frammento target.
  • Con la tecnica di sequenziamento Sanger è possibile sequenziare frammenti lunghi al massimo 800-1000 bp poichè altrimenti sarebbe difficile discriminare i frammenti per un singolo nucleotide, infatti il rilevamento della fluorescenza dei frammenti più lunghi di 1000 bp risulta essere più complicato. Se guardiamo infatti la porzione terminale di un cromatogramma (circa dopo 900 nucleotidi) i picchi non sono più omogenei e possono essere frequenti degli errore durante il base calling (vedi immagine sotto riportata).
  • Se si osservano dei picchi non ben definiti anche a livello della porzione centrale del cromatogramma, probabilmente il DNA utilizzato per effettuare la reazione di sequenziamento presentava delle contaminazioni. Per ovviare a tale problema può essere utile purificare meglio il DNA prima di procedere con il sequenziamento (vedi immagine sottostante). Questo tipo di problema si verifica poiché il sequenziatore capillare è molto sensibile alla presenza di contaminanti.
  • Se si osservano dei picchi sovrapposti e non bene distanziati probabilmente sono presenti nella miscela di reazione per il sequenziamento dei sali residui di una precedente PCR pertanto per ovviare a tale problema è necessario ripreparare il DNA purificandolo al fine di rimuovere possibili contaminanti (vedi immagine sotto riportata).
  • Infine se si osserva un cromatogramma particolarmente alterato (vedi immagine sotto) probabilmente la quantità di DNA che è stata sequenziata era troppo elevata dunque in tal caso per ovviare a tale problema sarà necessario diluire il DNA da utilizzare nella reazione di sequenziamento.

Infine penso che sia utile elencare le principali vantaggi e svantaggi del sequenziamento Sanger capillare:

VANTAGGISVANTAGGI
– Accuratezza (99.9%)
– Permette di ottenere delle reads relativamente lunghe (800-1000 bp)
– È possibile sequenziare un numero limitato di campioni (max 96 con il sequenziatore capillare).
– Comporta una complessa organizzazione dei lavori, basti pensare al fatto che è necessario effettuare la costruzione di una libreria molto complessa che richiede anche dei tempi molto lunghi determinati principalmente dalla fase di clonaggio.
– Costi elevati (0,40€/Kbp), quindi il sequenziamento Sanger è economicamente conveniente solo nel caso di frammenti di ridotte dimensioni.

So che tutto il procedimento che ho appena descritto può sembrarvi molto astruso, ho cercato come sempre di semplificare e rendere il più chiaro possibile dei concetti complessi che, almeno per me, è impossibile esprimere in modo più comprensibile. In ogni modo, per rendere più semplice la comprensione, ho deciso di inserire un video che ho trovato su YouTube che illustra benissimo le diverse fasi del sequenziamento Sanger capillare.

Ciao e a presto.