La tecnica di sequenziamento Illumina è una delle tecniche di sequenziamento di seconda generazione. Queste sono diverse ma tutte hanno una fase di amplificazione dei frammenti di libreria prima del loro sequenziamento.

La tecnica di sequenziamento Illumina, come le altre tecniche di seconda generazione, si basa su tre passaggi principali:

  1. Costruzione di una libreria per le tecniche di nuova generazione (NGS) che prevede l'aggiunta di adattatori specifici ai frammenti di DNA o cDNA da sequenziare. A tal proposito si precisa che gli adattatori utilizzati sono differenti a seconda della tecnica utilizzata.
  2. Amplificazione di frammenti di libreria. Questa fase si svolge in modo diverso a seconda della tecnica di seconda generazione utilizzata.
  3. Sequenziamento dei frammenti attraverso cicli di reazioni biochimiche. Durante i cicli di reazione vengono acquisite informazioni che consentono, tramite specifico software, di ricostruire una sequenza di DNA o cDNA. Anche questa fase varia a seconda della tecnica utilizzata.

Come ho già accennato nell'articolo "The sequencing", esistono diverse tecniche di seconda generazione ma sicuramente, da quello che ho notato dalla mia breve esperienza, la tecnica di sequenziamento di seconda generazione più utilizzata è Illumina, quindi in questo articolo cercherò di spiegare come funziona nel modo più semplice possibile ma prima vorrei presentarvi, utilizzando la tabella sottostante, i vantaggi e gli svantaggi delle tecniche di sequenziamento di seconda generazione.

VANTAGGISVANTAGGI
- Non è necessario costruire una libreria in vettori di clonazione quindi la fase di trasformazione non è necessaria.
- Un gran numero dei frammenti della libreria (> 96 frammenti) può essere sequenziato in spazi molto piccoli.
- Lavori con volumi molto piccoli.
- I costi sono bassi, ma non è consigliabile utilizzare una tecnica NGS di seconda generazione se dobbiamo sequenziare pochi frammenti.
- La lunghezza delle sequenze ottenute in seguito al sequenziamento è ridotta, solitamente le letture ottenute con le tecniche NGS di seconda generazione sono lunghe al massimo 2-600 bp.
- La precisione delle reads ottenute è 10 volte inferiore rispetto a quella del sequenziamento Sanger.

Ora, come promesso, parliamo della tecnica di sequenziamento Illumina. Questa, infatti, è oggigiorno molto utilizzata e permette di ottenere reads lunghe 250-500 bp.

La tecnica Illumina prevede tre fasi principali:

  • Costruire la libreria.
  • Amplificazione di frammenti della libreria selezionati mediante bridge PCR (bPCR).
  • Sequenziamento del prodotto di amplificazione utilizzando il metodo del sequencing-by-synthesis.

Descriviamo ora in dettaglio le diverse fasi.

COSTRUZIONE DELLA BIBLIOTECA

Sono disponibili due passaggi per creare la libreria di sequenziamento Illumina:

  1. Frammentazione del DNA genomico estratto o del cDNA ottenuto dal trascrittoma estratto dall'organismo campione mediante sonicazione o restrizione enzimatica per ottenere frammenti con una dimensione massima di 1000 bp. È importante considerare che i frammenti ottenuti non devono superare i 1000 bp di lunghezza altrimenti ci saranno problemi durante il sequenziamento.
  2. Quindi legare alle estremità dei frammenti a doppio filamento gli Adattatori Illumina. Gli adattatori sono di due tipi e vengono indicati come adattatori A e adattatori B. I frammenti che verranno poi utilizzati nelle fasi successive del sequenziamento Illumina saranno quelli dotati di un adattatore A a un'estremità e di un adattatore B all'altra estremità. Questi frammenti formati correttamente sono isolati in diversi modi, ma uno dei metodi più popolari prevede l'uso di perle paramagnetiche, cioè biglie che diventano magnetiche quando poste all'interno di un campo magnetico, e su cui molecole di streptavidina si trovano. In particolare, la selezione dei frammenti è consentita dalla legame tra streptavidina e biotina, che è collegata ad uno dei due tipi di adattatori, ad esempio l'adattatore B.
Figura 1. Frammentazione del DNA e isolamento dei frammenti per il sequenziamento utilizzando perline paramagnetiche dotate di streptavidina.

Vorrei aprire una parentesi sugli adattatori Illumina, infatti, come accennavo sopra, ne esistono due categorie:

  • Adattatori Illumina single index. Questi adattatori contengono Barcode (o indice), ovvero le sequenze di DNA che identificano uno specifico campione (dove campione indica un genotipo specifico) pertanto inserendo queste sequenze all'interno degli adattatori è possibile sequenziare simultaneamente i frammenti relativi a diversi genotipi. Il sequenziamento di più campioni contemporaneamente è chiamato sequenziamento multiplo o multiplexing.
    Questi adattatori sono costituiti da:
    a) regione universale che corrisponde ai primer per l'amplificazione (questa regione è diversa tra gli adattatori A, che si legano a un primer, e gli adattatori B, che si legano a un altro primer).
    b) Codice a barre (o indice) Illumina presente sull'adattatore A o sull'adattatore B.
    c) regione universale a cui il primer è legato per il sequenziamento.
Figura 2. Adattatori ILLUMINA single index.
  • Adattatori Illumina dual index. Questi sono invece caratterizzati dal fatto che sia gli adattatori A che gli adattatori B sono dotati di un codice a barre che ne identifica il genotipo. In questo caso, a differenza degli adattatori Illumina Single Index, questi adattatori consentono un livello di multiplexing superiore, infatti viene utilizzato un codice a barre per distinguere i diversi campioni, ovvero i diversi genotipi che vengono sequenziati contemporaneamente, e un altro codice a barre viene invece utilizzato per distinguere specifiche sequenze all'interno della libreria di ogni genotipo.
Figura 3. Adattatori a doppio indice ILLUMINA. Fonte: https://support.illumina.com/bulletins/2020/06/illumina-adapter-portfolio.html
  • Adattatori Illumina senza codice a barre (indice). Sono adattatori utilizzati in protocolli di sequenziamento standard Illumina in cui la flow cell, ovvero il supporto su cui vengono posti i frammenti e su cui avviene la reazione di amplificazione e sequenziamento, è in grado di separare fisicamente i campioni da sequenziare da diversi genotipi, pertanto non sono necessari codici a barre per la distinzione del diversi campioni di DNA. Questi adattatori sono costituiti da:
  1. regione universale che si accoppia ai primer per l'amplificazione (questa regione è diversa tra gli adattatori A, che si legano a un primer, e gli adattatori B, che si legano a un altro primer).
  2. regione universale a cui il primer si lega per il sequenziamento.
Figura 4. Utilizzo di codici a barre per utilizzare sequenze multiple (multiplexing).

AMPLIFICAZIONE DEI FRAMMENTI DIELLA LIBRERIA SELEZIONATI TRAMITE BRIDGE PCR (bPCR)

Una volta selezionati i frammenti della libreria dotata di adattatore A e B, si procede con l'amplificazione di questi utilizzando un metodo chiamato ponte PCR, che consiste nell'amplificare i frammenti su un supporto solido, chiamato flow cell, su cui sono disposti i primer di amplificazione in grado di riconoscere e legare gli adattatori A e B, ad esempio il forward primer si lega all'adattatore A e il rovescio all'adattatore B.

In particolare, il bridge PCR avviene nel seguente modo:

  • I frammenti si legano ai primer forward e reverse della flow cell.
  • La DNA polimerasi avvia l'amplificazione dei frammenti legati ai primer della flow cell (la reazione di amplificazione è consentita dal fatto che sulla flow cell sono presenti tutti i reagenti per la reazione di amplificazione quali: Taq polimerasi, dNTPs, Buffer, Mg2 + ).
  • Dopo il primo ciclo di amplificazione, avviene la denaturazione a 94 ° C e successiva rimozione, mediante lavaggio, dei frammenti utilizzati come stampo. Infatti, solo i frammenti appena sintetizzati che hanno incorporato il primer legato alla cella a flusso rimarranno sulla flow cell.
  • I frammenti appena sintetizzati si pegano sulla flow cell formando un “ponte” grazie al legame dell'adattatore libero con un altro primer di amplificazione complementare presente sulla flow cell. A questo punto la DNA polimerasi inizia un nuovo ciclo di amplificazione producendo così un nuovo frammento. Al termine di questa seconda amplificazione avviene una denaturazione ma in questo caso nessun frammento verrà lavato via poiché tutti sono ancorati alla flow cell.
  • Vengono quindi eseguiti diversi cicli di amplificazione come al punto precedente fino ad ottenere cluster (raggruppamenti) di copie di ciascun frammento linearizzato disposte ciascuna in punti differenti della flow cell. Da notare che per ottenere cluster omogenei, cioè contenenti copie di un solo tipo di frammento, è necessario che i frammenti abbiano una dimensione inferiore a 1000 bp, infatti se sono più grandi rischiano di invadere altri cluster durante il processo amplificazione. L'omogeneità dei cluster è fondamentale nella successiva fase di sequenziamento, in cui le reads ottenute da un cluster saranno quindi relative alle copie di un singolo frammento della libreria.
  • Una volta raggiunta la condizione di cluster di copie di frammenti linearizzati, si procede alla lisi chimica e al successivo lavaggio al fine di rimuovere i frammenti reverse dalla flow cell, trattenendo solo i frammenti forward.
  • Infine, prima di procedere con il sequenziamento, si procede al blocking, ovvero si blocca l'estremità 3 'dei frammenti rimasti sulla flow cell per evitare la formazione di ulteriori ponti di frammenti indesiderati.
Figura 6. Diagramma riassuntivo del bPCR. Fonte: https://en.wikipedia.org/wiki/Illumina_dye_sequencing
Video 1. Bridge PCR sulla cella a flusso ILLUMINA. Fonte: canale youtube Illumina (https://www.youtube.com/watch?v=pfZp5Vgsbw0) Video 1. Bridge PCR su flow cell ILLUMINA. Fonte: canale YouTube Illumina (https://www.youtube.com/watch?v=pfZp5Vgsbw0) Video 1. Bridge PCR sulla cella a flusso ILLUMINA. Fonte: canale youtube Illumina (https://www.youtube.com/watch?v=pfZp5Vgsbw0)

SEQUENZIAMENTO DEL PRODOTTO DI AMPLIFICAZIONE MEDIANTE IL METODO SEQUENCING-BY-SYNTHESIS

Il metodo di sequenziamento utilizzato viene definito sequencing-by-synthesis poiché si basa sull'attività della DNA polimerasi che, partendo da un primer di sequenziamento, aggiunge un nucleotide alla volta in modo da avere una lettura complementare ad uno specifico frammento della flow cell. Ogni nucleotide è contrassegnato da diverse molecole fluorescenti che emettono luce di un colore diverso che viene poi rilevata da un'apposita telecamera. Inoltre, questi nucleotidi hanno un blocco sul gruppo idrossile libero (-OH) in modo che solo un nucleotide può essere aggiunto per ciclo di sequenziamento.

In particolare, esistono due diversi approcci di sequencing-by-synthesis:

  1. Sequencing-by-synthesis single read, cioè un sequenziamento che prevede la lettura di una sola estremita' dei frammenti della libreria. Questo approccio di sequenziamento consente solitamente di ottenere solo le prime 250 basi azotate di un'estremità di ciascun frammento della libreria pertanto è spesso indicato nel seguente modo 1 × 250 bp.
  2. Sequencing-by-synthesis paired end, cioè un sequenziamento che prevede la lettura di entrambe le estremita' dei frammenti della libreria. In questo caso si ottengono le reads relative ad entrambe le estremità dei frammenti, infatti in questo caso il numero di basi azotate della sequenza di ogni frammento fornite dal sequenziamento è pari a 500 bp, 250 rispetto alla lettura a 3 'e 250 relativi alla 5' lettura del frammento. Questo approccio è indicato dalla formulazione 2 × 250 bp ed è molto utile in quanto avere le reads relative alle due estremità del frammento consente un migliore assemblaggio della sequenza di DNA o cDNA sequenziata. È anche necessario immaginare che se i frammenti della libreria hanno una dimensione di 500 bp significa che con un sequenziamento paired end saremmo in grado di sequenziare integralmente i suddetti frammenti.

Ho deciso di non parlarvi dei passaggi che avvengono durante il sequenziamento by-synthesis per non rendere la lettura troppo pesante, in quanto si tratta sempre di concetti difficili da esprimere con poche e semplici parole. Se invece vuoi conoscere nel dettaglio le fasi del sequenziamento single end e paired end scrivimi nei commenti e seguimi su Instagram.

Attenzione però non è tutto oro quel che luccica, infatti questa tecnica di sequenziamento ha anche i suoi svantaggi. Questi sono principalmente due:

  • Possono verificarsi fenomeni di sostituzione dei nucleotidi. Durante il sequenziamento, la DNA polimerasi potrebbe infatti inserire un nucleotide errato, cioè non complementare al nucleotide del frammento. Ciò può accadere perché tutti e quattro i tipi di nucleotidi vengono forniti simultaneamente in ogni ciclo di sequenziamento.
  • Lunghezza delle reads ridotta (massimo 250 bp) che rende più complesso l'assemblaggio della sequenza di DNA o cDNA sequenziato. Nel sequenziamento Illumina le reads non possono superare i 250 bp di lunghezza perché se sono eccessivamente lunghe si ottengono errori nella rilevazione del segnale luminoso dovuti alla rimozione incompleta delle molecole fluorescenti.
Video 2. Come funziona il sequenziamento di seconda generazione Illumina. Fonte: canale youtube ILLLUMINA (https://www.youtube.com/watch?v=fCd6B5HRaZ8)

Ora non mi resta che ringraziarti per la lettura. Come sempre spero di averti lasciato alcune informazioni utili con questo articolo e che tu abbia capito in dettaglio come funziona questa tecnica di sequenziamento.

Ciao e a presto.