La tecnica di sequenziamento Illumina fa parte delle tecniche di sequenziamento di seconda generazione. Queste sono diverse ma tutte presentano una fase di amplificazione dei frammenti della libreria precedente al loro sequenziamento.

La tecnica di sequenziamento Illumina, come le altre tecniche di seconda generazione, si basa su tre step principali:

  1. Costruzione di una libreria per tecniche di nuova generazione (NGS) che prevede l’aggiunta di specifici adattatori ai frammenti di DNA o cDNA da sequenziare. A tal proposito occorre precisare che gli adattatori usati sono diversi in base alla tecnica impiegata.
  2. Amplificazione dei frammenti della libreria. Questa fase avviene in modo diverso in funzione della tecnica di seconda generazione impiegata.
  3. Reazione di sequenziamento tramite cicli di reazioni biochimiche. Durante i cicli di reazione vengono acquisite delle informazioni che permettono, mediante un apposito software, di ricostruire una sequenza di DNA o cDNA. Anche questa fase varia a seconda della tecnica impiegata.

Come ho già menzionato nell’articolo “Il sequenziamento”, esistono diverse tecniche di seconda generazione ma sicuramente, da quello che ho appurato dalla mia pur breve esperienza, la tecnica di sequenziamento di seconda generazione più usata è Illumina, pertanto in questo articolo proverò a spiegarvi come funziona nel modo più semplice possibile ma prima vorrei presentarvi, mediante la tabella riportata di seguito, i vantaggi e gli svantaggi relativi alle tecniche di sequenziamento di seconda generazione.

VANTAGGISVANTAGGI
– Non c’è la necessità di costruire una libreria in vettori di clonaggio dunque non è necessaria la fase di trasformazione.
– Si possono sequenziare in spazi molto piccoli un numero elevato di frammenti della libreria (> di 96 frammenti).
– Si lavora con volumi molto piccoli.
– I costi sono contenuti, ma non conviene adoperare una tecnica NGS di 2° generazione se dobbiamo sequenziare pochi frammenti.
– La lunghezza della sequenze ottenute in seguito al sequenziamento è ridotta, solitamente le reads ottenute dalle tecniche NGS di 2° generazione sono lunghe massimo 600-700 bp.
– L’accuratezza delle reads ottenuti è 10 volte inferiore del sequenziamento Sanger.

Ma adesso, come promesso, parliamo della tecnica di sequenziamento Illumina. Questa, oggigiorno è infatti molto utilizzata e consente di ottenere reads lunghe 250-500 bp.

La tecnica Illumina prevede tre step principali:

  • Costruzione della libreria.
  • Amplificazione dei frammenti della libreria selezionati mediante bridge PCR (bPCR).
  • Sequenziamento del prodotto di amplificazione mediante il metodo di sequenziamento by synthesis.

Descriviamo ora nel dettaglio le diverse fasi.

COSTRUZIONE DELLA LIBRERIA

Per costruire la libreria per il sequenziamento Illumina si seguono due passaggi:

  • Frammentazione del DNA genomico estratto o del cDNA ricavato dal trascrittoma estratto dall’organismo campione mediante sonicazione o restrizione enzimatica fino ad ottenere frammenti con una dimensione massima di 1000 bp. È importante considerare che i frammenti ottenuti non devono superare le 1000 bp di lunghezza altrimenti si avranno dei problemi durante il sequenziamento.
  • Si legano alle estremità dei frammenti a doppio filamento degli adattatori Illumina. Gli adattatori sono di due tipi e vengono indicati come adattatori A e adattatori B. I frammenti che verranno impiegati poi nelle fasi successive del sequenziamento Illumina saranno quelli dotati di un adattatore A ad una estremità e un adattatore B all’altra estremità. Questi frammenti correttamente formati vengono isolati in diversi modi ma uno dei metodi più impiegati prevede l’utilizzo di biglie paramagnetiche, ovvero biglie che diventano magnetiche quando poste all’interno di un campo magnetico, e su cui sono legate molecole di streptavidina. In particolare per la selezione dei frammenti si sfrutta l’affinità di legame tra la streptavidina e la biotina, la quale è legata ad uno dei due tipi di adattatori, per esempio l’adattore B.
FIgura 1. Frammentazione del DNA ed isolamento dei frammenti per il sequenziamento mediante biglie paramagnetiche dotate di streptavidina.

Lasciatemi aprire una parentesi sugli adattatori Illumina, infatti, come ho accennato sopra, di questi ne esistono di due categorie:

  • Gli adattatori Illumina single index. Questi adattatori contengono dei barcode (o index), ovvero delle sequenze di DNA che identificano un determinato campione (dove per campione si intende un determinato genotipo) pertanto inserendo queste sequenze all’interno degli adattatori è possibile sequenziare contemporaneamente i frammenti relativi a diversi genotipi. Il sequenziamento di più campioni contemporaneamente prende il nome di sequenziamento multiplo o multiplexing.
    Questi adattatori sono costituiti da:
    a) Regione universale che si appaia ai primer per l’amplificazione (tale regione è diversa tra gli adattatori A, che si legano ad un primer, e gli adattatori B che si legano ad un altro primer).
    b) Barcode Illumina (o index) presente sull’adattatore A oppure sull’adattatore B.
    c) Regione universale a cui si lega il primer per il sequenziamento.
Figura 2. Adattori ILLUMINA single index.
  • Gli adattatori Illumina dual index. Questi sono invece caratterizzati dal fatto che sia gli adattatori A che gli adattatori B sono dotati di barcode identificativo del genotipo. In questo caso, a differenza degli adattatori Illumina Single Index, questi adattatori consentono un maggiore livello di multiplexing, infatti un barcode viene utilizzato per distinguere i diversi campioni, ovvero i diversi genotipi che vengono sequenziati contemporaneamente, e un altro barcode viene invece utilizzato per distinguere delle sequenze specifiche all’interno della libreria di ciascun genotipo.
  • Adattatori Illumina senza barcode (index). Sono degli adattatori utilizzati nei protocolli di sequenziamento Illumina standard in cui la flow cell, ovvero il supporto su cui si posano i frammenti e su cui avviene la reazione di amplificazione e sequenziamento, è capace di separare fisicamente i campioni da sequenziare provenienti da genotipi diversi, dunque non sono necessari i barcode per la distinzione dei diversi campioni di DNA. Questi adattatori sono costituiti da:
  1. Regione universale che si appaia ai primer per l’amplificazione (tale regione è diversa tra gli adattatori A, che si legano ad un primer, e gli adattatori B che si legano ad un altro primer).
  2. Regione universale a cui si lega il primer per il sequenziamento.
Figura 4. Utilizzo dei barcode per adoperare un sequenziamento multiplo (multiplexing).

Amplificazione dei frammenti della libreria selezionati mediante bridge PCR (bPCR)

Una volta selezionati i frammenti della libreria dotati di adattatore A e B, si procede con l’amplificazione di questi mediante un metodo chiamato bridge PCR, il quale consiste nell’amplificare dei frammenti su di un supporto solido, chiamato flow cell, sul quale sono disposti i primer di amplificazione che sono capaci di riconoscere e legare gli adattatori A e B, ad esempio il primer forward si lega all’adattatore A e il reverse all’adattatore B.

In particolare la bridge PCR avviene nel seguente modo:

  • I frammenti si legano ai primer forward e reverse della flow cell.
  • La DNA polimerasi inizia l’amplificazione dei frammenti legati ai primer della flow cell (la reazione di amplificazione è permessa dal fatto che sulla flow cell sono presenti tutti i reagenti per la reazione di amplificazione come: Taq polimerasi, dNTPs, Buffer, Mg2+).
  • In seguito al primo ciclo di amplificazione avviene la denaturazione a 94°C e successiva rimozione, per lavaggio, dei frammenti usati come stampo. Infatti rimarranno sulla flow cell solo i frammenti neo-sintetizzati che hanno incorporato il primer legato alla flow cell.
  • I frammenti neo-sintetizzati rimasti sulla flow cell si piegano formando un “ponte” (bridge) grazie al legame dell’adattatore libero con un altro primer di amplificazione complementare e presente sulla flow cell. A questo punto la DNA polimerasi inizia un nuovo ciclo di amplificazione producendo così un nuovo frammento. Alla fine di questa seconda amplificazione avviene una denaturazione ma in tal caso non verrà lavato via nessun frammento poiché tutti sono ancorati alla flow cell.
  • Si effettuano poi diversi cicli di amplificazione come nel punto precedente al punto di ottenere dei cluster (raggruppamenti) di copie di ciascun frammento linearizzati disposti ognuno in punti diversi della flow cell. È bene precisare che affinché si ottengano dei cluster omogenei, cioè contenenti le copie di un solo tipo di frammento, è necessario che i frammenti abbiano delle dimensioni minori di 1000 bp, infatti se sono di dimensioni maggiori questi rischiano di invadere altri cluster durante il processo di amplificazione. L’omogeneità dei cluster risulta fondamentale nella successiva fase di sequenziamento, in cui le reads ottenute da un cluster saranno in tal modo relative alla copie di un unico frammento della libraria.
  • Arrivati alla condizione di cluster di copie di frammenti linearizzati si procede con la lisi chimica e successivo lavaggio al fine di rimuovere dalla flow cell i frammenti reverse, mantenendo soltanto i frammenti forward.
  • Infine prima di procedere con il sequenziamento viene effettuato il Blocking, ovvero viene bloccata l’estremità 3’ dei frammenti rimasti sulla flow cell al fine di prevenire la formazione di bridge ulteriori ed indesiderati.
Figura 6. Schema riassuntivo della bPCR. Fonte: https://en.wikipedia.org/wiki/Illumina_dye_sequencing
Video 1. Bridge PCR sulla flow cell ILLUMINA. Fonte: canale youtube Illumina (https://www.youtube.com/watch?v=pfZp5Vgsbw0)

Sequenziamento del prodotto di amplificazione mediante il metodo di sequenziamento by synthesis

Il metodo di sequenziamento usato viene definito sequencing by synthesis poiché si basa sull’attività della DNA polimerasi che, a partire da un primer di sequenziamento, aggiunge un nucleotide per volta in modo da avere una read complementare ad un determinato frammento della flow cell. Ogni nucleotide risulta essere marcato con molecole fluorescenti diverse che emettono luce di colore differente la quale viene poi rilevata da un’apposita camera. Inoltre questi nucleotidi possiedono un blocco sul gruppo ossidrile libero (-OH) in modo da poter essere aggiunto solo un nucleotide per ciclo di sequenziamento.

In particolare esistono due diversi approcci di sequenziamento by synthesis:

  1. Sequenziamento by synthesis single read, ovvero un sequenziamento che prevede la lettura di una sola estremità dei frammenti della libreria. Questo approccio di sequenziamento permette di ottenere solitamente soltanto le prime 250 basi azotate di una estremità di ciascun frammento della libreria pertanto viene spesso indicato con la dicitura 1×250 bp.
  2. Sequenziamento by synthesis paired end, ovvero un sequenziamento che prevede la lettura delle due estremità dei frammenti della libreria. In tal caso otteniamo le reads relative a tutte e due l’estremità dei frammenti, infatti in tal caso il numero di basi azotate della sequenza di ciascun frammento che vengono fornite dal sequenziamento è pari a 500 bp, 250 relativa alla read al 3′ e 250 relativa alla read al 5′ del frammento. Questo approccio viene indicato con la dicitura 2×250 bp ed è molto utile poichè avere le reads relative alle due estremità del frammento consente un miglior assemblaggio della sequenza del DNA o cDNA sequenziato. Bisogna inoltre immaginare che se i frammenti della libreria hanno una dimensione di 500 bp vuol dire che con un sequenziamento paired end saremmo capaci di sequenziare per intero i suddetti frammenti.

Ho deciso di non parlarvi dei passaggi che avvengono durante il sequenziamento by synthesis per paura di rendere troppo pesante la lettura, come sempre questi sono concetti difficili da esprimere in poche e semplici parole. Se volete però sapere nel dettaglio le fasi del sequenziamento single end e paired end scrivetemi nei commenti e seguitemi su Instagram.

Attenzione però non è tutto oro ciò che luccica infatti anche questa tecnica di sequenziamento ha i suoi svantaggi. Questi sono principalmente due:

  • Possono verificarsi fenomeni di sostituzione nucleotidica. Durante il sequenziamento la DNA polimerasi potrebbe infatti inserire un nucleotide errato, ovvero non complementare al nucleotide del frammento. Questo può accadere perché in ciascun ciclo di sequenziamento sono contemporaneamente forniti tutti e quattro i tipi di nucleotidi.
  • Ridotta lunghezza delle reads (massimo 250 bp) il che rende più complesso l’assemblaggio della sequenza di DNA o cDNA sequenziata. Nel sequenziamento Illumina le reads non possono superare i 250 bp di lunghezza poiché se sono eccessivamente lunghe si ottengono errori nella rilevazione del segnale luminoso a causa dell’incompleta rimozione delle molecole fluorescenti.
Video 2. Funzionamento della tecnica di sequenziamento di seconda generazione Illumina. Fonte: canale youtube ILLLUMINA (https://www.youtube.com/watch?v=fCd6B5HRaZ8)

Ora non mi resta che ringraziarvi per la lettura. Come sempre spero di avervi lasciato delle informazioni utili con questo articolo e che abbiate capito come questa tecnica di sequenziamento funziona nel dettaglio.

Ciao e a presto.