Come ho già detto più volte qui sul blog, la bioinformatica ci permette di rispondere a domande e comprendere fenomeni biologici analizzando i dati ottenuti da prove sperimentali eseguite in laboratorio. Ma quali sono i metodi generali con cui la bioinformatica analizza i dati per ottenere la conoscenza desiderata?

Esistono due metodi principali con cui la bioinformatica indaga:

  • metodi comparativi
  • metodi predittivi

Le metodologie comparative, come si evince dal nome, consentono di dare risposte riguardanti una questione biologica studiata confrontando i dati in esame con dati già interpretati presenti in apposite banche dati.

Facciamo un rapido esempio per comprendere meglio il loro meccanismo d'azione:

Diciamo che stiamo analizzando una sequenza di DNA di un gene e il nostro obiettivo è definire la funzione di questo gene, o rispondere alle seguenti domande: per quale proteina codifica? qual è la struttura della proteina?

Per rispondere a queste domande possiamo confrontare, con opportuni algoritmi, come algoritmi di allineamento, la sequenza del gene in esame con sequenze di geni le cui funzioni sono già note e inserite nel database di riferimento. In sostanza è possibile inferire la funzione del gene, nonché la struttura della proteina per la quale codifica, da geni e proteine ​​simili già caratterizzate.

I metodi predittivi, invece, sono in grado di rispondere a domande biologiche prevedendo la risposta sulla base di conoscenze acquisite in precedenza. Questi metodi, infatti, seguono approcci basati sull'apprendimento automatico, ovvero sfruttano algoritmi in grado di apprendere dai dati esistenti e di dedurre qualcosa di ancora sconosciuto da questa conoscenza.

Facciamo un altro esempio:

Se la nostra intenzione è quella di tracciare i geni codificanti proteine ​​presenti in un genoma, possiamo sfruttare algoritmi in grado di identificarli, tenendo conto che i geni hanno una struttura caratteristica. Infatti, all'interno dei geni troviamo una regione 5'UTR e una 3'UTR, esoni separati da introni, un codone di inizio trascrizione e un codone finale e così via. Quindi insegnando all'algoritmo è possibile predirre i geni presenti nel genoma sulla base delle conoscenze acquisite in precedenza.

Bene, per oggi ci salutiamo qui. Come avrete notato questo articolo è più breve del solito ma non fatevi ingannare, è pieno di significato. Infatti, capire come la bioinformatica indaga i dati biologici ci permette anche di capire come in generale certi problemi vengono risolti dagli algoritmi utilizzati.

Ti ricordo di lasciare un commento per eventuali domande o chiarimenti, inoltre se l'articolo ti è piaciuto e ti è sembrato utile, mi piacerebbe molto saperlo tramite un “mi piace”.

Ciao e a presto.