Come ho detto già più volte qui sul blog, la bioinformatica permette di rispondere a quesiti e di comprendere fenomeni biologici analizzando i dati ottenuti da prove sperimentali eseguite in laboratorio. Ma quali sono i metodi generali con i quali la bioinformatica analizza i dati al fine di raggiungere le conoscenze desiderate?

Esistono due metodi principali con i quali la bioinformatica indaga:

  • i metodi comparativi
  • i metodi predittivi

I metodi comparativi, come si può dedurre dal nome, permettono di dare delle risposte riguardo ad un quesito biologico studiato andando a comparare i dati in esame con dati già interpretati presenti in appositi data base.

Facciamo un rapido esempio per capire meglio il loro meccanismo di azione:

Poniamo il caso in cui stiamo analizzando una sequenza di DNA di un gene ed il nostro obbiettivo è quello di definire la funzione di questo gene, ovvero rispondere alle seguenti domande: per quale proteina codifica? qual’è la struttura della proteina?

Per rispondere a tali domande possiamo comparare, con appositi algoritmi, come ad esempio quelli di allineamento, la sequenza del gene in esame con sequenze di geni le cui funzioni sono già note e posti in database di riferimento. In sostanza è possibile desumere la funzione del gene, oltre che la struttura della proteina per il quale codifica, da geni e proteine simili già caratterizzate.

I metodi predittivi, invece, sono capaci di rispondere a quesiti biologici prevedendo la risposta sulla base di conoscenze precedentemente acquisite. Questi metodi seguono infatti degli approcci basati sul machine learning, ovvero sfruttano algoritmi capaci di imparare dai dati esistenti e dedurre da tali conoscenze un qualcosa di ancora non conosciuto.

Facciamo ancora un esempio:

Se la nostra intenzione è quella di rintracciare i geni codificanti proteine presenti in un genoma possiamo sfruttare algoritmi capaci di individuarli tenendo conto che i geni hanno una struttura caratteristica. All’interno dei geni troviamo infatti una regione 5’UTR 3’UTR, degli esoni separati da introni, un codone di inizio trascrizione ed uno di fine e così via. Dunque istruendo l’algoritmo è possibile prevedere i geni presenti nel genoma sulla base delle conoscenze precedentemente acquisite.

Bene, per oggi ci salutiamo qui. Come avete notato questo articolo è più breve del solito ma non lasciatevi ingannare, è ricco di significato. Infatti comprendere come la bioinformatica indaga sui dati biologici ci permette anche di capire come in generale determinati problemi vengono risolti dagli algoritmi utilizzati.

Vi ricordo di lasciare un commento per eventuali domande o precisazioni, inoltre se l’articolo ti è piaciuto e ti è sembrato utile mi farebbe davvero piacere saperlo tramite un “mi piace”.

Ciao e a presto.