Le dimensioni contano…e anche la struttura



Global Score predicts RBP interactions with large RNAsRicercatori italiani del Centre for Genomic Regulation (CRG) di Barcellona hanno sviluppato Global Score, un metodo computazionale che permette, per la prima volta, di predire l’interazione tra proteine e RNA lunghi non-codificanti.

Questo algoritmo aiuterà gli scienziati a identificare i migliori candidati per la validazione sperimentale. Questo contribuirà alla nostra comprensione del ruolo dei RNA lunghi non-codificanti nelle cellule normali e in quelle affette da patologia.

Per poter comprendere appieno il suo funzionamento, i ricercatori non solo leggono le informazioni contenute nel genoma umano ma puntano a conoscere i dettagli di ogni elemento di questo piccolo ingranaggio altamente regolato.

Molti laboratori, consorzi e progetti internazionali sono impegnati ad acquisire una visione globale delle regioni funzionali dei genomi e caratterizzare l’attività genica nei diversi tipi cellulari. Solo una piccola frazione del genoma umano (circa il 2%) contiene geni che codificano per proteine, le quali rappresentano i principali elementi strutturali e funzionali delle cellule. Il rimanente 98% è importante per la regolazione genica, ovvero il controllo di dove e quando i geni sono attivi.

Questa porzione così grade del genoma produce molecole di RNA, dette RNA non-codificante, che differiscono tra di loro per lunghezza, struttura e funzione. Poiché i vari tipi di RNA non-codificante interagiscono fisicamente con le proteine, grandi forzi sono stati fati per caratterizzare questo tipo di interazione. Finora non erano disponibili metodi computazionali in grado di gestire lunghe sequenze di RNA, difficili anche da studiare attraverso metodi sperimentali.

Gian Gaetano TartagliaGian Gaetano Tartaglia

Davvero una grande sfida!

In un recente articolo pubblicato su Nature Methods, i ricercatori del CRG Davide Cirillo, Alexandros Armaos e Gian Gaetano Tartaglia, in collaborazione con scienziati dell'EMBL di Monterotondo e del California Institute of Technology, hanno introdotto un nuovo strumento bioinformatico per predire le interazioni tra proteine e RNA lunghi non-codificanti.

Le interazioni predette dal programma sono state validate usando avanzate tecniche sperimentali. «Gli RNA lunghi non-codificanti interagiscono con varie proteine per mediare importanti funzioni cellulari. Cercare di identificare queste interazioni rappresenta un buon punto di partenza per capire il ruolo di queste molecole nella fisiologia cellulare ma anche in molte malattie» spiega  Gian Gaetano Tartaglia, ICREA group leader al Centre for Genomic Regulation e principal investigator di questo studio.

Il nuovo metodo di calcolo, chiamato Global Score, consente agli scienziati di predire dove una proteina stabilirà un contatto fisico lungo la sequenza di un RNA non-codificante. Per poter fare questo, l’algoritmo integra non solo le proprietà globali dei due interattori ma anche le proprietà locali del loro legame.

«Le proprietà strutturali dell’RNA sono imprescindibili per predire le interazioni con le proteine. La nostra maggior sfida è stata quella di essere in grado di lavorare con delle sequenze di RNA indipendentemente dalla loro dimensione, mantenendo una visione completa delle proprietà che le caratterizzano per identificare delle proteine che vi possano interagire» aggiunge Davide Cirillo, ricercatore post-dottorale al CRG e primo autore dell’articolo.

«L’algoritmo che abbiamo sviluppato integra questa informazione e ci consente di predire le proteine interagenti e di individuare quelle più promettenti per la validazione sperimentalmente. Questa metodologia sarà cruciale per studiare meglio gli RNA lunghi non-codificanti e le loro funzioni» conclude il ricercatore.

Referenza:

Cirillo et al. “Quantitative predictions of protein interactions with long non-coding RNAs” Nature Methods. 14, 5-6 (2017). DOI:  10.1038/nmeth.4100