Lo spazio strutturale del proteoma umano è ampio e diversificato a causa della presenza di varie varianti proteiche (isoforme), comprese le modifiche post-traslazionali, varianti di splice, prodotti proteolitici, variazioni genetiche e ricombinazione somatica. Per esempio, ci sono decine di milioni di diverse molecole IgG in un corpo umano in un dato momento a causa di un elaborato processo di ricombinazione somatica e mutazione mirata. Inoltre, una gran parte dei geni che codificano le proteine (circa l’80%) hanno varianti di splice che producono prodotti proteici di dimensioni diverse. Allo stesso modo, più di centinaia di migliaia di modifiche post-traslazionali sono state riportate come parte di vari sforzi proteomici e molte proteine dipendono dalla proteolisi precisa per l’attivazione. Inoltre, circa 320000 variazioni tra gli individui della popolazione sono state riportate nelle regioni codificanti le proteine come risultato del Progetto 1000 Genomi. In sintesi, la diversità umana dei 19670 geni codificanti le proteine è aumentata immensamente dalla presenza di numerose isoforme proteiche.
Varianti di splice
Lo splicing alternativo è un meccanismo ampiamente utilizzato per la formazione di isoforme. In questo processo, che avviene durante l’espressione genica, gli esoni di un gene possono essere inclusi o esclusi nell’mRNA processato. Le proteine tradotte da mRNA con splicing alternativo conterranno quindi differenze nella loro sequenza aminoacidica, e quindi spesso differiscono nelle loro proprietà funzionali.
I quattro principali sottotipi di splicing alternativo:
- Exon skipping (Cassette exons) è la forma più diffusa di splicing alternativo. In questa modalità, l’esone è splicato fuori dal trascritto primario insieme ai suoi introni fiancheggiatori.
- Il sito donatore alternativo è il tipo quando due o più siti di splicing sono riconosciuti all’estremità 3′ di un esone. Questa modalità è chiamata anche Alternative 5′ splice site.
- Alternative acceptor site è il tipo quando due o più siti di splice sono riconosciuti all’estremità 5′ di un esone. Questa modalità è chiamata anche Alternative 3′ splice site.
- Intron retention è la modalità in cui un introne può rimanere nella molecola di mRNA maturo.
Figura 1. I principali tipi di splicing alternativo.
Molti geni codificano per isoforme proteiche multiple (varianti di splice) con localizzazione subcellulare alternativa, compresi 189 geni con isoforme sia secrete che legate alla membrana. Questi geni sono di particolare interesse. Nella figura 2, le frazioni delle varie categorie sono mostrate per tutti i 19670 geni.
Figura 2. Diagramma di Venn che mostra la sovrapposizione tra il numero di geni che sono intracellulari, a diffusione di membrana, secreti, o con isoforme appartenenti a più di una delle tre categorie.
Modifiche post-traslazionali
Le modifiche post-traslazionali (PTM) sono modifiche chimiche che svolgono un ruolo chiave nella funzione di una proteina, poiché regolano l’attività, la localizzazione e l’interazione con altre molecole cellulari come proteine, acidi nucleici, lipidi e cofattori. Hanno anche la possibilità di regolare l’attività cellulare. Le PTM si verificano su catene laterali di aminoacidi o legami peptidici distinti e sono più spesso mediate dall’attività enzimatica. La modifica post-traslazionale può avvenire in qualsiasi fase del “ciclo di vita” di una proteina.
Alcuni tipi comuni e importanti di PTM:
- Glicosilazione: aggiunta di catene di zucchero, sia all’azoto amidico sulla catena laterale dell’asparagina (N-glicosilazione) che all’ossigeno idrossile sulla catena laterale della serina o della treonina (O-glicosilazione). La lista delle glicoproteine è lunga e possono servire una serie di funzioni diverse, per esempio nella risposta immunitaria (famiglia delle immunoglobuline), come molecole strutturali (famiglia del collagene), ormoni (HCG, TSH, EPO), molecole di trasporto (transferrina), enzimi (fosfatasi alcalina) e recettori.
- Fosforilazione: aggiunta di un gruppo fosfato, solitamente a tirosina, serina, treonina, istidina o aspartato. Questa modifica è reversibile e può per esempio attivare/inattivare enzimi e recettori. Un esempio classico in cui la fosforilazione gioca un ruolo molto importante è nella regolazione della proteina soppressore del tumore p53 e delle proteine in varie vie di segnale, come la via RAS e STAT.
- Ubiquitinazione: l’aggiunta di ubiquitina darà un segnale di degradazione, altererà la posizione cellulare o influenzerà l’attività o le interazioni.
Altre comuni modifiche post-traslazionali sono la S-nitrosilazione, la metilazione, la N-acetilazione, la lipidazione, la formazione di legami disolfuro, la solfatazione, l’acilazione, la deaminazione ecc.
Modifiche proteolitiche
Dopo la traduzione, alcune proteine subiscono un processo proteolitico. Questo processo è altamente specifico e come risultato della scissione di uno o più legami nella proteina bersaglio da parte delle proteasi, l’attività della proteina sarà alterata.
Un gran numero di proteine sono sintetizzate come precursori inattivi, le cosiddette proproteine. Per attivare queste proteine, è necessaria la rimozione del propeptide attraverso l’elaborazione proteolitica. La proteolisi delle proteine precursori porterà alla regolazione di molti processi cellulari. Proteine ben studiate che subiscono questo processo sono l’insulina (INS) e il fattore VIII (F8).
Variazioni genetiche
Anche se tutti gli esseri umani sono quasi identici biochimicamente (99,9%), ci sono grandi variazioni tra gli individui nella popolazione come risultato di variazioni genetiche allele-specifiche nelle regioni codificanti le proteine. Molte delle variazioni genetiche sono in regioni non codificanti del genoma, ma alcune influenzano anche gli aminoacidi nelle parti codificanti le proteine di un particolare gene. Circa 17800 geni sono stati descritti con variazioni genetiche che producono isoforme proteiche sulla base del Progetto 1000 Genomi.
Ricombinazione somatica
La ricombinazione somatica è un meccanismo di ricombinazione genetica che è unico per i geni delle immunoglobuline e dei recettori delle cellule T. In questo processo vengono prodotte immunoglobuline e recettori delle cellule T ad alta diversità.
Uhlén M et al., Tissue-based map of the human proteome. Scienza (2015)
PubMed: 25613900 DOI: 10.1126/science.1260419