Det strukturella utrymmet för det mänskliga proteomet är stort och varierande på grund av förekomsten av olika proteinvarianter (isoformer), inklusive posttranslationella modifieringar, splitsvarianter, proteolytiska produkter, genetiska variationer och somatisk rekombination. Det finns till exempel tiotals miljoner olika IgG-molekyler i en människokropp vid en given tidpunkt på grund av en komplicerad process av somatisk rekombination och riktad mutation. Dessutom har en stor del av de proteinkodande generna (cirka 80 %) skarvvarianter som ger proteinprodukter av olika storlek. På samma sätt har mer än hundratusentals posttranslationella modifieringar rapporterats som en del av olika proteomiska insatser, och många proteiner är beroende av exakt proteolys för att aktiveras. Dessutom har cirka 320000 variationer mellan individer i befolkningen rapporterats i proteinkodande regioner som ett resultat av 1000 Genomes-projektet. Sammanfattningsvis ökar den mänskliga mångfalden av de 19670 proteinkodande generna enormt genom förekomsten av många proteinisoformer.
Splicevarianter
Alternativ splicing är en allmänt använd mekanism för bildandet av isoformer. I denna process, som sker under genuttrycket, kan exonerna i en gen inkluderas eller uteslutas i det bearbetade mRNA. Proteiner som översätts från alternativt splicade mRNA kommer därför att innehålla skillnader i sin aminosyrasekvens, och därför skiljer de sig ofta åt i sina funktionella egenskaper.
De fyra huvudsakliga undertyperna av alternativ splicing:
- Exon skipping (Cassette exons) är den mest utbredda formen av alternativ splicing. I denna form splejsas exonet ut ur det primära transkriptet tillsammans med dess flankerande introner.
- Alternativ donatorplats är den typ när två eller flera splejsningsställen känns igen i 3′ änden av ett exon. Detta läge kallas också för alternativ 5′-spliktplats.
- Alternativ acceptorplats är typen när två eller flera spliktplatser känns igen i 5′-ändan av ett exon. Denna typ kallas också för alternativ 3′-splisplats.
- Intronretention är den typ där ett intron kan stanna kvar i den mogna mRNA-molekylen.
Figur 1. De viktigaste typerna av alternativ splicing.
Många gener kodar för flera proteinisoformer (splicevarianter) med alternativa subcellulära placeringar, inklusive 189 gener med både utsöndrade och membranbundna isoformer. Dessa gener är av särskilt intresse. I figur 2 visas fraktioner av de olika kategorierna för alla 19670 gener.
Figur 2. Venn-diagram som visar överlappningen mellan antalet gener som är intracellulära, membranöverskridande, sekretoriska eller med isoformer som tillhör mer än en av de tre kategorierna.
Posttranslationella modifieringar
Posttranslationella modifieringar (PTM) är kemiska modifieringar som spelar en nyckelroll för ett proteins funktion, eftersom de reglerar aktivitet, lokalisering och interaktion med andra cellmolekyler, till exempel proteiner, nukleinsyror, lipider och kofaktorer. De har också möjlighet att reglera den cellulära aktiviteten. PTM:er sker vid distinkta aminosyra sidokedjor eller peptidlänkar och förmedlas oftast genom enzymatisk aktivitet. Posttranslationell modifiering kan ske i vilket steg som helst i ett proteins ”livscykel”.
Några vanliga och viktiga typer av PTM:
- Glykosylering: tillsats av sockerkedjor, antingen vid amidkvävet på asparagins sidokedja (N-glykosylering) eller vid hydroxylsyran på serinets eller threonins sidokedja (O-glykosylering). Listan över glykoproteiner är lång och de kan fylla en rad olika funktioner, till exempel i immunsvaret (immunoglobulinfamiljen), som strukturella molekyler (kollagenfamiljen), hormoner (HCG, TSH, EPO), transportmolekyler (transferrin), enzymer (alkaliskt fosfatas) och receptorer.
- Fosforylering: tillsats av en fosfatgrupp, vanligen till tyrosin, serin, threonin, histidin eller aspartat. Denna modifiering är reversibel och kan till exempel aktivera/inaktivera enzymer och receptorer. Ett klassiskt exempel där fosforylering spelar en mycket viktig roll är regleringen av tumörundertryckarproteinet p53 och proteiner i olika signalvägar, t.ex. RAS-vägen och STAT.
- Ubiquitinering: Tillsats av ubiquitin ger en signal för nedbrytning, ändrar cellplaceringen eller påverkar aktiviteten eller interaktionen.
Andra vanliga posttranslationella modifieringar är S-nitrosylering, metylering, N-acetylering, lipidering, disulfidbindningsbildning, sulfatering, acylering, deaminering etc.
Proteolytiska modifieringar
Efter översättning genomgår vissa proteiner proteolytisk bearbetning. Denna process är mycket specifik och som ett resultat av att en eller flera bindningar i målproteinet klyvs av proteaser kommer proteinets aktivitet att förändras.
Ett stort antal proteiner syntetiseras som inaktiva prekursorer, så kallade proproteiner. För att aktivera dessa proteiner krävs att propeptiden avlägsnas via proteolytisk bearbetning. Proteolys av prekursorproteinerna kommer att resultera i reglering av många cellulära processer. Välstuderade proteiner som genomgår denna process är insulin (INS) och faktor VIII (F8).
Genetiska variationer
Och även om alla människor är nästan identiska biokemiskt (99,9 %) finns det stora variationer mellan individer i befolkningen till följd av allelspecifika genetiska variationer i de proteinkodande regionerna. Många av de genetiska variationerna finns i icke-kodande områden av genomet, men vissa påverkar också aminosyrorna i de proteinkodande delarna av en viss gen. Cirka 17800 gener har beskrivits med genetiska variationer som ger proteinisoformer baserat på 1000 Genomes Project.
Somatisk rekombination
Somatisk rekombination är en mekanism för genetisk rekombination som är unik för immunoglobulin- och T-cellreceptorgenerna. I denna process produceras immunoglobuliner och T-cellsreceptorer med hög mångfald.
Uhlén M et al., Tissue-based map of the human proteome. Science (2015)
PubMed: 25613900 DOI: 10.1126/science.1260419