Strukturní prostor lidského proteomu je velký a rozmanitý díky přítomnosti různých proteinových variant (izoforem), včetně posttranslačních modifikací, sestřihových variant, proteolytických produktů, genetických variací a somatické rekombinace. Například v lidském těle se v daném okamžiku vyskytují desítky milionů různých molekul IgG v důsledku složitého procesu somatické rekombinace a cílených mutací. Kromě toho má velká část genů kódujících bílkoviny (přibližně 80 %) sestřihové varianty, které dávají bílkovinné produkty různých velikostí. Podobně byly v rámci různých proteomických snah zaznamenány více než stovky tisíc posttranslačních modifikací a aktivace mnoha proteinů závisí na přesné proteolýze. Kromě toho bylo v rámci projektu 1000 genomů zaznamenáno přibližně 320000 variací mezi jednotlivci v populaci v oblastech kódujících proteiny. Souhrnně lze říci, že lidská rozmanitost 19670 protein-kódujících genů je nesmírně zvýšena přítomností četných proteinových izoforem.
Splice varianty
Alternativní sestřih je široce používaným mechanismem pro tvorbu izoforem. Při tomto procesu, který probíhá v průběhu genové exprese, mohou být exony genu do zpracovávané mRNA zahrnuty nebo vyloučeny. Proteiny překládané z alternativně sestřihaných mRNA proto budou obsahovat rozdíly v sekvenci aminokyselin, a proto se často liší svými funkčními vlastnostmi.
Čtyři hlavní podtypy alternativního sestřihu:
- Přeskočení exonu (Cassette exons) je nejrozšířenější formou alternativního sestřihu. Při tomto způsobu je exon sestřihán z primárního transkriptu společně s jeho doprovodnými introny.
- Alternativní dárcovské místo je typ, kdy jsou na 3′ konci exonu rozpoznána dvě nebo více sestřihových míst. Tento způsob se také nazývá alternativní 5′ sestřihové místo.
- Alternativní akceptorové místo je typ, kdy jsou na 5′ konci exonu rozpoznána dvě nebo více sestřihových míst. Tento způsob se také nazývá alternativní 3′ sestřihové místo.
- Retence intronu je způsob, při kterém může intron zůstat ve zralé molekule mRNA.
Obrázek 1. Hlavní typy alternativního sestřihu.
Mnoho genů kóduje více proteinových izoforem (sestřihových variant) s alternativním subcelulárním umístěním, včetně 189 genů se sekrečními i membránově vázanými izoformami. Tyto geny jsou obzvláště zajímavé. Na obrázku 2 jsou uvedeny frakce různých kategorií pro všech 19670 genů.
Obrázek 2. Vennův diagram znázorňující překrývání počtu genů, které jsou intracelulární, membránové, sekreční nebo s izoformami patřícími do více než jedné z těchto tří kategorií.
Posttranslační modifikace
Posttranslační modifikace (PTM) jsou chemické modifikace, které hrají klíčovou roli ve funkci proteinu, protože regulují aktivitu, lokalizaci a interakci s jinými buněčnými molekulami, jako jsou proteiny, nukleové kyseliny, lipidy a kofaktory. Mají také možnost regulovat buněčnou aktivitu. PTM se vyskytují na odlišných postranních řetězcích aminokyselin nebo peptidových vazbách a jsou nejčastěji zprostředkovány enzymatickou aktivitou. K posttranslační modifikaci může dojít v kterémkoli kroku „životního cyklu“ proteinu.
Několik běžných a důležitých typů PTM:
- Glykosylace: přidání cukerných řetězců buď na amidový dusík na postranním řetězci asparaginu (N-glykosylace), nebo na hydroxylový kyslík na postranním řetězci serinu nebo threoninu (O-glykosylace). Seznam glykoproteinů je dlouhý a mohou plnit řadu různých funkcí, například v imunitní odpovědi (rodina imunoglobulinů), jako strukturní molekuly (rodina kolagenů), hormony (HCG, TSH, EPO), transportní molekuly (transferin), enzymy (alkalická fosfatáza) a receptory.
- Fosforylace: přidání fosfátové skupiny, obvykle na tyrosin, serin, threonin, histidin nebo aspartát. Tato modifikace je reverzibilní a může například aktivovat/inaktivovat enzymy a receptory. Klasickým příkladem, kde fosforylace hraje velmi důležitou roli, je regulace nádorového supresorového proteinu p53 a proteinů v různých signálních drahách, jako je dráha RAS a STAT.
- Ubikvitinace: přidání ubikvitinu dá signál k degradaci, změní umístění v buňce nebo ovlivní aktivitu či interakce.
Dalšími běžnými posttranslačními modifikacemi jsou S-nitroxylace, metylace, N-acetylace, lipidace, tvorba disulfidových vazeb, sulfatace, acylace, deaminace atd.
Proteolytické modifikace
Po translaci procházejí některé proteiny proteolytickým zpracováním. Tento proces je vysoce specifický a v důsledku rozštěpení jedné nebo více vazeb v cílovém proteinu proteázami dojde ke změně aktivity proteinu.
Velké množství proteinů je syntetizováno jako neaktivní prekurzory, tzv. proproteiny. K aktivaci těchto proteinů je nutné odstranění propeptidu prostřednictvím proteolytického zpracování. Proteolýza prekurzorových proteinů povede k regulaci mnoha buněčných procesů. Dobře prostudovanými proteiny, které tímto procesem procházejí, jsou inzulin (INS) a faktor VIII (F8).
Genetické odchylky
Ačkoli jsou všichni lidé biochemicky téměř identičtí (99,9 %), mezi jednotlivci v populaci existují velké rozdíly v důsledku alelově specifických genetických odchylek v oblastech kódujících proteiny. Mnoho genetických variací se nachází v nekódujících oblastech genomu, ale některé ovlivňují také aminokyseliny v částech konkrétního genu kódujících bílkoviny. Na základě projektu 1000 genomů bylo popsáno přibližně 17800 genů s genetickými variacemi, z nichž vznikají izoformy proteinů.
Somatická rekombinace
Somatická rekombinace je mechanismus genetické rekombinace, který je jedinečný pro geny imunoglobulinů a T-buněčných receptorů. Při tomto procesu vznikají imunoglobuliny a T-buněčné receptory s vysokou diverzitou.
Uhlén M et al., Tkáňová mapa lidského proteomu. Science (2015)
PubMed: 25613900 DOI: 10.1126/science.1260419