Przestrzeń strukturalna ludzkiego proteomu jest duża i zróżnicowana ze względu na obecność różnych wariantów białek (izoform), w tym modyfikacji potranslacyjnych, wariantów splice, produktów proteolitycznych, wariantów genetycznych i rekombinacji somatycznej. Na przykład, w organizmie ludzkim w danym momencie znajdują się dziesiątki milionów różnych cząsteczek IgG, co jest wynikiem skomplikowanego procesu rekombinacji somatycznej i celowej mutacji. Ponadto, duża część genów kodujących białka (około 80%) posiada warianty splice, które dają produkty białkowe o różnych rozmiarach. Podobnie, ponad setki tysięcy modyfikacji potranslacyjnych zostało odnotowanych w ramach różnych wysiłków proteomicznych, a wiele białek zależy od precyzyjnej proteolizy w celu aktywacji. Co więcej, w wyniku projektu 1000 Genomes Project odnotowano około 320000 różnic pomiędzy osobnikami w populacji w regionach kodujących białka. Podsumowując, ludzka różnorodność 19670 genów kodujących białka jest ogromnie zwiększona przez obecność licznych izoform białek.
Warianty splicingowe
Alternatywny splicing jest szeroko stosowanym mechanizmem powstawania izoform. W tym procesie, który zachodzi podczas ekspresji genu, eksony genu mogą być włączone lub wyłączone z przetwarzanego mRNA. Białka tłumaczone z alternatywnie splicowanego mRNA będą zatem zawierać różnice w sekwencji aminokwasowej, a co za tym idzie, często będą różnić się właściwościami funkcjonalnymi.
Cztery główne podtypy alternatywnego splicingu:
- Pomijanie eksonów (eksony kasetowe) jest najbardziej rozpowszechnioną formą alternatywnego splicingu. W tym trybie ekson jest splicowany z pierwotnego transkryptu wraz z otaczającymi go intronami.
- Alternatywne miejsce donorowe to typ, w którym dwa lub więcej miejsc splicingowych jest rozpoznawanych na 3′ końcu eksonu. Tryb ten nazywany jest również alternatywnym 5′ miejscem splice’u.
- Alternatywne miejsce akceptorowe to typ, w którym dwa lub więcej miejsc splice’u jest rozpoznawanych na 5′ końcu eksonu. Tryb ten nazywany jest również alternatywnym 3′ miejscem splicingu.
- Retencja intronu to tryb, w którym intron może pozostać w dojrzałej cząsteczce mRNA.
Rycina 1. Główne rodzaje alternatywnego splicingu.
Wiele genów koduje wiele izoform białkowych (wariantów splice) o alternatywnej lokalizacji subkomórkowej, w tym 189 genów posiada izoformy zarówno wydzielane, jak i związane z błonami komórkowymi. Te geny są szczególnie interesujące. Na Rysunku 2 przedstawiono frakcje różnych kategorii dla wszystkich 19670 genów.
Rysunek 2. Diagram Venna pokazujący nakładanie się liczby genów, które są wewnątrzkomórkowe, rozprzestrzeniające się w błonach, wydzielane lub z izoformami należącymi do więcej niż jednej z tych trzech kategorii.
Modyfikacje potranslacyjne
Modyfikacje potranslacyjne (PTM) są modyfikacjami chemicznymi, które odgrywają kluczową rolę w funkcji białka, ponieważ regulują aktywność, lokalizację i interakcje z innymi cząsteczkami komórkowymi, takimi jak białka, kwasy nukleinowe, lipidy i kofaktory. Mają one również możliwość regulacji aktywności komórkowej. PTM zachodzą na poszczególnych łańcuchach bocznych aminokwasów lub wiązaniach peptydowych i są najczęściej mediowane przez aktywność enzymatyczną. Modyfikacja potranslacyjna może wystąpić na każdym etapie „cyklu życia” białka.
Niektóre powszechne i ważne rodzaje PTM:
- Glikozylacja: dodanie łańcuchów cukrowych, albo przy azocie amidowym na łańcuchu bocznym asparaginy (N-glikozylacja), albo przy tlenie hydroksylowym na łańcuchu bocznym seryny lub treoniny (O-glikozylacja). Lista glikoprotein jest długa i mogą one pełnić wiele różnych funkcji, na przykład w odpowiedzi immunologicznej (rodzina immunoglobulin), jako cząsteczki strukturalne (rodzina kolagenów), hormony (HCG, TSH, EPO), cząsteczki transportowe (transferyna), enzymy (fosfataza alkaliczna) i receptory.
- Fosforylacja: dodanie grupy fosforanowej, zwykle do tyrozyny, seryny, treoniny, histydyny lub asparaginianu. Modyfikacja ta jest odwracalna i może na przykład aktywować/inaktywować enzymy i receptory. Klasycznym przykładem, w którym fosforylacja odgrywa bardzo ważną rolę, jest regulacja białka supresorowego p53 i białek w różnych szlakach sygnałowych, takich jak szlak RAS i STAT.
- Ubikwitynacja: dodanie ubikwityny daje sygnał do degradacji, zmienia lokalizację komórkową lub wpływa na aktywność lub interakcje.
Inne powszechne modyfikacje potranslacyjne to S-nitrozylacja, metylacja, N-acetylacja, lipidacja, tworzenie wiązań disulfidowych, sulfacja, acylacja, deaminacja itp.
Modyfikacje proteolityczne
Po translacji niektóre białka ulegają obróbce proteolitycznej. Proces ten jest wysoce specyficzny i w wyniku rozszczepienia przez proteazy jednego lub więcej wiązań w białku docelowym, aktywność białka zostanie zmieniona.
Duża liczba białek jest syntetyzowana jako nieaktywne prekursory, tzw. proproteiny. Aby aktywować te białka, konieczne jest usunięcie propeptydu poprzez proteolityczne przetwarzanie. Proteoliza białek prekursorowych prowadzi do regulacji wielu procesów komórkowych. Dobrze poznanymi białkami, które ulegają temu procesowi są insulina (INS) i czynnik VIII (F8).
Zmiany genetyczne
Pomimo, że wszyscy ludzie są niemal identyczni biochemicznie (99,9%), istnieją duże różnice pomiędzy osobnikami w populacji w wyniku specyficznych dla danego allelu zmian genetycznych w regionach kodujących białka. Wiele z tych wariantów genetycznych dotyczy niekodujących regionów genomu, ale niektóre wpływają również na aminokwasy w kodujących białka częściach danego genu. Na podstawie danych z 1000 Genomes Project opisano około 17800 genów z wariantami genetycznymi dającymi izoformy białkowe.
Rekombinacja somatyczna
Rekombinacja somatyczna jest mechanizmem rekombinacji genetycznej, który jest unikalny dla genów immunoglobulin i receptorów komórek T. W procesie tym immunoglobuliny i receptory komórek T ulegają rekombinacji. W tym procesie powstają immunoglobuliny i receptory T-komórkowe o dużej różnorodności.
Uhlén M et al., Tissue-based map of the human proteome. Science (2015)
PubMed: 25613900 DOI: 10.1126/science.1260419
Wydawnictwo Naukowe.