O espaço estrutural do proteoma humano é grande e diverso devido à presença de várias variantes proteicas (isoformas), incluindo modificações pós-tradução, variantes de emendas, produtos proteolíticos, variações genéticas e recombinação somática. Por exemplo, existem dezenas de milhões de moléculas IgG diferentes num corpo humano num determinado momento devido a um processo elaborado de recombinação somática e mutação direccionada. Além disso, uma grande porção dos genes codificadores de proteínas (aproximadamente 80%) tem variantes de emenda que produzem produtos proteicos de diferentes tamanhos. Similarmente, mais de centenas de milhares de modificações pós-tradução foram relatadas como parte de vários esforços proteômicos e muitas proteínas dependem de proteólise precisa para ativação. Além disso, aproximadamente 320000 variações entre indivíduos da população foram relatadas em regiões codificadoras de proteínas como resultado do Projeto 1000 Genomes. Em resumo, a diversidade humana dos 19670 genes codificadores de proteínas é imensamente aumentada pela presença de numerosas isoformas proteicas.
Variantes de emenda
A emenda alternativa é um mecanismo amplamente utilizado para a formação de isoformas. Neste processo, que ocorre durante a expressão gênica, os exônios de um gene podem ser incluídos ou excluídos no mRNA processado. As proteínas traduzidas dos mRNAs emendados alternadamente conterão, portanto, diferenças em sua seqüência de aminoácidos e, portanto, freqüentemente diferem em suas propriedades funcionais.
Os quatro principais subtipos de emenda alternativa:
- Exon skipping (Cassette exons) é a forma mais prevalente de emenda alternativa. Neste modo, o exon é emendado a partir da transcrição primária juntamente com seus introns.
- Sítio doador alternativo é o tipo quando dois ou mais sítios de emenda são reconhecidos no final de 3′ de um exon. Este modo também é chamado de site de emenda alternativa 5′.
- site aceitador alternativo é o tipo quando dois ou mais sites de emenda são reconhecidos no final de 5′ de um exon. Este modo também é chamado de site de emenda Alternativa 3′ splice site.
- retenção Intron é o modo no qual um intron pode permanecer na molécula mRNA madura.
Figure 1. Os principais tipos de emendas alternativas.
Muitos genes codificam múltiplas isoformas proteicas (variantes de emenda) com localizações subcelulares alternativas, incluindo 189 genes com isoformas segregadas e ligadas a membranas. Estes genes são de particular interesse. Na Figura 2, as frações das várias categorias são mostradas para todos os 19670 genes.
Figure 2. Diagrama Venn mostrando a sobreposição entre o número de genes que são intracelulares, de membranas, secretados, ou com isoformas pertencentes a mais de uma das três categorias.
Modificações pós-tradução
Modificações pós-tradução (PTMs) são modificações químicas que desempenham um papel fundamental na função de uma proteína, uma vez que regulam a atividade, localização e interação com outras moléculas celulares como proteínas, ácidos nucléicos, lipídios e cofatores. Elas também têm a possibilidade de regular a atividade celular. Os PTMs ocorrem em cadeias laterais distintas de aminoácidos ou ligações de peptídeos e são na maioria das vezes mediados pela atividade enzimática. A modificação pós-tradução pode ocorrer em qualquer etapa do “ciclo de vida” de uma proteína.
alguns tipos comuns e importantes de PTMs:
- Glicosilação: adição de cadeias de açúcar, seja na amida nitrogenada na cadeia lateral da asparagina (N-glicosilação) ou no hidroxil oxigénio na cadeia lateral da serina ou da treonina (O-glicosilação). A lista de glicoproteínas é longa e podem servir várias funções diferentes, por exemplo na resposta imunológica (família das imunoglobulinas), como moléculas estruturais (família do colágeno), hormônios (HCG, TSH, EPO), moléculas de transporte (transferrina), enzimas (fosfatase alcalina) e receptores.
- Fosforilação: adição de um grupo fosfato, geralmente à tirosina, serina, treonina, histidina ou aspartato. Esta modificação é reversível e pode, por exemplo, activar/inactivar enzimas e receptores. Um exemplo clássico onde a fosforilação desempenha um papel muito importante é na regulação da proteína supressora do tumor p53 e proteínas em várias vias de sinal, tais como a via RAS e STAT.
- Ubiquitinação: a adição de ubiquitina dará um sinal de degradação, alterará a localização celular ou afetará a atividade ou interações.
Outras modificações pós-tradução comuns são S-nitrosilação, metilação, N-acetilação, lipidação, formação de ligação de dissulfeto, sulfatação, acitilação, desaminação, etc.
Modificações proteolíticas
Após a tradução, algumas proteínas passam por processamento proteolítico. Este processo é altamente específico e como resultado da clivagem de uma ou mais ligações na proteína alvo por proteases, a atividade da proteína será alterada.
Um grande número de proteínas são sintetizadas como precursores inativos, as chamadas proproteínas. Para ativar estas proteínas, é necessária a remoção do propeptídeo através do processamento proteolítico. A proteólise das proteínas precursoras irá resultar na regulação de muitos processos celulares. As proteínas bem estudadas que passam por este processo são a insulina (INS) e o fator VIII (F8).
Variações genéticas
Embora todos os humanos sejam quase idênticos bioquimicamente (99,9%), há grandes variações entre os indivíduos da população como resultado de variações genéticas específicas dos alelos nas regiões codificadoras de proteínas. Muitas das variações genéticas estão em regiões não codificadoras do genoma, mas algumas também afetam os aminoácidos nas partes proteicas codificadoras de um gene em particular. Aproximadamente 17800 genes foram descritos com variações genéticas que produzem isoformas proteicas baseadas no Projeto 1000 Genomas.
Recombinação somática
Recombinação somática é um mecanismo de recombinação genética que é exclusivo dos genes receptores da imunoglobulina e das células T. Neste processo são produzidas imunoglobulinas e receptores de células T de alta diversidade.
Uhlén M et al., mapa do proteoma humano baseado em tecidos. Science (2015)
PubMed: 25613900 DOI: 10.1126/science.1260419