El espacio estructural del proteoma humano es amplio y diverso debido a la presencia de diversas variantes proteicas (isoformas), incluyendo modificaciones postraduccionales, variantes de empalme, productos proteolíticos, variaciones genéticas y recombinación somática. Por ejemplo, hay decenas de millones de moléculas de IgG diferentes en un cuerpo humano en un momento dado debido a un elaborado proceso de recombinación somática y mutación dirigida. Además, una gran parte de los genes que codifican proteínas (aproximadamente el 80%) tienen variantes de empalme que dan lugar a productos proteicos de diferentes tamaños. Del mismo modo, se han notificado más de cientos de miles de modificaciones postraduccionales como parte de diversos esfuerzos de proteómica y muchas proteínas dependen de una proteólisis precisa para su activación. Además, se han notificado aproximadamente 320000 variaciones entre individuos de la población en regiones de codificación de proteínas como resultado del Proyecto 1000 Genomas. En resumen, la diversidad humana de los 19670 genes codificantes de proteínas se ve incrementada inmensamente por la presencia de numerosas isoformas proteicas.
Variantes de empalme
El empalme alternativo es un mecanismo ampliamente utilizado para la formación de isoformas. En este proceso, que ocurre durante la expresión de los genes, los exones de un gen pueden ser incluidos o excluidos en el ARNm procesado. Por lo tanto, las proteínas traducidas a partir de ARNm empalmados alternativamente contendrán diferencias en su secuencia de aminoácidos y, por lo tanto, suelen diferir en sus propiedades funcionales.
Los cuatro subtipos principales de splicing alternativo:
- La omisión de exones (exones Cassette) es la forma más prevalente de splicing alternativo. En este modo, el exón se empalma fuera del transcrito primario junto con sus intrones flanqueantes.
- El sitio donante alternativo es el tipo cuando se reconocen dos o más sitios de empalme en el extremo 3′ de un exón. Este modo también se denomina sitio de empalme alternativo 5′.
- Sitio aceptor alternativo es el tipo cuando se reconocen dos o más sitios de empalme en el extremo 5′ de un exón. Este modo también se denomina sitio de empalme alternativo 3′.
- La retención de intrones es el modo en el que un intrón puede permanecer en la molécula de ARNm madura.
- Glicosilación: adición de cadenas de azúcar, ya sea en el nitrógeno amida de la cadena lateral de la asparagina (N-glicosilación) o en el oxígeno hidroxilo de la cadena lateral de la serina o treonina (O-glicosilación). La lista de glicoproteínas es larga y pueden desempeñar distintas funciones, por ejemplo en la respuesta inmunitaria (familia de las inmunoglobulinas), como moléculas estructurales (familia del colágeno), hormonas (HCG, TSH, EPO), moléculas de transporte (transferrina), enzimas (fosfatasa alcalina) y receptores.
- Fosforilación: adición de un grupo fosfato, normalmente a la tirosina, serina, treonina, histidina o aspartato. Esta modificación es reversible y puede, por ejemplo, activar/inactivar enzimas y receptores. Un ejemplo clásico en el que la fosforilación juega un papel muy importante es en la regulación de la proteína supresora de tumores p53 y de las proteínas de diversas vías de señalización, como la vía RAS y STAT.
- Ubiquitinación: la adición de ubiquitina dará una señal de degradación, alterará la localización celular o afectará a la actividad o las interacciones.
Figura 1. Los principales tipos de splicing alternativo.
Muchos genes codifican para múltiples isoformas de proteínas (variantes de empalme) con localizaciones subcelulares alternativas, incluyendo 189 genes con isoformas tanto secretadas como unidas a la membrana. Estos genes son de especial interés. En la Figura 2, se muestran las fracciones de las distintas categorías para los 19670 genes.
Figura 2. Diagrama de Venn que muestra el solapamiento entre el número de genes que son intracelulares, de membrana, secretados o con isoformas que pertenecen a más de una de las tres categorías.
Modificaciones postraduccionales
Las modificaciones postraduccionales (PTMs) son modificaciones químicas que juegan un papel clave en la función de una proteína, ya que regulan la actividad, la localización y la interacción con otras moléculas celulares como proteínas, ácidos nucleicos, lípidos y cofactores. También tienen la posibilidad de regular la actividad celular. Las PTM se producen en distintas cadenas laterales de aminoácidos o enlaces peptídicos y, en la mayoría de los casos, están mediadas por la actividad enzimática. La modificación postraduccional puede ocurrir en cualquier paso del «ciclo de vida» de una proteína.
Algunos tipos comunes e importantes de PTMs:
Otras modificaciones postraduccionales comunes son la S-nitrosilación, la metilación, la N-acetilación, la lipidación, la formación de enlaces disulfuro, la sulfatación, la acilación, la desaminación, etc.
Modificaciones proteolíticas
Después de la traducción, algunas proteínas sufren un procesamiento proteolítico. Este proceso es altamente específico y como resultado de la escisión de uno o más enlaces en la proteína objetivo por parte de las proteasas, la actividad de la proteína se verá alterada.
Un gran número de proteínas se sintetizan como precursores inactivos, las llamadas proproteínas. Para activar estas proteínas, es necesario eliminar el propéptido mediante un procesamiento proteolítico. La proteólisis de las proteínas precursoras dará lugar a la regulación de muchos procesos celulares. Las proteínas bien estudiadas que sufren este proceso son la insulina (INS) y el factor VIII (F8).
Variaciones genéticas
Aunque todos los seres humanos son casi idénticos desde el punto de vista bioquímico (99,9%), existen grandes variaciones entre los individuos de la población como resultado de las variaciones genéticas específicas de los alelos en las regiones que codifican las proteínas. Muchas de las variaciones genéticas se encuentran en regiones no codificantes del genoma, pero algunas también afectan a los aminoácidos de las partes codificantes de las proteínas de un determinado gen. Se han descrito aproximadamente 17800 genes con variaciones genéticas que dan lugar a isoformas proteicas, según el Proyecto 1000 Genomas.
Recombinación somática
La recombinación somática es un mecanismo de recombinación genética que es exclusivo de los genes de las inmunoglobulinas y de los receptores de células T. En este proceso se producen inmunoglobulinas y receptores de células T de gran diversidad.
Uhlén M et al, Mapa tisular del proteoma humano. Science (2015)
PubMed: 25613900 DOI: 10.1126/science.1260419