Takeaways
-
Een “deep learning”-softwareprogramma van het Google-laboratorium DeepMind heeft grote vooruitgang geboekt bij het oplossen van een van de grootste uitdagingen voor de biologie – het begrijpen van eiwitvouwing.
-
Eiwitvouwing is het proces waarbij een eiwit zijn vorm krijgt van een reeks bouwstenen tot zijn uiteindelijke driedimensionale structuur, die bepalend is voor zijn functie.
-
Door beter te voorspellen hoe eiwitten hun structuur krijgen, oftewel “vouwen”, kunnen wetenschappers sneller geneesmiddelen ontwikkelen die bijvoorbeeld de werking van cruciale virale eiwitten blokkeren.
Het oplossen van wat biologen “het eiwitvouwingsprobleem” noemen, is van groot belang. Eiwitten zijn de werkpaarden van cellen en zijn aanwezig in alle levende organismen. Ze bestaan uit lange ketens van aminozuren en zijn van vitaal belang voor de structuur van cellen en de communicatie tussen cellen onderling, en voor de regulering van alle chemie in het lichaam.
Deze week demonstreerde het kunstmatige-intelligentiebedrijf DeepMind, dat eigendom is van Google, een deep-learning programma met de naam AlphaFold2, dat deskundigen een doorbraak noemen op weg naar de oplossing van de grote uitdaging van eiwitvouwing.
Eiwitten zijn lange ketens van aminozuren die als kralen aan een touwtje met elkaar zijn verbonden. Maar om zijn werk in de cel te kunnen doen, moet een eiwit zich “vouwen” – een proces van draaien en buigen dat het molecuul omvormt tot een complexe driedimensionale structuur die kan interageren met zijn doelwit in de cel. Als de vouwing wordt verstoord, kan het eiwit niet de juiste vorm aannemen – en kan het zijn taak in het lichaam niet vervullen. Dit kan tot ziekte leiden – zoals het geval is bij een veel voorkomende ziekte als Alzheimer, en zeldzame ziekten als taaislijmziekte.
Diep leren is een computationele techniek die gebruik maakt van de vaak verborgen informatie in enorme datasets om interessante vragen op te lossen. Het wordt op grote schaal gebruikt op gebieden als games, spraak- en stemherkenning, autonome auto’s, wetenschap en geneeskunde.
Ik denk dat tools als AlphaFold2 wetenschappers zullen helpen bij het ontwerpen van nieuwe soorten eiwitten, die bijvoorbeeld kunnen helpen bij het afbreken van plastics en het bestrijden van toekomstige virale pandemieën en ziekten.
Ik ben een computationeel chemicus en auteur van het boek The State of Science. Mijn studenten en ik bestuderen de structuur en eigenschappen van fluorescerende eiwitten met behulp van computerprogramma’s voor eiwitvouwing die zijn gebaseerd op de klassieke natuurkunde.
Na tientallen jaren van studie door duizenden onderzoeksgroepen zijn deze programma’s voor het voorspellen van eiwitvouwing zeer goed in het berekenen van structurele veranderingen die optreden wanneer we kleine veranderingen aanbrengen in bekende moleculen.
Maar ze zijn er nog niet goed in geslaagd om te voorspellen hoe eiwitten zich van de grond af aan opvouwen. Voordat deep learning zijn intrede deed, leek het eiwitvouwingsprobleem onmogelijk moeilijk, en het leek erop dat het computationele chemici nog vele decennia zou frustreren.
Proteïnevouwing
De volgorde van de aminozuren – die in het DNA is gecodeerd – bepaalt de 3D-vorm van het eiwit. De vorm bepaalt de functie. Als de structuur van het eiwit verandert, kan het zijn functie niet meer uitvoeren. Het correct voorspellen van eiwitplooien op basis van de aminozuursequentie zou een revolutie kunnen veroorzaken in het ontwerpen van geneesmiddelen, en de oorzaken van nieuwe en oude ziekten kunnen verklaren.
Alle eiwitten met dezelfde volgorde van aminozuur-bouwstenen vouwen zich in dezelfde driedimensionale vorm, waardoor de interacties tussen de aminozuren worden geoptimaliseerd. Zij doen dit binnen milliseconden, hoewel zij een astronomisch aantal mogelijke configuraties tot hun beschikking hebben – ongeveer 10 tot de macht 300. Dit enorme aantal maakt het moeilijk te voorspellen hoe een eiwit zich vouwt, zelfs wanneer wetenschappers de volledige volgorde kennen van de aminozuren die het eiwit maken. Vroeger was het onmogelijk om de structuur van een eiwit te voorspellen aan de hand van de volgorde van de aminozuren. Eiwitstructuren werden experimenteel bepaald, een tijdrovende en kostbare onderneming.
Als onderzoekers beter kunnen voorspellen hoe eiwitten zich vouwen, zullen ze beter kunnen begrijpen hoe cellen functioneren en hoe verkeerd gevouwen eiwitten ziekten veroorzaken. Betere hulpmiddelen om eiwitten te voorspellen zullen ons ook helpen geneesmiddelen te ontwerpen die zich richten op een bepaald topologisch gebied van een eiwit waar chemische reacties plaatsvinden.
AlphaFold is voortgekomen uit deep-learning schaak-, Go- en pokerspellen
Het succes van DeepMind’s programma voor het voorspellen van eiwitvouwen, AlphaFold genaamd, komt niet onverwacht. Andere deep-learning programma’s geschreven door DeepMind hebben ’s werelds beste schaak-, Go- en pokerspelers gesloopt.
In 2016 was Stockfish-8, een open-source schaakengine, ’s werelds computerschaakkampioen. Het evalueerde 70 miljoen schaakposities per seconde en had eeuwen van verzamelde menselijke schaakstrategieën en decennia van computerervaring om uit te putten. Hij speelde efficiënt en brutaal en versloeg genadeloos al zijn menselijke uitdagers, zonder ook maar een greintje finesse. Enter diep leren.
Op 7 dec. 2017 versloeg Google’s deep learning schaakprogramma AlphaZero Stockfish-8. De schaakmachines speelden 100 partijen, waarvan AlphaZero er 28 won en 72 gelijkspeelde. Het verloor geen enkele partij. AlphaZero maakte slechts 80.000 berekeningen per seconde, in tegenstelling tot de 70 miljoen berekeningen van Stockfish-8, en het kostte slechts vier uur om vanaf nul te leren schaken door een paar miljoen keer tegen zichzelf te spelen en zijn neurale netwerken te optimaliseren terwijl het van zijn ervaring leerde.
AlphaZero heeft niets geleerd van mensen of schaakpartijen die door mensen zijn gespeeld. Het leerde zichzelf en leidde daarbij strategieën af die nog nooit eerder waren vertoond. In een commentaar in het tijdschrift Science schreef voormalig wereldkampioen schaken Garry Kasparov dat AlphaZero, door van zichzelf te leren, strategieën ontwikkelde die “de waarheid” van het schaken weerspiegelen in plaats van “de prioriteiten en vooroordelen” van de programmeurs. “Het is de belichaming van het cliché ‘werk slimmer, niet harder’.”
CASP – de Olympische Spelen voor moleculaire modelleurs
Olke twee jaar testen ’s werelds beste computationele chemici het vermogen van hun programma’s om de vouwing van eiwitten te voorspellen en nemen ze het tegen elkaar op in de Critical Assessment of Structure Prediction (CASP) competitie.
In de competitie krijgen teams de lineaire volgorde van aminozuren voor ongeveer 100 eiwitten waarvan de 3D-vorm bekend is, maar nog niet is gepubliceerd; vervolgens moeten ze berekenen hoe deze sequenties zich zouden vouwen. In 2018 versloeg AlphaFold, de deep-learning nieuweling in de competitie, alle traditionele programma’s – maar nipt.
Twee jaar later, op maandag, werd bekend dat Alphafold2 de 2020-wedstrijd met een gezonde marge had gewonnen. Het versloeg zijn concurrenten, en zijn voorspellingen waren vergelijkbaar met de bestaande experimentele resultaten bepaald met behulp van gouden standaard technieken zoals röntgendiffractie kristallografie en cryo-elektronenmicroscopie. Binnenkort verwacht ik dat AlphaFold2 en zijn nakomelingen de methoden bij uitstek zullen zijn om eiwitstructuren te bepalen, voordat men zijn toevlucht neemt tot experimentele technieken die moeizaam, moeizaam werk op dure instrumenten vereisen.
Een van de redenen voor het succes van AlphaFold2 is dat het gebruik kon maken van de Protein Database, die meer dan 170.000 experimenteel bepaalde 3D-structuren bevat, om zichzelf te trainen in het berekenen van de correct gevouwen structuren van eiwitten.
De potentiële impact van AlphaFold wordt duidelijk als men het aantal gepubliceerde eiwitstructuren – ongeveer 170.000 – vergelijkt met de 180 miljoen DNA- en eiwitsequenties die in de Universal Protein Database zijn opgeslagen. AlphaFold zal ons helpen om de schat aan DNA-sequenties te doorzoeken op zoek naar nieuwe eiwitten met unieke structuren en functies.
Heeft AlphaFold mij, een moleculair modelleerder, overbodig gemaakt?
Net als bij de schaak- en Go-programma’s – AlphaZero en AlphaGo – weten we niet precies wat het AlphaFold2-algoritme doet en waarom het bepaalde correlaties gebruikt, maar we weten wel dat het werkt.
Naast dat het ons helpt de structuren van belangrijke eiwitten te voorspellen, zal het begrijpen van AlphaFold’s “denken” ons ook helpen nieuwe inzichten te krijgen in het mechanisme van eiwitvouwing.
Een van de meest gehoorde angsten over AI is dat het zal leiden tot grootschalige werkloosheid. AlphaFold heeft nog een lange weg te gaan voordat het op consistente en succesvolle wijze eiwitvouwing kan voorspellen.
Als het eenmaal volwassen is en het programma eiwitvouwing kan simuleren, zullen computationele chemici echter integraal betrokken zijn bij het verbeteren van de programma’s, het proberen te begrijpen van de onderliggende correlaties die worden gebruikt, en het toepassen van het programma om belangrijke problemen op te lossen, zoals de eiwitmisvouwing die wordt geassocieerd met veel ziekten zoals Alzheimer, Parkinson, cystische fibrose en de ziekte van Huntington.
AlphaFold en zijn nakomelingen zullen de manier waarop computationele chemici werken zeker veranderen, maar het zal ze niet overbodig maken. Andere gebieden zullen niet zo gelukkig zijn. In het verleden waren robots in staat om mensen te vervangen bij het verrichten van handenarbeid; met AI worden ook onze cognitieve vaardigheden op de proef gesteld.