Inteligența artificială face progrese uriașe în prezicerea modului în care se pliază proteinele – una dintre cele mai mari provocări ale biologieis – promițând dezvoltarea rapidă a medicamentelor

Takeaways

  • Un program software de „învățare profundă” al laboratorului DeepMind, deținut de Google, a înregistrat progrese mari în rezolvarea uneia dintre cele mai mari provocări ale biologiei – înțelegerea pliajului proteinelor.

  • Plasarea proteinelor este procesul prin care o proteină își ia forma de la un șir de blocuri de construcție la structura sa tridimensională finală, care îi determină funcția.

  • Prin intermediul unei mai bune predicții a modului în care proteinele își iau structura, sau „se pliază”, oamenii de știință pot dezvolta mai rapid medicamente care, de exemplu, să blocheze acțiunea unor proteine virale cruciale.

Rezolvarea a ceea ce biologii numesc „problema plierii proteinelor” este o afacere importantă. Proteinele sunt caii de bătaie ai celulelor și sunt prezente în toate organismele vii. Ele sunt alcătuite din lanțuri lungi de aminoacizi și sunt vitale pentru structura celulelor și pentru comunicarea dintre ele, precum și pentru reglarea întregii chimii din organism.

În această săptămână, compania de inteligență artificială DeepMind, deținută de Google, a făcut o demonstrație a unui program de învățare profundă numit AlphaFold2, pe care experții îl numesc o descoperire importantă pentru rezolvarea marii provocări a pliajului proteinelor.

Proteinele sunt lanțuri lungi de aminoacizi legați între ei ca niște mărgele pe o sfoară. Dar pentru ca o proteină să își facă treaba în celulă, trebuie să se „plieze” – un proces de răsucire și îndoire care transformă molecula într-o structură tridimensională complexă care poate interacționa cu ținta sa din celulă. Dacă plierea este întreruptă, atunci proteina nu va avea forma corectă – și nu își va putea îndeplini funcția în interiorul organismului. Acest lucru poate duce la îmbolnăvire – așa cum se întâmplă în cazul unei boli comune, cum ar fi Alzheimer, și a celor rare, cum ar fi fibroza chistică.

Învățarea profundă este o tehnică de calcul care utilizează informațiile adesea ascunse conținute în seturi de date vaste pentru a rezolva întrebări de interes. A fost utilizată pe scară largă în domenii precum jocurile, recunoașterea vorbirii și a vocii, mașinile autonome, știința și medicina.

Cred că instrumente precum AlphaFold2 îi vor ajuta pe oamenii de știință să proiecteze noi tipuri de proteine, unele care ar putea, de exemplu, să ajute la descompunerea materialelor plastice și la combaterea viitoarelor pandemii virale și a bolilor.

Sunt chimist computațional și autor al cărții The State of Science. Eu și studenții mei studiem structura și proprietățile proteinelor fluorescente folosind programe computerizate de pliere a proteinelor bazate pe fizica clasică.

După zeci de ani de studiu de către mii de grupuri de cercetare, aceste programe de predicție a pliajului proteinelor sunt foarte bune la calcularea schimbărilor structurale care apar atunci când aducem mici modificări moleculelor cunoscute.

Dar nu au reușit în mod adecvat să prezică modul în care proteinele se pliază de la zero. Înainte de apariția învățării profunde, problema de pliere a proteinelor părea imposibil de rezolvat și părea pregătită să îi frustreze pe chimiștii computaționali pentru multe decenii de acum încolo.

Un lanț de aminoacizi trece prin mai multe etape de pliere, care are loc prin legături de hidrogen între aminoacizii din diferite regiuni ale proteinei, înainte de a ajunge la structura finală. Exemplul prezentat aici este hemoglobina, o proteină din celulele roșii din sânge care transportă oxigenul către țesuturile corpului. Anatomie & Fiziologie, site-ul web Connexions

Plasarea proteinelor

Secvența aminoacizilor – care este codificată în ADN – definește forma 3D a proteinei. Forma determină funcția acesteia. Dacă structura proteinei se modifică, aceasta nu-și poate îndeplini funcția. Predicția corectă a pliurilor proteinelor pe baza secvenței de aminoacizi ar putea revoluționa proiectarea medicamentelor și ar putea explica cauzele bolilor noi și vechi.

Toate proteinele cu aceeași secvență de elemente constitutive de aminoacizi se pliază în aceeași formă tridimensională, care optimizează interacțiunile dintre aminoacizi. Ele fac acest lucru în câteva milisecunde, deși au la dispoziție un număr astronomic de configurații posibile – aproximativ 10 la puterea 300. Acest număr masiv este ceea ce face dificilă prezicerea modului în care o proteină se pliază, chiar și atunci când oamenii de știință cunosc întreaga secvență de aminoacizi care intră în alcătuirea ei. Anterior, prezicerea structurii unei proteine pornind de la secvența de aminoacizi era imposibilă. Structurile proteinelor erau determinate experimental, un efort costisitor și de lungă durată.

După ce cercetătorii vor putea prezice mai bine cum se pliază proteinele, vor putea înțelege mai bine cum funcționează celulele și cum proteinele prost pliate provoacă boli. Instrumentele mai bune de predicție a proteinelor ne vor ajuta, de asemenea, să proiectăm medicamente care pot viza o anumită regiune topologică a unei proteine în care au loc reacții chimice.

Care este mișcarea ta? style-photography/Getty Images

AlphaFold s-a născut din învățarea profundă a jocurilor de șah, Go și poker

Succesul programului de predicție a pliajului de proteine al DeepMind, numit AlphaFold, nu este neașteptat. Alte programe de învățare în profunzime scrise de DeepMind i-au demolat pe cei mai buni jucători de șah, Go și poker din lume.

În 2016 Stockfish-8, un motor de șah open-source, a fost campionul mondial de șah pe calculator. Acesta a evaluat 70 de milioane de poziții de șah pe secundă și a avut la dispoziție secole de strategii de șah acumulate de oameni și zeci de ani de experiență informatică. A jucat eficient și brutal, învingându-i fără milă pe toți adversarii săi umani, fără niciun gram de finețe. A apărut învățarea profundă.

La 7 decembrie 2017, programul de șah cu învățare profundă al Google, AlphaZero, l-a zdrobit pe Stockfish-8. Motoarele de șah au jucat 100 de partide, iar AlphaZero a câștigat 28 și a egalat 72. Nu a pierdut nicio partidă. AlphaZero a efectuat doar 80.000 de calcule pe secundă, față de cele 70 de milioane de calcule ale lui Stockfish-8, și a avut nevoie de doar patru ore pentru a învăța șah de la zero, jucând împotriva lui însuși de câteva milioane de ori și optimizându-și rețelele neuronale pe măsură ce învăța din experiența sa.

AlphaZero nu a învățat nimic de la oameni sau de la jocurile de șah jucate de oameni. S-a învățat singur și, în acest proces, a derivat strategii nemaiîntâlnite până acum. Într-un comentariu în revista Science, fostul campion mondial de șah Garry Kasparov a scris că, învățând din jocul propriu, AlphaZero a dezvoltat strategii care „reflectă adevărul” șahului, mai degrabă decât să reflecte „prioritățile și prejudecățile” programatorilor. „Este întruchiparea clișeului „lucrează mai inteligent, nu mai mult”.”

CASP – Jocurile Olimpice pentru modelatorii moleculari

La fiecare doi ani, cei mai buni chimiști computaționali din lume testează abilitățile programelor lor de a prezice plierea proteinelor și concurează în cadrul competiției CASP (Critical Assessment of Structure Prediction).

În cadrul competiției, echipele primesc secvența liniară de aminoacizi pentru aproximativ 100 de proteine a căror formă 3D este cunoscută, dar care nu a fost încă publicată; apoi trebuie să calculeze cum s-ar plia aceste secvențe. În 2018, AlphaFold, începătorul de învățare profundă din cadrul competiției, a învins toate programele tradiționale – dar cu greu.

Doi ani mai târziu, luni, s-a anunțat că Alphafold2 a câștigat competiția din 2020 cu o marjă sănătoasă. Și-a biciuit concurenții, iar predicțiile sale au fost comparabile cu rezultatele experimentale existente, determinate prin tehnici de referință, cum ar fi cristalografia prin difracție de raze X și microscopia crioelectronică. În curând, mă aștept ca AlphaFold2 și progeniturile sale să fie metodele preferate pentru a determina structurile proteinelor înainte de a recurge la tehnici experimentale care necesită o muncă minuțioasă și laborioasă pe instrumente costisitoare.

Unul dintre motivele succesului lui AlphaFold2 este faptul că a putut folosi baza de date Protein Database, care are peste 170.000 de structuri 3D determinate experimental, pentru a se antrena să calculeze structurile corect pliate ale proteinelor.

Impactul potențial al AlphaFold poate fi apreciat dacă se compară numărul tuturor structurilor de proteine publicate – aproximativ 170.000 – cu cele 180 de milioane de secvențe de ADN și proteine depuse în Baza de date universală a proteinelor. AlphaFold ne va ajuta să sortăm prin tezaurele de secvențe de ADN, vânând noi proteine cu structuri și funcții unice.

Am devenit eu, un modelator molecular, redundant cu AlphaFold?

Ca și în cazul programelor de șah și Go – AlphaZero și AlphaGo – nu știm exact ce face algoritmul AlphaFold2 și de ce folosește anumite corelații, dar știm că funcționează.

Pe lângă faptul că ne ajută să prezicem structurile proteinelor importante, înțelegerea „gândirii” lui AlphaFold ne va ajuta, de asemenea, să obținem noi informații despre mecanismul de pliere a proteinelor.

Una dintre cele mai frecvente temeri exprimate cu privire la inteligența artificială este că aceasta va duce la șomaj pe scară largă. AlphaFold mai are încă un drum semnificativ de parcurs înainte de a putea prezice în mod constant și cu succes plierea proteinelor.

Cu toate acestea, odată ce s-a maturizat și programul poate simula plierea proteinelor, chimiștii computaționali vor fi implicați integral în îmbunătățirea programelor, încercând să înțeleagă corelațiile de bază utilizate și aplicând programul pentru a rezolva probleme importante, cum ar fi plierea defectuoasă a proteinelor asociată cu multe boli, cum ar fi Alzheimer, Parkinson, fibroza chistică și boala Huntington.

AlphaFold și urmașii săi vor schimba cu siguranță modul în care lucrează chimiștii computaționali, dar nu îi vor face redundanți. Alte domenii nu vor fi la fel de norocoase. În trecut, roboții au reușit să înlocuiască oamenii care făceau muncă manuală; cu IA, abilitățile noastre cognitive sunt, de asemenea, puse la încercare.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.