sidbanner

nyheter

Årets Lasker Basic Medical Research Award tilldelades Demis Hassabis och John Jumper för deras bidrag till skapandet av det artificiella intelligenssystemet AlphaFold som förutsäger proteiners tredimensionella struktur baserat på första ordningens sekvens av aminosyror.

 

Deras resultat löser ett problem som länge har plågat forskarsamhället och öppnar dörren för att accelerera forskningen inom det biomedicinska området. Proteiner spelar en avgörande roll i sjukdomsutveckling: vid Alzheimers sjukdom viks och klumpar de ihop sig; vid cancer förloras deras reglerande funktion; vid medfödda metabola störningar är de dysfunktionella; vid cystisk fibros hamnar de i fel utrymme i cellen. Dessa är bara några av de många mekanismer som orsakar sjukdom. Detaljerade proteinstrukturmodeller kan ge atomkonfigurationer, driva design eller val av molekyler med hög affinitet och påskynda läkemedelsutveckling.

 

Proteinstrukturer bestäms generellt med röntgenkristallografi, kärnmagnetisk resonans och kryoelektronmikroskopi. Dessa metoder är dyra och tidskrävande. Detta resulterar i befintliga 3D-proteinstrukturdatabaser med endast cirka 200 000 strukturella data, medan DNA-sekvenseringsteknik har producerat mer än 8 miljoner proteinsekvenser. På 1960-talet upptäckte Anfinsen et al. att aminosyrornas endimensionella sekvens spontant och repeterbart kan veckas till en funktionell tredimensionell konformation (Figur 1A), och att molekylära "chaperoner" kan accelerera och underlätta denna process. Dessa observationer leder till en 60 år lång utmaning inom molekylärbiologin: att förutsäga proteinernas 3D-struktur från aminosyrornas endimensionella sekvens. Med framgången med Human Genome Project har vår förmåga att erhålla endimensionella aminosyrasekvenser förbättrats avsevärt, och denna utmaning har blivit ännu mer brådskande.

ST6GAL1-proteinstruktur

Att förutsäga proteinstrukturer är svårt av flera anledningar. För det första kräver alla möjliga tredimensionella positioner för varje atom i varje aminosyra mycket utforskning. För det andra utnyttjar proteiner maximalt komplementaritet i sin kemiska struktur för att effektivt konfigurera atomer. Eftersom proteiner vanligtvis har hundratals vätebindnings-"donatorer" (vanligtvis syre) som borde vara nära vätebindnings-"acceptorn" (vanligtvis kvävebundet till väte), kan det vara mycket svårt att hitta konformationer där nästan varje donator är nära acceptorn. För det tredje finns det begränsade exempel för träning av experimentella metoder, så det är nödvändigt att förstå de potentiella tredimensionella interaktionerna mellan aminosyror baserat på endimensionella sekvenser med hjälp av information om utvecklingen av de relevanta proteinerna.

 

Fysik användes först för att modellera atomers interaktion i sökandet efter den bästa konformationen, och en metod utvecklades för att förutsäga proteiners struktur. Karplus, Levitt och Warshel tilldelades Nobelpriset i kemi 2013 för sitt arbete med beräkningssimulering av proteiner. Fysikbaserade metoder är dock beräkningsmässigt dyra och kräver ungefärlig bearbetning, så exakta tredimensionella strukturer kan inte förutsägas. En annan "kunskapsbaserad" metod är att använda databaser med kända strukturer och sekvenser för att träna modeller genom artificiell intelligens och maskininlärning (AI-ML). Hassabis och Jumper tillämpar element från både fysik och AI-ML, men innovationen och prestandasprånget hos metoden härrör främst från AI-ML. De två forskarna kombinerade kreativt stora offentliga databaser med industriella datorresurser för att skapa AlphaFold.

 

Hur vet vi att de har "löst" problemet med strukturprediktion? År 1994 inrättades tävlingen Critical Assessment of Structure Prediction (CASP), som möts vartannat år för att följa utvecklingen av strukturprediktionen. Forskarna kommer att dela 1D-sekvensen för proteinet vars struktur de nyligen har löst, men vars resultat ännu inte har publicerats. Prediktorn förutsäger den tredimensionella strukturen med hjälp av denna 1D-sekvens, och utvärderaren bedömer oberoende kvaliteten på de förutspådda resultaten genom att jämföra dem med den tredimensionella struktur som tillhandahålls av experimentisten (som endast tillhandahålls utvärderaren). CASP genomför verkliga blinda granskningar och registrerar periodiska prestandahopp i samband med metodologisk innovation. Vid den 14:e CASP-konferensen 2020 visade AlphaFolds prediktionsresultat ett sådant prestandasprång att arrangörerna meddelade att problemet med 3D-strukturprediktion hade lösts: noggrannheten för de flesta förutsägelser var nära den för experimentella mätningar.

 

Den bredare betydelsen är att Hassabis och Jumpers arbete övertygande visar hur AI-ML skulle kunna förändra vetenskapen. Dess forskning visar att AI-ML kan bygga komplexa vetenskapliga hypoteser från flera datakällor, att uppmärksamhetsmekanismer (liknande de i ChatGPT) kan upptäcka viktiga beroenden och korrelationer i datakällor, och att AI-ML kan självbedöma kvaliteten på sina resultat. AI-ML handlar i huvudsak om att bedriva vetenskap.


Publiceringstid: 23 sep-2023