Овогодишња награда Ласкерово основно медицинско истраживање додељена је Демису Хасабису и Џону Џамперу за њихов допринос стварању система вештачке интелигенције AlphaFold који предвиђа тродимензионалну структуру протеина на основу секвенце аминокиселина првог реда.
Њихови резултати решавају проблем који дуго мучи научну заједницу и отварају врата убрзању истраживања у биомедицинској области. Протеини играју кључну улогу у развоју болести: код Алцхајмерове болести, они се савијају и згрушавају; код рака, њихова регулаторна функција је изгубљена; код урођених метаболичких поремећаја, они су дисфункционални; код цистичне фиброзе, они одлазе у погрешан простор у ћелији. Ово су само неки од многих механизама који узрокују болести. Детаљни модели структуре протеина могу да обезбеде атомске конфигурације, покрену дизајн или селекцију молекула високог афинитета и убрзају откривање лекова.
Структуре протеина се генерално одређују рендгенском кристалографијом, нуклеарном магнетном резонанцом и криоелектронском микроскопијом. Ове методе су скупе и захтевају много времена. То резултира постојећим 3Д базама података о структурама протеина са само око 200.000 структурних података, док је технологија секвенцирања ДНК произвела више од 8 милиона протеинских секвенци. Шездесетих година прошлог века, Анфинсен и др. су открили да се 1Д секвенца аминокиселина може спонтано и понављајуће савити у функционалну тродимензионалну конформацију (слика 1А) и да молекуларни „шаперони“ могу убрзати и олакшати овај процес. Ова запажања доводе до 60-годишњег изазова у молекуларној биологији: предвиђање 3Д структуре протеина из 1Д секвенце аминокиселина. Са успехом Пројекта људског генома, наша способност да добијемо 1Д секвенце аминокиселина се значајно побољшала, а овај изазов је постао још хитнији.
Предвиђање структура протеина је тешко из неколико разлога. Прво, сви могући тродимензионални положаји сваког атома у свакој аминокиселини захтевају много истраживања. Друго, протеини максимално користе комплементарност у својој хемијској структури како би ефикасно конфигурисали атоме. Пошто протеини обично имају стотине „донора“ водоничних веза (обично кисеоник) који би требало да буду близу „акцептора“ водоничне везе (обично азот везан за водоник), може бити веома тешко пронаћи конформације где је скоро сваки донор близу акцептора. Треће, постоје ограничени примери за обуку експерименталних метода, тако да је неопходно разумети потенцијалне тродимензионалне интеракције између аминокиселина на основу 1Д секвенци користећи информације о еволуцији релевантних протеина.
Физика је први пут коришћена за моделирање интеракције атома у потрази за најбољом конформацијом, а развијен је и метод за предвиђање структуре протеина. Карплус, Левит и Варшел су 2013. године добили Нобелову награду за хемију за свој рад на рачунарској симулацији протеина. Међутим, методе засноване на физици су рачунски скупе и захтевају приближну обраду, тако да се прецизне тродимензионалне структуре не могу предвидети. Још један приступ „заснован на знању“ је коришћење база података познатих структура и секвенци за тренирање модела путем вештачке интелигенције и машинског учења (AI-ML). Хасабис и Џампер примењују елементе и физике и AI-ML, али иновација и скок у перформансама приступа првенствено потичу из AI-ML. Два истраживача су креативно комбиновала велике јавне базе података са рачунарским ресурсима индустријског нивоа како би створили AlphaFold.
Како знамо да су „решили“ загонетку структурног предвиђања? Године 1994. основано је такмичење за критичку процену структурног предвиђања (CASP), које се састаје сваке две године како би се пратио напредак структурног предвиђања. Истраживачи ће делити 1D секвенцу протеина чију су структуру недавно решили, али чији резултати још нису објављени. Предиктор предвиђа тродимензионалну структуру користећи ову 1D секвенцу, а евалуатор независно процењује квалитет предвиђених резултата упоређујући их са тродимензионалном структуром коју је дао експерименталац (дата само евалуатору). CASP спроводи праве слепе прегледе и бележи периодичне скокове учинка повезане са методолошким иновацијама. На 14. CASP конференцији 2020. године, резултати предвиђања AlphaFold-а показали су такав скок у учинку да су организатори објавили да је проблем 3D предвиђања структуре решен: тачност већине предвиђања била је блиска оној експерименталних мерења.
Шири значај је у томе што рад Хасабиса и Џамперa убедљиво показује како би AI-ML могао да трансформише науку. Његово истраживање показује да AI-ML може да изгради сложене научне хипотезе из више извора података, да механизми пажње (слични онима у ChatGPT-у) могу да открију кључне зависности и корелације у изворима података и да AI-ML може самостално да процени квалитет својих резултата. AI-ML у суштини ради науку.
Време објаве: 23. септембар 2023.




