Modele zredukowane

W fizyce, a zwłaszcza w mechanice statystycznej, często stosowana jest procedura renormalizacji, w której eliminuje się stopnie swobody uznane za nieważne i wprowadza efektywne oddziaływania pomiędzy istotnymi stopniami swobody. Ten sposób myślenia stał u podstaw wprowadzenia modeli zredukowanych, czy gruboziarnistych, w których stopnie swobody aminokwasu redukuje się do trzech, a więc jak dla przypadku jednej efektywnej cząstki, umieszczonej w położeniu węgla Cα. Efektywna energia sekwencji w danej konformacji nie zawiera wtedy wewnętrznych stopni swobody aminokwasów ani tych, które dotyczą wody.

Pierwsze tego rodzaju modele pojawiły się pod sam koniec lat 80-tych (K.A. Dill) i dotyczyły krótkich modeli na sieci z dwuliterowym alfabetem aminokwasów: hydrofobowych i hydrofilowych, z efektywnym przyciąganiem pomiędzy "literami" hydrofobowymi. Takie proste modele potrafiły uchwycić istotę zwijania białek, a jednocześnie pozwalały na bardzo dokładne lub czasami ścisłe scharakteryzowanie równowagowych i kinetycznych właściwości układu. Służyły one więc często do testowania teorii dotyczących białek, np. tych dotyczących właściwości krajobrazów energetycznych heteropolimerów, które się zwijają dobrze i są termodynamicznie stabilne (modele białek) oraz tych, które się zwijają źle (modele sekwencji przypadkowych).

Istotnym elementem uczynienia postępu w problemach zwijania i projektowania białek jest wydedukowanie efektywnych potencjałów oddziaływań pomiędzy aminokwasami. Można szukać rozwiązania tego zadania poprzez statystyczną analizę danych dotyczących doświadczalnie określonych struktur białkowych. Na przykład w 1985 r. S. Miyazawa i R.L. Jernigan określili efektywne oddziaływania na podstawie częstości występowania kontaktów zadanych par aminokwasów (ij) i poprzez przypisanie tym częstościom czynników boltzmannowskich, exp(-Eij/kBT), gdzie T odpowiada temperaturze pokojowej. Tak określone energie oddziaływań, Eij, mają jednak charakter tylko jakościowy.

Jedna ze strategii uzyskania takich efektywnych oddziaływań opiera się na obserwacji (I.R. Banavar, A. Maritan), że dla zadanej sekwencji białkowej poprawne potencjały powinny rozpoznawać stan natywny jako stan wyróżniony w tym znaczeniu, że sekwencja powinna mieć w nim energię niższą, niż w innych próbnych konformacjach o tej samej liczbie aminokwasów. Te próbne konformacje zadane są poprzez fragmenty białek z banku białek. Takie próbne struktury mogą nie być fizyczne dla pewnych sekwencji z powodu ograniczeń sterycznych i w dodatku zwykle nie współzawodniczą one energetycznie ze stanem natywnym w znaczący sposób. Praktycznym sposobem ulepszenia metody jest rozważenie próbnego początkowego zestawu oddziaływań i następnie znalezienie odpowiadających im konformacji o niskich energiach. W następnym kroku parametry potencjałów modyfikuje się tak, by nienatywne stany o niskich energiach zwiększały swe energie w stosunku do konformacji natywnej. Ten proces powtarza się wielokrotnie aż stany natywne wielu istotnie różnych od siebie białek ("niehomologicznych") staną się jednocześnie w pełni stabilne.

Jeszcze dalej idącą ideę dotyczącą zredukowania opisu białek zaproponował w latach 90-tych D. Eisenberg. Otóż informacje o strukturze trójwymiarowej białka można odwzorować w jednowymiarowym ciągu danych. Każdemu aminokwasowi można bowiem przypisać informację o sytuacji środowiskowej w jakiej się znajduje. Zwykle sytuację tę charakteryzuje się przez rodzaj struktury drugorzędowej oraz stopień wyeksponowania łańcucha bocznego, tzn. czy jest on schowany, czy odkryty, co jest zazwyczaj miarą hydrofobowości aminokwasu. Przegląd baz danych białkowych pozwala określić częstości, z jakimi każdy z 20 aminokwasów znajduje się w sytuacjach zdefiniowanych powyżej. Parametry te wprowadzają jednociałowy opis białka (nie rozważa się tu oddziaływań między parami aminokwasów), który idealnie nadaje się do badań porównawczych białek i do określania stopnia podobieństwa pomiędzy sekwencjami w zadanych strukturach. Nie jest to jednak program właściwy do badania np. kinetyki zwijania.

Testowanie statystyczne wyznaczonych jednociałowych parametrów Eisenberga prowadzi do wniosku, że prawdziwe stany natywne są zgodne z parametrami Eisenberga w około 69% białek. Parametry te można jednak wyznaczyć lepiej wprowadzając techniki tzw. sieci neuronowych. Techniki te pozwalają "nauczyć się" właściwych parametrów na podstawie analizy "treningowego" zbioru kilkuset białek (I. Chang, M. Cieplak, R. Dima, Maritan, Banavar). Sukces zidentyfikowania w testach stanu natywnego zwiększa się wtedy do 90%. W procedurze uczenia się parametry dobiera się tak, żeby stany natywne w zbiorze treningowym były dużo bardziej stabilne niż struktury próbne (fragmenty — o tej samej liczbie monomerów — struktur natywnych innych białek). Parametry finalne mają interpretację fizyczną związaną z ich preferencjami do przebywania w określonych środowiskach. Na przykład aminkowasy hydrofobowe (oprócz proliny) oraz cysteina są częściej obecne we wszystkich strukturach drugorzędowych i są ustawione tak, że unikają środowiska wodnego, natomiast najbardziej eksponowane miejsca w strukturze są najchętniej obsadzane przez zasadową lizynę.

Copyright © 1997-2021 Wydawnictwo Naukowe PWN SA
infolinia: 0 801 33 33 88