Анализ аминокислотных последовательностей 572 древних белков, закодированных в геномах 836 бактерий и архей и унаследованных ими от последнего общего предка всего живого (LUCA), показал, что накопление различий между родственными белками, выполняющими одну и ту же функцию, происходило очень медленно и продолжается до сих пор. Предел расхождения так и не был достигнут за 3,5 млрд лет эволюции. По-видимому, накопление аминокислотных замен сдерживается сложными взаимодействиями между разными участками белковой молекулы. Более 90% аминокислотных позиций в каждом белке в принципе могут быть изменены без снижения функциональности, но любое конкретное изменение возможно только в определенном аминокислотном «контексте», и поэтому в каждый момент времени реально осуществимы изменения лишь около 2% позиций.
1. Вавилонская библиотека белковых молекул
В рассказе Борхеса «Вавилонская библиотека» описана невообразимо огромная библиотека, содержащая абсолютно все возможные тексты определенной длины, составленные из определенного набора символов. При этом в библиотеке нет двух одинаковых книг. Схожий образ громадного, но всё же конечного «пространства последовательностей» (sequence space) используют специалисты по биоинформатике, изучающие эволюцию белков. Это воображаемое пространство включает абсолютно все возможные последовательности из 20 аминокислот, длина которых соответствует реальному диапазону длин природных белков. Например, для белка длиной в 300 аминокислот существует 20.300 возможных последовательностей. По сравнению с этим числом количество элементарных частиц во Вселенной (порядка 10.80) выглядит ничтожно малым.
Каждая точка в пространстве последовательностей соответствует одному белку, а расстояние между двумя точками отражает величину различий между двумя белками. Эволюцию белковой молекулы можно представить как движение в пространстве последовательностей.
Каждой функции, выполняемой белками, соответствует некая область в пространстве последовательностей, в пределах которой любая точка — это белок, способный успешно справиться с данной функцией. До тех пор пока эволюция белковой молекулы идет без смены функции, ее движение должно быть ограничено этой областью.
Ключевой вопрос состоит в том, насколько велики такие области и какова их структура. Теоретически они могут быть как сплошными полями, так и лабиринтами узких тропинок, разделенных «запретными зонами».
Полезным дополнением к образу «пространства последовательностей» является образ «ландшафта приспособленности» (fitness landscape). Каждой точке пространства последовательностей соответствует та или иная величина «приспособленности», или эффективности выполнения белком своей функции. Принято представлять области высокой приспособленности в виде возвышенностей, низкой — в виде долин или ям (рис. 1). При этом вышеупомянутые «поля» приобретают вид горных плато, «тропинки» становятся хребтами, а «запретные зоны» — долинами и пропастями.
2. Вселенная древних белков продолжает расширяться
Фундаментальная статья, посвященная изучению общих законов эволюционного движения белков по ландшафтам приспособленности, опубликована 19 мая (2010 года) на сайте журнала Nature. Авторы статьи, Инна Поволоцкая и Федор Кондрашов, в настоящее время работают в Центре геномной регуляции (Centre for Genomic Regulation) в Барселоне.
Материалом для исследования послужили аминокислотные последовательности 572 древних белков, которые имелись уже у последнего общего предка всего живого (LUCA) и были унаследованы его потомками, а также нуклеотидные последовательности соответствующих генов из геномов 836 бактерий и архей. Эти белки называют «древними», потому что после >3,5 млрд лет независимой эволюции в телах разнообразных потомков LUCA они до сих пор сохранили некоторое сходство своих аминокислотных последовательностей (вплоть до поразительного 40-процентного сходства рибосомных белков L14 у бактерий и архей) и продолжают выполнять те же функции, что и у LUCA.
Первый вопрос, который поставили перед собой авторы, состоит в том, достигли уже эти белки максимального расхождения в пространстве последовательностей или их расхождение (накопление отличий друг от друга и от исходного предкового белка) всё еще продолжается? Сохранение высокого сходства после 3,5 млрд лет независимой эволюции, казалось бы, говорит о том, что возможности изменения этих белков весьма ограничены. Можно предположить, что области в пространстве последовательностей, соответствующие их функциям, сравнительно невелики, и предел расхождения давно достигнут. Но возможно и другое объяснение. Эти области могут быть велики, но труднопроходимы. Например, они могут представлять собой лабиринт из немногочисленных узких хребтов, разделенных пропастями, и поэтому на «освоение» всего потенциально доступного пространства требуется больше времени, чем прошло с момента появления LUCA.
Авторы проводят интересную аналогию между эволюцией белков и расширением Вселенной. Эдвин Хаббл обнаружил, что галактики удаляются друг от друга, причем расстояние между галактиками положительно коррелирует со скоростью их разлетания. Экстраполируя эту тенденцию в прошлое, Хаббл пришел к выводу, что разлетание должно было начаться из одной точки. Эта идея легла в основу современной теории Большого взрыва. Нечто подобное происходит и с белками, расходящимися от общего предка — исходного белка с данной функцией, который был закодирован в геноме LUCA (рис. 2).
Чтобы выяснить, закончилось ли уже расширение «вселенной древних белков» или оно продолжается до сих пор, авторы применили оригинальные методы анализа белковых последовательностей. Рис. 3 иллюстрирует общий принцип, лежащий в основе примененной методики. Использовались четверки гомологичных (происходящих от одного предка) и выполняющих одну функцию белков. В качестве первых двух белков для каждой четверки брались близкородственные молекулы, обладающие высоким сходством аминокислотных последовательностей. Эти два белка назывались «сестринскими», и именно их эволюция анализировалась в рамках данной четверки.
Третий белок отличался от сестринских белков сильнее, чем они друг от друга. Он выполнял роль «внешней группы», позволяя понять, какие аминокислотные замены произошли в первом, а какие во втором сестринском белке. Например, если у внешнего белка в данной позиции стоит аминокислота K (лизин), и такая же аминокислота стоит здесь у первого из двух сестринских белков, а у второго в этом месте находится другая аминокислота (например, Y — тирозин), то считалось, что K в данной позиции — это «предковое», исходное состояние, а у второго сестринского белка произошла замена K на Y.
К этим трем белкам добавлялся четвертый, еще более далекий от сестринских, чем третий. Если у четвертого белка в данной позиции стоит аминокислота K (как на рис. 3), то делался вывод, что у второго сестринского белка произошло эволюционное изменение, увеличившее дистанцию между белками 2 и 4: белки разошлись. Если бы у четвертого белка здесь стояла аминокислота Y, то был бы сделан вывод, что в результате изменения, затронувшего белок 2, белки 2 и 4 сблизились.
Это очень хитрая методика, позволяющая обойти некоторые подводные камни, характерные для биоинформационных исследований. Она позволяет оценивать направленность эволюции (схождение или расхождение) у пары весьма удаленных друг от друга белков (например, таких как белки 1 и 4 или 2 и 4), несмотря на то, что достоверная реконструкция предковых состояний аминокислотных позиций возможна только при сравнении достаточно близких белков (например, таких как 1, 2 и 3).
В простейшем варианте расчетов учитывалось только совпадение / несовпадение аминокислот. В более сложном варианте учитывалась еще и степень сходства между разными аминокислотами, что позволило вовлечь в анализ гораздо большее число аминокислотных позиций (впрочем, на конечный результат это не повлияло).
В общей сложности было обработано 13,6 миллионов таких четверок. Для каждой четверки определялось число замен, ведущих к сближению последовательностей (Nt) и к их расхождению (Na). По соотношению этих величин (Nt/Na) можно понять общую тенденцию: расходятся ли белки, сближаются или балансируют вокруг некого постоянного уровня сходства последовательностей.
Оказалось, что даже у наиболее удаленных друг от друга гомологичных белков тенденция к расхождению значительно преобладает над тенденцией к сближению (Nt/Na < 1). Следовательно, «вселенная древних белков» продолжает расширяться, и пределы областей, соответствующих их функциям, за 3,5 млрд лет так и не были достигнуты. Эволюция этих белков была крайне медленной. Что же ее сдерживало? Решению этой проблемы посвящена вторая часть статьи, приводящая на память другой рассказ Борхеса — «Сад расходящихся тропок».
3. Лабиринт расходящихся тропок
Обычного «отрицательного отбора», отсеивающего неудачные (снижающие приспособленность) аминокислотные замены, явно недостаточно для того, чтобы объяснить медленную эволюцию древних белков. Предположение о том, что каждая аминокислота, стоящая в данной позиции, влияет на приспособленность одинаковым образом независимо от «контекста» (то есть от того, какие аминокислоты стоят в других позициях в том же белке или в других белках, взаимодействующих с ним), соответствует представлению о легко проходимом ландшафте приспособленности (см. рис. 4c). Но со времен LUCA в каждом синонимичном сайте (так называют те нуклеотиды в цепи ДНК, изменение которых не влияет на структуру кодируемого белка) произошло уже свыше 100 замен. Синонимичные нуклеотидные замены — это пример движения по ровным горизонтальным поверхностям ландшафта приспособленности. Из этого следует, что в случае хорошей проходимости ландшафта изучаемые белки давным-давно должны были освоить всю потенциально доступную им область в пространстве последовательностей, и тогда мы не наблюдали бы их продолжающегося расхождения.
Резко уменьшить проходимость ландшафта приспособленности — превратить его в лабиринт узких тропок или горных хребтов — может так называемый эпистаз. В данном случае под эпистазом понимается зависимость влияния аминокислотной позиции на общую приспособленность белка от других аминокислотных позиций в том же белке или от свойств других эволюционирующих молекул (например, других белков или функциональных РНК), взаимодействующих с данным белком. Наличие эпистаза предполагает, что многие аминокислотные замены являются допустимыми только в определенных контекстах. Если же контекст иной, данная замена будет снижать приспособленность, и отбор ее отбракует. Если эпистаз широко распространен, белок может добраться до многих потенциально достижимых пунктов в пространстве последовательностей только долгим обходным путем (рис. 4b).
Для проверки гипотезы о важной роли эпистаза в эволюции белков авторы придумали хитроумный тест, основанный на сопоставлении темпов накопления «сближающих» и «разводящих» мутаций с дистанциями между белками. Темпы накопления мутаций в данном случае вычислялись другим, более изощренным методом, чем в первой части статьи (что диктовалось требованиями поставленной задачи). В частности, использовалось не абсолютное число замен, а доля реализованных замен данного типа из общего числа потенциально возможных для данной последовательности. Основная идея состояла в том, что гипотезы о наличии и отсутствии эпистаза дают противоположные предсказания о том, как должна меняться частота закрепления сближающих и разводящих мутаций по мере снижения сходства между белками.
Если влияние эпистаза невелико, то у двух близких белков темп накопления разводящих мутаций должен быть высоким, а по мере расхождения последовательностей он должен снижаться. Темп накопления сближающих мутаций при этом должен оставаться примерно постоянным.
Если же эпистаз оказывает сильное влияние на эволюцию белков, всё должно быть наоборот: разводящие мутации должны накапливаться с примерно постоянной скоростью, а темп накопления сближающих мутаций в начале должен быть высоким, а по мере расхождения белков он должен снижаться.
Проведенные расчеты убедительно подтвердили гипотезу о сильном влиянии эпистаза на эволюцию белков. Оказалось, что темп накопления разводящих мутаций практически не зависит от дистанции между белками. В каждый момент времени лишь около 2% аминокислотных позиций могут быть изменены без снижения приспособленности, хотя в долгосрочной перспективе более 90% позиций могут измениться — но к этим изменениям нужно идти долгими обходными путями по лабиринту узких «горных хребтов» ландшафта приспособленности. У близких, недавно разошедшихся белков темп накопления сближающих мутаций (отнесенный к числу потенциально возможных мутаций такого типа) очень высок, потому что у близких белков аминокислотный «контекст» для каждой позиции является сходным. Поэтому та аминокислота, которая недавно стояла в данной позиции, с большой вероятностью может «вернуться» на свое место, и это не снизит приспособленность. Напротив, у сильно отличающихся белков данная позиция уже находится в сильно отличающихся контекстах, и поэтому «возвращение» аминокислоты, которая стояла здесь у далекого предка, с большой вероятностью снизит приспособленность, и мутация будет отсеяна.
В открытом авторами снижении вероятности сближающих мутаций по мере расхождения белков ярко проявляется правило необратимости эволюции: чем сильнее разошлись белки, тем меньше у них шансов снова стать похожими.
Таким образом, ландшафт приспособленности белков отличается повышенной «складчатостью», он похож на труднопроходимый лабиринт узких горных хребтов, передвигаться по которому эволюционирующие белки могут лишь очень медленно. Один из выводов работы состоит в том, что крупномасштабные модели эволюции белков обязательно должны учитывать влияние эпистаза. Кроме того, эту работу можно рассматривать как новый весьма сильный аргумент в пользу единства происхождения всего живого. Подобно тому как разбегающиеся галактики указывают на существовавший в прошлом единый центр, из которого все объекты во Вселенной начали свое движение, так и продолжающееся по сей день «разбегание» древних белков недвусмысленно указывает на их происхождение от единого предка.
Источник: Inna S. Povolotskaya, Fyodor A. Kondrashov. Sequence space and the ongoing expansion of the protein universe // Nature. Advance online publication 19 May 2010. Doi:10.1038/nature09105.
Автор: Александр Марков. Источник: http://elementy.ru
Дополнительно:
Бактериальные жгутики неуменьшаемо сложны.
Александр Марков: "Введение в эволюцию человека"
Александр Марков: "Происхождение жизни"
Александр Марков: "Сомневаться в теории эволюции - абсурд."
Оценили 13 человек
23 кармы