Логика случая. О природе и происхождении биологической эволюции. Евгений Кунин
начала, с нуля (история этой идеи рассказывается в гл. 2). Как и другие представления геномики, эволюция путем генной дупликации имеет строгие количественные подтверждения – большинство генов в геноме принадлежат семействам паралогов (за исключением очень небольших геномов, таких как у микоплазмы и других паразитических бактерий; Jordan et al., 2001). Более детальная реконструкция эволюции показывает, что дупликация проявляется, с различной интенсивностью, на всех этапах эволюции, таким образом, любой геном – это набор дупликаций самого различного возраста. Выбирая некоторую эволюционную линию, допустим, животные – хордовые – млекопитающие – приматы – и т. д., мы можем обнаружить в геноме (например, в нашем) все соответствующие классы дупликаций: дупликации, специфичные для животных, дупликации, специфичные для хордовых, специфичные для приматов и т. д. (Lespinet et al., 2002).
Распределение численности паралогичных семейств в любом геноме – еще одна универсальная статистическая закономерность, обнаруженная сравнительной геномикой (рис. 4–7). Распределения для всех геномов приблизительно описываются степенной функцией с отрицательным показателем степени: y = ах-y (где у – положительное число, а – коэффициент; Koonin et al., 2002; Luscombe et al., 2002). Эти распределения, имеющие в двойных логарифмических координатах вид прямых линий, показывают, что большинство семейств по численности малы (включая семейства геномов с преобладанием синглетонных сайтов), и только немногие семейства включают в себя большое число паралогов.
Рис. 4–7. Распределение размера семейств паралогичных генов для нескольких сильно отличающихся геномов. Показаны распределения для растения резуховидки Таля (A. thaliana), человека (H. sapiens), для пекарских дрожжей (S. cereviseae), для сенной палочки (B. subtilis) и для бактерии Thermotoga maritima. Использованы данные из базы данных EggNog (Jensen et al., 2008)
Возникновение универсальной степенной закономерности распределения численности паралогичных семейств может быть описано с высокой точностью простой математической моделью эволюционного процесса (рис. 4–8). Эта модель основана на математической теории так называемых процессов рождения и смерти (один из видов марковских процессов) и для случая эволюции путем генной дупликации чаще называется моделью рождения, смерти и инновации (Karev et al., 2002). В рамках этой модели рождение – это такая генная дупликация, при которой появляется новый член паралогичного семейства, смерть – утрата гена, а инновация – это рождение нового семейства либо путем такой дупликации, которая вызывает быструю эволюции и тем самым как бы стирает «память» старого семейства, либо путем горизонтального переноса генов[40]. Наиболее интересный результат этого моделирования состоит в том, что эта модель эволюции путем генной дупликации воспроизводит рассмотренные нами распределения численности семейств паралогичных генов только при соблюдении вполне определенных условий: частоты рождения и смерти гена должны быть примерно равными и зависеть
40