Шрифт:
Интервал:
Закладка:
Если проделать это с вариантом гена RPGRIP1, который был обнаружен у Уотсона, результаты будут неоднозначными: у человекообразных обезьян и мартышек в этой позиции стоит аланин, так же как у большинства грызунов, верблюдов, коров и косаток; аланин в этом месте есть у слонов и летучих мышей, у трубкозубов и броненосцев. Однако у белок и капских златокротов в этой позиции другие аминокислоты, и так же обстоит дело с утками и волнистыми попугайчиками. А у крота-звездорыла там именно серин! Это один из признаков, объединяющих его с Джеймсом Уотсоном, помимо того что оба они теплокровные существа с волосами и четырьмя конечностями. Впрочем, среди кротов не так много нобелевских лауреатов. В целом эволюционные данные не слишком убедительно свидетельствуют о вреде данной мутации для белков (даже если бы у нас не было популяционных данных).
Иногда наблюдается удивительный консерватизм эволюции. Например, у ребенка с тяжелой формой эпилепсии мы обнаружили аминокислотную замену в белке, в котором эта аминокислота (пролин) сохранялась у всех организмов, чьи геномы были прочитаны, вплоть до устриц и амеб. Если природа полагает, что именно здесь нужен пролин, и сопротивляется заменам на протяжении сотен миллионов лет, прошедших с того времени, как мы отделились от амеб и устриц, — то велика вероятность, что на этом месте действительно очень нужен именно пролин.
Однако вернемся к вашей компьютерной программе. Не обязательно ограничиваться химией или эволюционным консерватизмом; можно совместить оба принципа. Или можно набрать алгоритмов из чужих программ и объединить их, чтобы создать собственный новый алгоритм[64]. Теперь откалибруйте вашу новоиспеченную программу на огромном множестве вариантов, которые, как вы уже знаете, вредны или безвредны, сопоставьте ее с другим множеством, придумайте ей умное название и опубликуйте статью, где будет объясняться…
Где будет объясняться, что в результате всех этих усилий у вас получилось чуть-чуть лучше, чем у предшественников. Конечно, вы сформулируете это несколько иначе, но, похоже, это лучшее, на что вы можете надеяться. А «чуть-чуть лучше» на практике означает, что особого прогресса нет. Возьмите любую из 20 с лишним подобных программ, которые уже существуют, и вы обнаружите у каждого человека сотни, если не тысячи вариантов, которые программа считает патологическими. Безвредные варианты отлавливаются достаточно успешно, но, если учесть, что при обнаружении любой мутации в геноме отдельного человека принято прежде всего предполагать, что она безвредна, это достижение не так уж велико.
Безуспешность всех попыток написать программу, которая бы справилась с этой задачей, объясняется самой природой задачи. Кажется, будто все, что нужно сделать, — это разложить объекты классификации в две емкости: в огромный промышленный контейнер поместить все доброкачественные и слабовредные вариации, а в маленькую золотую рюмочку — одну-две мутации, ради которых, собственно, анализ и проводился. У нас будет 39 999 безобидных яблок и один апельсин. Проблема в том, что, приступая к задаче яблочно-апельсиновой сортировки, вы имеете дело вовсе не с кучей, состоящей только из 40 000 плодов. Аминокислотные замены могут причинять вред самыми разнообразными способами.
Например, химические свойства двух разных аминокислот настолько различаются, что замена мешает нормальной укладке белка. Или получившийся белок оказывается нестабильным и разрушается, прежде чем сможет выполнять полезную функцию. Или белок синтезируется, но нужные дополнительные модификации, например присоединение сахаров, неосуществимы. Или с белком все в порядке, но он не может попасть в нужное место внутри клетки. Или дело вообще не в аминокислотной замене: мутация в ДНК нарушает процесс сплайсинга, и это уже совсем другая проблема. Возможности этим не исчерпываются, но суть вы уже уловили. Компьютерные программы героически пытаются рассортировать фрукты, но им подсовывают смесь фруктов, булыжников, теннисных мячей и морских ежей. Неудивительно, что они плохо с этим справляются.
Итак, у нас есть популяционные данные — полезные, но не лишенные ограничений[65]. У нас есть прогностические программы — почти что бесполезные. У нас есть сведения из медицинских публикаций, которые, как мы убедились, изобилуют ошибками. Пока что все это не слишком вдохновляет, не так ли?
К счастью, имеется множество других данных, которые иногда бывают полезными. Один из важнейших источников информации — лечащий врач пациента. На самом элементарном уровне, если вы проводите анализ с целью выяснить причины тяжелой формы эпилепсии и находите вариант гена, который всегда связывали только с кожными заболеваниями, вы едва ли получите ответ на ваш вопрос. Необходимо также знать, как передается этот вариант в семье, затрагивает ли он жизненно важные участки белковой цепочки, и иногда можно провести тестирование, чтобы непосредственно определить функциональность мутантного варианта белка.
Сложив вместе всю доступную информацию, вполне возможно получить достоверный ответ[66]. Классификация генетических вариантов — одна из самых трудных и увлекательных составляющих моей профессии, хотя нелегко находить золотую середину в ситуации, когда стоит выбор — жизнь или смерть. Как в большинстве лабораторий мира, обнаруженные варианты у нас делят на пять категорий. Доброкачественные (класс 1) — это такие варианты, которые можно вполне уверенно считать безвредными, зачастую из-за их слишком широкой распространенности (как уотсоновский вариант гена RPGRIP1). Скорее доброкачественные (класс 2) — варианты, безвредность которых достаточно вероятна, но недостаточно доказана, чтобы отнести их в группу доброкачественных. Патогенные (класс 5) — те случаи, когда мы практически уверены, что вариант вызывает проблемы. Скорее патогенные (класс 4) — есть достаточно оснований считать, что врач может опираться на данные о них, принимая медицинские решения, но недостаточно оснований, чтобы отнести их к классу 5. Применительно к «скорее доброкачественным» и «скорее патогенным» вариантам есть ненулевая (условно до 10 %) вероятность, что истину следует искать в противоположном направлении.
Промежуточное место занимают «варианты неопределенной значимости» (ВНЗ) (класс 3). Это следует понимать буквально: мы не можем сказать, патогенны они или нет. Данная категория описывается как генетическая серая зона — не в том смысле, что в ней скучно, а в смысле размытости границ черного и белого. Если недостаточно данных, чтобы отнести вариант к «скорее патогенным» или «скорее доброкачественным», или же данные противоречивы, то перед вами ВНЗ. Самые важные — и часто трудные — решения приходится принимать именно в связи с вариантами, попадающими в пограничную зону между ВНЗ и «скорее патогенными». Ошибетесь в ту или иную сторону — пострадают люди. Это и есть неизвестные, из-за которых я не сплю ночами. Вдруг я ошибся, определив вариант как «скорее патогенный», и пациент с лечащим врачом выбрали неверный курс? А вдруг я ошибся, определив его как «вариант неопределенной значимости», и тем самым пациент и врач лишились альтернатив, которые могли бы помочь?