Лучшее казино в мире

Будут ли карты гаплотипов полезны для поиска генов?

С момента появления в литературе идея исследования неравновесия сцепления (LD) на основе карт гаплотипов была предметом споров. Эти запросы включают в себя степень существования блоков гаплотипов, обоснованность фундаментальных концепций, таких как горячая точка рекомбинации, и применение этой идеи в форме проекта HapMap. В этой статье мы рассматриваем соответствующую литературу, чтобы оценить потенциальную важность карт гаплотипов для психиатрической генетики. Сначала мы более подробно рассмотрим природу блоков гаплотипов, а затем рассмотрим влияние определений блоков и методологических факторов, таких как плотность однонуклеотидного полиморфизма и размер выборки, на результаты исследований блоков гаплотипов. Проведя различие между двумя типами исследований LD на основе карт гаплотипов,мы обсуждаем важность горячей точки рекомбинации и природу мутаций болезни, влияющих на сложные признаки. В заключительном разделе мы суммируем наши основные выводы и комментируем полезность карт гаплотипов для поиска генов.

Вступление

В геноме человека может быть более 5 миллионов однонуклеотидных полиморфизмов (SNP) с частотой минорных аллелей выше 0,1. 1 Это изобилие дает генетикам возможность сканировать хромосомные области на наличие болезненных мутаций в очень мелком масштабе. К счастью, из-за неравновесия по сцеплению (LD), неслучайной ассоциации между аллелями в разных локусах, нет необходимости вводить все эти SNP. 2 В регионах с высоким LD аллельная зависимость дает избыточность среди маркеров и увеличивает шансы установить приблизительное местоположение мутации болезни без ее фактического типирования. Вопрос о том, насколько далеко такие полезные уровни LD распространяются в геноме человека, был предметом значительного внимания. 3,4,5

В последнее время произошел переход от количественного определения пригодных для использования уровней LD к изучениюструктурыLD. Хотя мы должны упомянуть, что они подвергались критике, полезно сначала представить некоторые подробности выводы первоначальных исследований. Джеффриси др.6 изучили 216 т.п.н. комплекса MHC II в сперме 50 британских мужчин. Их анализ показал существование протяженных доменов сильных LD, прерванных лоскутными участками разрушения LD. Подавляющее большинство (94%) рекомбинаций в области MHC приходится на области с низкой LD. Это указывает на то, что горячие точки рекомбинации вызвали блочный паттерн LD, наблюдаемый авторами. Продолжая развивать концепцию LD-блока, Дейлии др.7 проанализировали 103 общих (частота минорного аллеля>5%) SNP в области 500 т.п.н. на хромосоме 5q31, которые были генотипированы на 129 трио родитель-потомство для выявления мутаций болезни Крона. 8 Они обнаружили, что регион можно разделить на блоки размером примерно 10–100 кб. В каждом блоке 2–4 гаплотипа составляли 80–95% гаплотипической вариации в их выборке. Высокая парная LD обычно вызвана низким разнообразием гаплотипов, а низкая LD обычно вызвана высоким разнообразием гаплотипов. Таким образом, их результаты согласуются с результатами, полученными Jeffreyset al.6 Наконец, Патили др.9 изучали 20 биологических гаплотипов из этнически разнообразной выборки. Всего было типизировано 24 047 общих SNP (минорный аллель встречался более одного раза), охватывающих 32,4 МБ хромосомы 21. Их анализ также выявил протяженные блоки с очень низким разнообразием гаплотипов. Средняя наблюдаемая длина блока составляла 7,8 кб, но самый длинный блок растягивался более чем на 115 кб и содержал 114 SNP.

Идеализированное представление структуры, которая возникла в результате этих исследований, показано на рисунке 1. Эта структура предлагает эффективный подход к исследованиям LD. То есть мутации болезни будут внесены в популяцию по определенному гаплотипу. Знание структуры гаплотипов, таким образом, позволило бы ввести минимальное количество SNP, которое потребовалось бы для однозначной маркировки всех гаплотипов для поиска мутаций болезни. 10 Использование так называемых SNP-тегов гаплотипов (htSNP) имеет два преимущества. Во-первых, это будет гарантировать, что большая часть гаплотипической вариации будет захвачена. Для случайного выбора равномерно распределенных SNP это может быть не так. Некоторые гаплотипы могут быть помечены несколькими SNP, а другие могут вообще не быть помечены. Во-вторых, поскольку htSNP являются подмножеством всех SNP,это уменьшило бы объем генотипирования, необходимого для сканирования хромосомных областей. Например, Джонсони др.10 обнаружили, что 2–5 htSNPs могут быть использованы для определения шести или менее общих гаплотипов (частота>5%) в девяти изучаемых ими генах. Это снизило количество генотипов со 122 до 34 SNP (27%). Патили др.9 сообщили, что только 4563 из 24 047 исходных SNP были необходимы (19%) для захвата 80% гаплотипической вариации.

Гаплотипы - это аллельная конфигурация множества маркеров, присутствующих на одной хромосоме данного человека. Рекомбинация разрушает гаплотипы, когда они передаются следующему поколению. Следовательно, размер предковых гаплотипов будет значительно уменьшен через многие поколения. Однако, если рекомбинации более вероятны в определенных местах или горячих точках рекомбинации, возникнет блочная структура. Если внутри блока не было или было мало рекомбинаций, вариации внутри блоков будут в основном вызваны мутациями. В результате можно будет охарактеризовать большой процент субъектов с помощью нескольких общих гаплотипов, которые являются частями предковых гаплотипов, которые сохраняются в общей популяции.Болезненные мутации возникают или были внесены в популяцию на фоне определенного гаплотипа. Вместо тестирования всех SNP достаточно протестировать только те SNP или комбинации SNP, которые однозначно маркируют один из общих гаплотипов. Например, только четыре из шести SNP необходимы для фиксации гаплотипической вариации во втором блоке, потому что ни один из гаплотипов не имеет одинаковых аллельных паттернов на этих htSNP.

Если горячие точки рекомбинации являются преобладающими механизмами, лежащими в основе блоков гаплотипов, можно ожидать, что границы блоков будут находиться в сходных хромосомных положениях в разных популяциях. Габриэльи др.11 охарактеризованы паттерны гаплотипов в 51 аутосомной области, охватывающей 13 мегабаз генома человека в образцах из Африки, Европы и Азии. В соответствии с вышеупомянутыми исследованиями они обнаружили, что в каждом блоке 3-5 общих гаплотипов захватывают около 90% всех хромосом в каждой популяции. Кроме того, границы, а также гаплотипический состав блоков оказались похожими в разных популяциях. Этот вывод, по-видимому, согласуется с наблюдениями, согласно которым, по крайней мере, в европейских выборках, паттерны LD коррелируют. 12 Эти результаты предполагают возможность построения общих карт гаплотипов для генома человека. 11 Такие ранее существовавшие знания об общих гаплотипах и SNP, которые их маркируют, станут огромным ресурсом для будущих исследований LD.Национальный институт исследования генома человека (NHGRI) запустил проект HapMap (http://www.genome.gov/page.cfm?pageID=10001688) - инициативу по созданию карт гаплотипов всего генома человека. Предполагается, что на завершение проекта уйдет 3 года, а его стоимость составит 100 миллионов долларов.

Однако ряд предположений и утверждений исследований LD на основе карт гаплотипов были оспорены другими членами этой области. Это включает в себя фундаментальные вопросы, такие как то, являются ли горячие точки рекомбинации основным механизмом для блочного паттерна LD. 13 Степень, в которой блоки гаплотипов существуют в геноме, - еще один спорный вопрос. Филлипси др.14 изучали блочную структуру хромосомы 19, используя 80 хромосом-основателей из 10 родословных CEPH. Их средний интервал между маркерами составлял один маркер на 5,5 т.п.н., при среднем расстоянии один маркер на 17,65 т.п. Они сообщили, что только одна треть хромосомы 19 была заключена в блоки гаплотипов. Наконец, критике подверглось применение карт гаплотипов в форме проекта HapMap. 15,16 Это связано с такими вопросами, как то, могут ли одни и те же карты гаплотипов использоваться в разных популяциях и можно ли ожидать, что мутации для сложных заболеваний будут локализованы на космополитических гаплотипах.

В этой статье мы рассматриваем соответствующую литературу, чтобы оценить потенциальную важность карт гаплотипов для психиатрической генетики. Сначала мы более подробно рассмотрим природу блоков гаплотипов, а затем рассмотрим влияние определений блоков и методологических факторов, таких как плотность SNP и размер выборки, на результаты исследований блоков гаплотипов. Проведя различие между двумя типами исследований LD на основе карт гаплотипов, мы обсудим важность горячей точки рекомбинации и природу болезненных мутаций, влияющих на сложные признаки. В заключительном разделе мы суммируем наши основные выводы и комментируем полезность карт гаплотипов для психиатрической генетики.

Блоки как модель для ЛД

Маловероятно, что блоки представляют собой дискретные образования с четкими границами. Во-первых, горячая «точка» рекомбинации представляет собой область, а не границу одной пары оснований. Джеффриси др.6 подсчитали рекомбинации в мужских сперматозоидах и обнаружили, что горячие точки, в которых происходит подавляющее большинство кроссоверов, охватывают в среднем область 1-2 т.п. Темплтони др.Полностью секвенировали 9,7 т.п.н. гена липопротеинлипазы человека у 71 человека. Их статистический анализ также показал, что события рекомбинации были сконцентрированы в области 1,9 т.п.н.

Вторая причина, по которой границы блоков не могут быть четкими, состоит в том, что размеры консервативных предковых гаплотипов в данной области могут различаться (Рис. 2). Если происходит рекомбинация, только один рекомбинантный гаплотип будет передан следующему поколению. Следовательно, для четкого разделения региона на блоки потребуются множественные рекомбинации. Однако количество поколений, прошедших с момента «основания» человеческих популяций, конечно. Следовательно, могло просто не хватить времени для того, чтобы все эти рекомбинации произошли и разбили каждую область в геноме на отдельные блоки. Это может усугубляться тем фактом, что скорость рекомбинации варьируется в зависимости от горячих точек, поэтому некоторые из них будут иметь низкую интенсивность. 6 Более того, широкий спектр демографических и популяционных генетических явлений может противодействовать эффектам рекомбинации.Примерами являются то, что рекомбинантные гаплотипы могут быть потеряны из-за случайного дрейфа 13, и что благоприятная или вредная мутация может уменьшить гаплотипическую изменчивость в результате естественного отбора. 17

Красные и синие пунктирные линии на (а) указывают на консервативные предковые гаплотипы. (б) предполагает, что произошло событие рекомбинации между двумя гаплотипами, показанными в (а). Это приводит к одному новому рекомбинантному гаплотипу. В зависимости от частоты рекомбинантного гаплотипа, а также критериев, используемых для определения блока, можно сделать вывод, что есть один или два блока, где граница будет совпадать с местом рекомбинации.

Представление о том, что область может состоять из гаплотипов разного размера, где одни являются рекомбинантами, а другие, не подтверждается эмпирическими данными. Дэйлии др. [7] наблюдали, что 38% хромосом могут быть отнесены к одному из четырех предковых гаплотипов дальнего действия, которые охватывают всю их область размером 500 т.п.н., тем самым вызывая LD между блоками. Дальняя дальность действия за пределами блоков также наблюдалась в области HLA. 18 Детальный анализ гена липопротеинлипазы человека также выявил смесь рекомбинантных и нерекомбинантных гаплотипов. 19,20

В серии статей Мортон и Коллинзи др.21,22,23 разработал метод построения LD-карт. Карты LD концептуально аналогичны картам связи. Расстояние до карты невелико в регионах с большим LD и велико в регионах с низким LD. Авторы применили свой метод к нескольким наборам данных. Когда они построили физическое расстояние между соседними маркерами в зависимости от расстояния на карте LD (единицы LD), казалось, что вырисовывается общая закономерность (рис. 3). Графики имеют тенденцию показывать плато, где расстояние карты LD близко к нулю. Это, по-видимому, указывает на области с низким разнообразием гаплотипов или блокировку LD. Эти плато чередуются с шагами в LD, которые подразумевают большое расстояние карты LD или низкое LD. Графики, однако, не являются идеальными ступенчатыми функциями, где внутри блока единицы LD равны нулю, а между блоками происходит резкое изменение на следующее плато. Вместо,на плато может наблюдаться небольшое увеличение единиц LD, а переход к следующему плато может быть более постепенным. Поэтому блоки следует рассматривать не как отдельные объекты с четкими границами, а как модели, которые пытаются уловить основные особенности шаблона LD. Для представления данных с помощью модели может не быть единственного и объективного способа сделать это. Следовательно, могут быть возможны множественные представления для блочной структуры в данной области генома, где в зависимости от цели одни могут быть более подходящими, чем другие. Кроме того, модели могут плохо подходить, и для некоторых регионов блоки могут не отражать основные черты структуры LD.но как модели, которые пытаются уловить основные черты паттерна LD. Для представления данных с помощью модели может не быть единственного и объективного способа сделать это. Следовательно, могут быть возможны множественные представления для блочной структуры в данной области генома, где в зависимости от цели одни могут быть более подходящими, чем другие. Кроме того, модели могут плохо соответствовать, а для некоторых регионов блоки могут не отражать основные характеристики структуры LD.но как модели, которые пытаются уловить основные черты паттерна LD. Для представления данных с помощью модели может не быть единственного и объективного способа сделать это. Следовательно, могут быть возможны множественные представления для блочной структуры в данной области генома, где в зависимости от цели одни могут быть более подходящими, чем другие. Кроме того, модели могут плохо подходить, и для некоторых регионов блоки могут не отражать основные черты структуры LD.модели могут плохо соответствовать друг другу, а для некоторых регионов блоки могут не отражать основные черты структуры LD.модели могут плохо соответствовать, а для некоторых регионов блоки могут не отражать основные черты структуры LD.

Типичный график LD-карты для хромосомной области. Физическое расстояние между маркерами в kb ( осьx) отложено в зависимости от расстояния карты LD ( осьy). На графике показаны плато, на которых расстояние карты LD было близко к нулю, чередующиеся с шагами в LD. Делается попытка наложить на этот граф дискретную блочную структуру. Хотя в целом модель достаточно хорошо соответствует данным, очевидно, что существуют области, в которых возможно несколько представлений. Например, область размером примерно от 80 до 180 kb может рассматриваться как один большой блок или два меньших блока, разделенных горячей точкой рекомбинации (серый блок).

Поиск блоков

Блоки были определены с использованием пар SNP или гаплотипов с несколькими SNP. Из-за отсутствия общепринятых критериев применение этих двух методов значительно различается. Также известно, что такие особенности исследования, как плотность SNP и размер выборки, влияют на размер блока, процент хромосомы, которая может быть заключена в блок, и разнообразие гаплотипов. Эта изменчивость затрудняет сравнение результатов исследований блока гаплотипов. В этом разделе мы обсуждаем различные методы, помогающие интерпретировать эмпирические результаты.

Рекомбинации являются важным определяющим фактором для LD в регионе и, следовательно, играют (неявную) роль во многих определениях блоков. Присутствие рекомбинации может, например, использоваться для обозначения границы 24 блока или отсутствия рекомбинации, выведенной из низкого разнообразия гаплотипов. 7 С точки зрения картирования заболевания, рекомбинации имеют тенденцию распространять мутацию болезни на другие гаплотипы (рис. 4). Наличие мутации болезни на нескольких гаплотипах затрудняет ее выявление в ассоциативном исследовании. Это связано с тем, что различные мутации болезней, несущие гаплотипы, могут нейтрализовать сигналы друг друга. 25 Поэтому важно понимать, что использование либеральныхиКонсервативные критерии для определения блоков не просто влияют на точность и степень, в которой LD вдоль генома может быть зафиксирована в блочной модели. Это также влияет на способность выявлять болезненные мутации в исследовании LD на основе карт гаплотипов, поскольку эти критерии влияют на вероятность того, что болезненная мутация присутствует на нескольких гаплотипах.

Показаны три консервативных предковых гаплотипа (1-3) плюс 2 рекомбинанта (4-5). Как правило, для определения структуры блока набирается только набор SNP (блоков). Несмотря на разные предковые гаплотипы и множественные рекомбинации, анализ трех SNP может предложить блок с идеальной LD между всеми маркерами и только двумя (2,1,1 и 1,2,2) гаплотипами. Звездочкой обозначена мутация заболевания, которая первоначально появилась в красном гаплотипе. Из-за рекомбинации мутация заболевания теперь также присутствует в двух рекомбинантах. В этом случае мутация заболевания будет присутствовать в обеих группах наблюдаемых (2,1,1 и 1,2,2) гаплотипов.

Плотность SNP и размер выборки

Ожидается, что один SNP с частотой аллеля больше 0,1 встречается на каждые 0,6 т.п.н. последовательности ДНК. 1 Во всех исследованиях гаплотипических блоков типизирован только набор таких общих SNP. При выборе SNP невозможно выделить все гаплотипы, и исторические события рекомбинации будут пропущены (рисунок 4). 24,26 Вани др.24 с помощью моделирования обнаружил, что грубая карта может завышать размер блока. В зависимости от скорости локальной рекомбинации авторы рекомендовали плотность от примерно 2 SNP на килобайт до 1 SNP на 2 килобайта для восстановления истинной блочной структуры. Следует отметить, что их имитационная модель не учитывала влияния горячих точек и, как известно, предсказывает значительно меньшую LD, чем обычно наблюдается в человеческих популяциях. Следовательно, он может переоценить требуемую плотность. Размер выборки - еще один фактор, влияющий на структуру производного блока. Из-за ошибки выборки общие или рекомбинантные гаплотипы могут отсутствовать в исследуемой выборке. В результате размер блока может увеличиться. Моделирование предполагает, что в исследованиях гаплотипических блоков следует использовать размер выборки не менее 100 хромосом.24 Это число хорошо согласуется с простыми вычислениями, основанными на биномиальном распределении, показывающем, что выборка в общей сложности 100 гаплотипов обеспечивает высокую вероятность (>0,95) обнаружения гаплотипов с частотой около 5%.

Определения блока гаплотипа

Исследования, в которых использовались пары SNP, обычно определяют блок как непрерывный набор SNP, в котором средний LD больше некоторого заранее определенного порога. Наиболее часто используемые меры LD - этоD ′∣ 27 иr2. Обе меры варьируются от нуля до единицы, где ноль означает отсутствие LD, а один полный LD. Для многих целейr2, квадрат коэффициента корреляции для таблицы 2 × 2 двух аллелей двух SNP может быть лучшим показателем. 2,28 Хотя он иногда использовался для этой цели, он, возможно, не лучший показатель LD для определения блоков гаплотипов. Внутри блока, как определено в самом строгом смысле (например, блоки 1 и 2 на Рисунке 1), не было рекомбинации, и неповторяющаяся прямая мутация является единственным источником вариации. В этом случае для каждой пары SNP в блоке будут наблюдаться только три из четырех возможных комбинаций аллелей: 1,1; 2,1; и либо 1,2, либо 2,2. Однакоr2 может быть только одним, если наблюдаются две из четырех комбинаций, подразумевая, что эти два аллеля всегда встречаются в одном и том же гаплотипе. Мы смоделировали 80 гаплотипов с четырьмя маркерами, используя процесс слияния 29,30,31 с кодом, загруженным с домашней страницы лаборатории Хадсона. Все четыре маркера имели частоты минорных аллелей более 0,1 и были равномерно распределены с плотностью примерно SNP / 5 т.п.н. Результаты показали, что 10% наблюдаемых значенийr2 было меньше 0,04, а около 30% было меньше 0,12. Таким образом, даже для области, которая является блоком в соответствии с самым строгим определением,r2 часто будет близко к нулю, что делает эту меру менее подходящей для изучения блоков гаплотипов.

D'может быть лучшей мерой LD для определения блоков гаплотипов. Его знак зависит от произвольного кодирования аллелей, поэтому принято указывать абсолютное значение ∣D ′∣. Это абсолютное значение будет равно единице, если наблюдаются три из четырех аллельных комбинаций. 10,28 Например, ∣D ′∣ является одним для всех комбинаций SNP в блоках 1 и 2 на Рисунке 1. Чтобы найти блоки, определенные в самом строгом смысле, все попарные значения ∣D ′∣ должны быть одними во всем регионе. По сути, это также критерий, используемый Wanget al., 24, которые определили блок как область, ограниченную событиями рекомбинации, как обнаружено по присутствию всех четырех аллельных комбинаций. Более низкие пороги увеличили бы уже существующую систематическую ошибку необнаруживаемых рекомбинаций (Рисунок 4). Например, допуская случайные рекомбинации в наших коалесцентных симуляциях, мы смоделировали 5000 образцов 80 гаплотипов с одной или несколькимиобнаруживаемымирекомбинациями среди четырех SNP. Мы обнаружили, что с пороговыми значениями 0,7, 0,8 и 0,9 в 40, 21 и 7% этих выборок ∣D 'все равно будет означать, что четыре маркера сформировали блок.

Существуют факторы, которые могут привести к тому, чтоD ′∣ будет меньше единицы, даже если блочная модель верна. Один из примеров - ошибки генотипирования. Допуская ошибку генотипирования в 2% в нашем моделировании, порог 1 идентифицирует только 55% истинных блоков. В этом случае снижение порога до 0,9 восстановит более 97% истинных блоков. Можно также утверждать, что определения блоков должны допускать повторяющуюся мутацию, обратную мутацию и, возможно, преобразование генов. Все эти факторы уменьшили бы ∣D ′∣. Например, есть некоторые свидетельства наличия горячих точек мутаций 32 и, с учетом двух повторяющихся мутаций, все ∣D ′∣ меры для блока 3 на Рисунке 1 упали до нуля. Воздействие этих факторов зависит от их распространенности. Они будут иметь более ограниченное влияние на LD в регионе, чем рекомбинация, потому что LD останется одним для незатронутых SNP. Однако эти факторы оправдывают использование более низкого порога, чтобы избежать пропуска истинных блоков, хотя мало что известно о том, какой порог даст разумный баланс между обнаружением истинных и ложных блоков.

Второй метод генерирует блоки с использованием гаплотипов с несколькими SNP. Определения обычно основаны на концепции «хромосомного покрытия» с блоком гаплотипа, содержащим минимальное количество SNP, которые составляют большинство общих гаплотипов, 9,33 или пониженный уровень разнообразия гаплотипов. 7 Связь с определениями на основе LD заключается в том, что низкое разнообразие гаплотипов связано с увеличением LD. Природа определений хромосомного покрытия несколько более практична. Это прямо указано в терминах конечной цели минимизации генотипирования при максимальном увеличении информационного содержания и не содержит явных ссылок на структуру LD. Следует отметить, что можно получить htSNP, используя только попарные меры LD без какой-либо ссылки на структуру LD, 34 так что это не принципиальное различие.Мало что известно о том, как методы гаплотипов с несколькими SNP сравниваются с методами определения блоков на основе LD. Интуитивно можно было ожидать, что методы, основанные на гаплотипах, будут менее чувствительны к факторам, снижающим LD. но согласуются с блочной моделью. Например, ошибки генотипирования часто приводят к редким гаплотипам, но поскольку эти процедуры сосредоточены на общих гаплотипах, они будут иметь меньшее влияние на анализ. Кроме того, нет необходимости учитывать повторяющиеся мутации, поскольку аллельная конфигурация гаплотипов не влияет напрямую на порог. Потенциальные недостатки заключаются в том, что гаплотипы необходимо оценивать статистически или получать биологическим путем, что не всегда возможно и может быть источником ошибок. Кроме того, поскольку аллельная конфигурация не рассматривается, рекомбинации могут быть пропущены.

Есть ли блоки?

Для изучения блоков гаплотипов, по-видимому, необходимы плотные карты SNP (1 SNP / 1-2 kb) с выборкой не менее 100 хромосом, где, возможно, используются гаплотипы с несколькими SNP вместо парных измерений LD. Более того, консервативные определения блоков могут быть предпочтительны для получения хороших оценок размера и местоположения блоков и предотвращения случая, когда (необнаруживаемые) рекомбинации внутри блока распространяют мутацию болезни на несколько гаплотипов. Этим критериям удовлетворяют немногие из текущих исследований блоков гаплотипов. В исследованиях с более крупными размерами выборки обычно использовались более грубые карты, такие как SNP / 5, 7 SNP / 7,8 кб, 11 и среднее значение SNP / 17 кб или медианное значение SNP / 5,5 кб. 14 В других исследованиях использовалась плотная карта, но в небольшой выборке, такой как SNP / 1,3 kb с 20 хромосомами. 9

Трудно проследить значение всех использованных операционных определений. Наше моделирование показало, что изменение критериев может серьезно повлиять на результаты. Мы обнаружили, что в дополнение к уже существующему смещению, вызванному необнаруживаемыми рекомбинациями, использование ∣D ′∣ значения меньше 1 будут еще больше завышать количество / размер блоков. Поэтому возможно, что исследования, в которых использовались более либеральные критерии, переоценили размеры блоков и недооценили разнообразие гаплотипов. Действительно, исследования, в которых были секвенированы целые гены в более крупных выборках, как правило, показывают более грубую картину. 32,35 В других случаях относительно грубая карта в сочетании с дополнительными требованиями, такими как то, что блок должен содержать по крайней мере три SNP 14, может недооценивать степень, в которой меньшие блоки описывают LD в определенных хромосомных областях. Отсутствие убедительных крупномасштабных эмпирических исследований и ограниченное понимание последствий различных операционных определений очень затрудняют получение твердых выводов о том, насколько LD в геноме человека может быть описана с помощью блочной модели.

Хотя неясно, насколько широко они распространены, кажется справедливым сказать, что блоки гаплотипов действительно существуют. Джонсони др. [10] типизировали 122 SNP в общей сложности 135 т.п.н. ДНК из девяти генов. Их выборка состояла минимум из 384 особей для каждого гена. Их результаты показали ограниченное разнообразие гаплотипов изучаемых генов. Можно найти и другие примеры, когда исследования отдельных генов предполагают блочную структуру в большой выборке с относительно плотной картой SNP. 36

Общиеисамодельные карты

Возможны два типа применения карт гаплотипов. Наибольшее внимание привлек тот тип, который предусмотрен в проекте HapMap. Здесь цель состоит в том, чтобы построить общую карту, которая будет использоваться другими исследователями, которым нужно будет только ввести htSNP в свои образцы, чтобы проверить, присутствуют ли болезненные мутации в одном из общих гаплотипов. Предположение этого подхода, которое вызвало много критики, состоит в том, что расположение и гаплотипический состав блоков сходны в разных популяциях. 15,16 Это обобщение находит некоторое эмпирическое подтверждение. Хотя размеры блоков были разными в Европе и Азии посравнению сОдно исследование показало, что на африканских и афроамериканских выборках границы блоков у этих этнических групп, как правило, совпадают. 11 Другое исследование на мультиэтнической выборке обнаружило доказательства космополитических гаплотипов. 9 В этих исследованиях рассматривались общие SNP (частота минорных аллелей>10–20%) и общие гаплотипы (частота минорных гаплотипов>5–10%). Поскольку высокочастотные полиморфизмы и гаплотипы SNP старше, они с большей вероятностью будут общими для разных популяций. 2 Таким образом, эти исследования предполагают, что для общих гаплотипов, которые, возможно, были установлены до недавней диверсификации человечества, можно применить одну и ту же карту к разным популяциям.

В то же время широкий спектр демографических и популяционно-генетических явлений может влиять на LD и структуру гаплотипов. Примерами являются разбивка LD как функция количества поколений, генетического дрейфа, роста популяции, примеси или миграции, узких мест в популяции и естественного отбора. Таким образом, относительно низкая LD в африканских популяциях может частично быть результатом древности этих геномов 37 и более высокой LD в популяциях, таких как Финляндия, из-за того факта, что небольшая популяция основателей около 100 поколений назад, возможно, увеличилась до 5,1 миллиона человек сегодня. . 38 Другой эмпирический пример связан с естественным отбором. Исследование области MHC класса II показало, что гаплотипы в значительной степени были популяционно-специфичными. 39 Интересно, что блочная структура LD была удивительно постоянной в трех исследованных популяциях.Это предполагает, что горячие точки рекомбинации, о которых известно, что они расположены в этой области, должны были быть достаточно активными, чтобы формировать паттерны LD за относительно короткий период. В целом, моделирование предполагает, что даже если горячие точки рекомбинации являются правилом, паттерны LD все еще могут показывать различия между популяциями и между геномными регионами. 40

Вместо того, чтобы полагаться на существующую карту, второй тип приложения состоит из первого набора SNP с высокой плотностью в небольшом подмножестве выборки, чтобы создать карту гаплотипа для рассматриваемой выборки. На следующем этапе htSNP, полученные на первом этапе, будут типизированы в остальной выборке для проверки ассоциаций маркер болезни. Это обеспечит улавливание большей части гаплотипических вариаций в выборке и минимизацию генотипирования в основной части выборки. Хотя это, вероятно, еще больше повысит способность обнаруживать мутации болезней, для этого подхода не представляется важным предположение, что LD формируется горячими точками. Чжани др.41 смоделировал гаплотипы, предполагая, что рекомбинации были распределены случайным образом, и изучил статистическую мощность для обнаружения болезненной мутации для трех типов данных: (1) все SNP и соответствующие гаплотипы, (2) SNP меток и соответствующие гаплотипы, и (3) такое же количество случайно выбранных SNP, как количество htSNP и соответствующих гаплотипов. Их результаты показали, что усилия по генотипированию могут быть значительно уменьшены с помощью htSNP без большой потери мощности. Они обнаружили, например, что, когда идентифицированные htSNP составляли примерно 14% от всех SNP, мощность снижалась примерно на 9% по сравнению с потерей мощности примерно на 21% при использовании того же количества случайно выбранных SNP. Таким образом, эти результаты предполагают, что даже в самом консервативном сценарии, когда рекомбинация является случайной,большая часть гаплотипической вариации в выборке может быть зафиксирована только с помощью части SNP, и что использование этих htSNP даст большую мощность по сравнению со случайным выбором того же количества маркеров в регионе.

Также важно отметить, что для этих самостоятельно построенных карт проблема обобщения карт гаплотипов по популяциям не имеет значения. Это связано с тем, что карта используется в том же образце, в котором она была получена. Кроме того, эти карты предлагают большую гибкость и могут быть адаптированы к цели исследования. Например, могут быть ситуации, когда карты только с общими картами гаплотипов недостаточно, а маркировка редких гаплотипов важна. 18 Наконец, с помощью самостоятельно построенной карты можно оценить, насколько хорошо модель блока гаплотипа захватывает паттерны LD, и внести коррективы для регионов, где производные модели блоков гаплотипа, по-видимому, плохо подходят.

Два важных фактора успеха

Точка рекомбинации

Горячая точка рекомбинации играет важную роль в дискуссиях о картах гаплотипов по трем причинам. Во-первых, горячие точки рекомбинации создают блочную структуру, которая позволяет генетикам очень эффективно сканировать геном с помощью htSNP. Это не исключает возможности того, что другие силы также могут создавать блочные узоры. Даже если место рекомбинации полностью случайно, из-за генетического дрейфа некоторые рекомбинации исчезнут, что приведет к появлению видимых областей с низкими скоростями рекомбинации. Другие рекомбинации могут появляться много раз, поскольку они наследуются несколькими хромосомами, что приводит к появлению «горячих точек». Такие эффекты генетического дрейфа могут быть значительными. Моделирование Чжани др.13 показали, что в популяции с эффективным размером популяции 10 000 все хромосомы в популяции были потомками менее чем от 100 предковых хромосом в 2000-м поколении. Однако эти авторы также отметили, что такие генерируемые дрейфом блоки были более рваными по сравнению с блоками, которые возникли из горячих точек, предполагая, что подход htSNPs может работать лучше при наличии горячих точек рекомбинации.

Во-вторых, если бы рекомбинации имели бы тенденцию происходить в одних и тех же хромосомных местах, было бы более вероятно наблюдать сходные паттерны блоков в разных популяциях. Хотя это не может гарантировать, что каждый блок будет содержать одни и те же гаплотипы, это, вероятно, поможет приложениям, таким как проект HapMap, который направлен на построение общих карт гаплотипов для использования в разных популяциях. Напротив, если бы генетический дрейф был бы преобладающим механизмом для блоков гаплотипов, можно было бы ожидать большего разнообразия в положениях блоков и составе гаплотипов в разных популяциях.

В-третьих, из-за таких факторов, как выбор SNP и ошибка выборки, не все рекомбинации будут обнаружены. Если горячие точки рекомбинации вызвали структуру блоков, то необнаруженные рекомбинации будут располагаться рядом с обнаруженными рекомбинациями, а не в области между обнаруженными рекомбинациями. Таким образом, было бы более вероятно, что границы блоков оценены правильно и что в наблюдаемом блоке нет необнаруженных рекомбинаций. Это важно для исследований LD. Необнаруженные рекомбинации внутри блока могли распространить мутацию заболевания на другие гаплотипы, что затрудняло их обнаружение в исследовании ассоциации, потому что разные мутации, несущие гаплотипы, имели тенденцию нейтрализовать сигналы друг друга (рис. 4). 25

Нет никаких сомнений в том, что горячие точки рекомбинации существуют. Они были достаточно хорошо задокументированы у дрожжей 42, и исследования на мышах также подтверждают их существование. 43 Несколько исследований на людях также наблюдали горячие точки или выводили их из статистического анализа гаплотипов. 6,32,44 Однако неясно, насколько распространены горячие точки рекомбинации в геноме человека. 45 У дрожжей есть признаки того, что кластеры основных генов находятся в областях с низкой рекомбинацией. 46 Это обнадеживающее открытие, потому что оно предполагает, что блочная модель может быть подходящей для кодирующих областей. Однако степень, в которой это относится к человеческому геному и генам, влияющим на сложные заболевания, неизвестна. Кроме того, неясно, влияют ли регуляторные вариации, важные для воздействия на уровень, паттерн или экспрессию гена,это могут быть десятки или даже сотни тысяч оснований от единицы транскрипции, 47 также более вероятно, что они находятся в областях с низкой рекомбинацией.

Варианты распространенныхиредких заболеваний

Характер патологических мутаций важен для успеха исследований LD на основе гаплотипических карт. Одна идея состоит в том, что генетический риск распространенных заболеваний часто связан с предрасполагающими к заболеванию аллелями с относительно высокой частотой. То есть будет один или несколько преобладающих аллелей болезни в каждом из основных локусов основного заболевания. 48,49,50 Существует несколько примеров генов, для которых применима гипотеза об общем заболевании / распространенном варианте (CD / CV). 51,52 Популяционные методы открытия генов, такие как ассоциативные исследования, выявляют общие варианты. Поэтому неясно, переполнена ли категория общих вариантов, потому что их легче найти с помощью текущих методов.

Альтернативная гипотеза состоит в том, что сложные заболевания вызываются несколькими вариантами гена. 53 С теоретической точки зрения, мутации и конверсия генов не являются незначительными на протяжении большого числа поколений. Следовательно, аллельная гетерогенность вероятна для большой популяции. Существует множество примеров генов с множеством мутаций. 54 Теоретические прогнозы отчасти, но не полностью, обнадеживают. Если текущие прогнозы частоты мутаций для сложных локусов болезни находятся в правильном диапазоне, то, похоже, не ожидается, что локусы с промежуточными частотами будут иметь разрушительный уровень аллельной гетерогенности. Но уровни неоднородности во многих случаях все еще могут быть проблематичными. 55

Будут ли карты гаплотипов полезны для поиска генов?

Хотя маловероятно, что блоки являются дискретными объектами с четко очерченными границами, есть свидетельства того, что LD в частях генома можно моделировать посредством блочной структуры. Определения блоков, а также особенности исследования, такие как плотность SNP и размер выборки, важны для получения точных оценок размера блока, процента хромосомы, которая может быть заключена в блоке, и разнообразия гаплотипов. Из-за отсутствия убедительных эмпирических исследований менее ясно, какая часть паттернов LD в геноме может быть описана блочной моделью.

Горячие точки рекомбинации могут (1) создать четкую блочную структуру, (2) повысить вероятность того, что аналогичные карты гаплотипов будут наблюдаться в разных популяциях, и (3) снизить вероятность того, что мутация заболевания будет иметь место на нескольких гаплотипах в пределах блока. . В общем, знание количества LD и общих гаплотипов в каждом регионе может оказаться полезным для ассоциативных исследований. Однако горячие точки рекомбинации будут важны для успеха структуры блока гаплотипов. Это связано с тем, что генерируемые дрейфом блоки кажутся более рваными по сравнению с блоками, возникшими из горячих точек 13, что позволяет предположить, что подход htSNP может работать лучше при наличии горячих точек рекомбинации. Кроме того, если паттерны блоков и общие гаплотипы не похожи в разных популяциях,это будет проблемой для таких приложений, как проект HapMap, целью которого является построение общих карт гаплотипов для использования в нескольких популяциях. Наконец, ассоциативные исследования будут менее успешными, если мутация болезни присутствует на нескольких гаплотипах в пределах блока, потому что различные мутации болезни, несущие гаплотипы, будут иметь тенденцию нейтрализовать сигналы друг друга. 25 Хотя нет никаких сомнений в том, что они существуют, необходимы дополнительные исследования, чтобы определить, насколько широко распространены горячие точки рекомбинации в геноме.25 Хотя нет никаких сомнений в том, что они существуют, необходимы дополнительные исследования, чтобы определить, насколько широко распространены горячие точки рекомбинации в геноме.25 Хотя нет никаких сомнений в том, что они существуют, необходимы дополнительные исследования, чтобы определить, насколько широко распространены горячие точки рекомбинации в геноме.

Ответ на вопрос, будут ли карты гаплотипов полезны в поиске генов психических заболеваний, частично зависит от типа приложения, которое вы имеете в виду. В самой скромной форме исследователь набирал бы SNP с высокой плотностью в небольшом подмножестве выборки, чтобы создать карту гаплотипов для своей собственной выборки. На следующем этапе htSNP, полученные на первом этапе, будут типизированы в остальной выборке для проверки ассоциаций маркер болезни. По сравнению с типированием равномерно расположенных маркеров этот подход обеспечит улавливание большей части гаплотипических вариаций в выборке и минимизацию генотипирования в основной части выборки. Повышение способности обнаруживать мутации болезней будет зависеть от того, насколько LD в регионе согласуется с блочной моделью, но даже в регионах, где рекомбинации распределены случайным образом,можно ожидать увеличения мощности. 41 Гибкость - еще одно важное преимущество карт, создаваемых самостоятельно. Например, маркировка только общих гаплотипов не всегда может быть достаточной, 18 и это может быть полезно для дальнейшего изучения регионов, где структура LD плохо захватывается производной блочной моделью. Возможное ограничение заключается в том, что статистический механизм для построения карт гаплотипов и проведения исследований ассоциаций на основе карт гаплотипов все еще находится в стадии разработки. Например, неясно, каковы оптимальные критерии для определения блока.Возможное ограничение заключается в том, что статистический механизм для построения карт гаплотипов и проведения исследований ассоциаций на основе карт гаплотипов все еще находится в стадии разработки. Например, неясно, каковы оптимальные критерии для определения блока.Возможное ограничение заключается в том, что статистический механизм для построения карт гаплотипов и проведения исследований ассоциаций на основе карт гаплотипов все еще находится в стадии разработки. Например, неясно, каковы оптимальные критерии для определения блока.

Такой подход с картированием гаплотипов лучше всего подходит для выявления вариантов заболевания, которые являются общими в исследуемой выборке. Заболевания, вызванные мутациями, возникшими на фоне нескольких гаплотипов, представляют собой проблему. Однако это не является конкретным ограничением исследований LD на основе карт гаплотипов. Это серьезно затруднит любое исследование ассоциаций, поэтому может потребоваться другой подход. 54 С точки зрения дизайна эксперимента, в этих случаях может быть более целесообразным секвенировать большое количество людей в поисках всех низкочастотных вариантов. 55

Использование существующей карты позволяет избежать усилий и затрат, связанных с построением карты гаплотипов. В какой степени могут быть достигнуты вышеупомянутые преимущества самостоятельно построенных карт, будет зависеть от ряда дополнительных предположений. Наиболее важным из них является возможность обобщения карт гаплотипов по популяциям, для чего есть некоторые эмпирические данные. 11 Широкое распространение горячих точек рекомбинации сделало бы это более вероятным. Однако, даже если горячие точки рекомбинации являются правилом, паттерны LD все еще могут показывать различия между популяциями и между геномными регионами. 40 Кажется разумным предположить, что использование существующих карт гаплотипов будет в основном отражать гаплотипы, которые, вероятно, были созданы до недавней диверсификации человечества.Это может еще больше ограничить набор болезненных мутаций, которые могут быть обнаружены в ассоциативном исследовании, только теми, которые являются старыми и возникли в результате одного из космополитических гаплотипов. Проект HapMap создает карты гаплотипов для популяций из США, Восточной Азии и Западной Африки, а также стремится изучить необходимость построения карт для других популяций. Предположительно, это снизит зависимость карты от космополитических гаплотипов. Однако степень сходства гаплотипических вариаций между различными субпопуляциями внутри каждой из этих популяций, таких как Западная Африка, неизвестна. Однако по сравнению с картами, построенными самостоятельно, успех проекта HapMap будет зависеть от более строгой формы гипотезы CD / CV.Проект HapMap создает карты гаплотипов для популяций из США, Восточной Азии и Западной Африки, а также стремится изучить необходимость построения карт для других популяций. Предположительно, это снизит зависимость карты от космополитических гаплотипов. Однако степень сходства гаплотипических вариаций между различными субпопуляциями внутри каждой из этих популяций, таких как Западная Африка, неизвестна. Однако по сравнению с картами, построенными самостоятельно, успех проекта HapMap будет зависеть от более строгой формы гипотезы CD / CV.Проект HapMap создает карты гаплотипов для популяций из США, Восточной Азии и Западной Африки, а также стремится изучить необходимость построения карт для других популяций. Предположительно, это снизит зависимость карты от космополитических гаплотипов. Однако степень сходства гаплотипических вариаций между различными субпопуляциями внутри каждой из этих популяций, таких как Западная Африка, неизвестна. Однако по сравнению с картами, построенными самостоятельно, успех проекта HapMap будет зависеть от более строгой формы гипотезы CD / CV.Однако степень сходства гаплотипических вариаций между различными субпопуляциями внутри каждой из этих популяций, таких как Западная Африка, неизвестна. Однако по сравнению с картами, построенными самостоятельно, успех проекта HapMap будет зависеть от более строгой формы гипотезы CD / CV.Однако степень сходства гаплотипических вариаций между различными субпопуляциями внутри каждой из этих популяций, таких как Западная Африка, неизвестна. Однако по сравнению с картами, построенными самостоятельно, успех проекта HapMap будет зависеть от более строгой формы гипотезы CD / CV.

Одна из целей публичного проекта HapMap - сделать возможным сканирование ассоциаций всего генома. Построение карты гаплотипа для всего генома в настоящее время невозможно для отдельного исследователя, и поэтому проект HapMap действительно делает эти исследования более жизнеспособными. Следует понимать, что для регистрации гаплотипической вариации в каждом блоке требуется несколько SNP. Кроме того, значительный процент генома состоит из относительно небольших «одноэлементных» блоков (например,

Расчеты показывают, что ни размер выборки, ни контроль ложных открытий не будут представлять серьезных проблем для сканирования всего генома, но, судя по современным стандартам, объем генотипирования все равно будет очень большим. 57 Использование многоэтапного дизайна, при котором в остальной части выборки набираются только маркеры, которые достигают определенного уровня значимости в небольшой подвыборке, обычно приводит к значительному (50–75%) сокращению генотипирования. 58 Однако даже если исследование будет полностью спланировано таким образом, чтобы минимизировать генотипирование с помощью многоэтапного дизайна, для сканирования 500 000 маркеров все равно потребуется 50–100 миллионов генотипов. Проблема заключается в первом этапе таких сканирований, потому что тогда нужно набрать все 50 000 SNP. Это подчеркивает необходимость эффективных технологий генотипирования, таких как объединение ДНК,59 или использование стандартных фишек (набора) затем можно было бы использовать для первого выбора маркеров.

Блоки гаплотипов явно представляют собой шаг вперед в оптимизации ассоциативных исследований. Он обратил внимание на потенциальную важность паттернов LD и привел к разработке методов максимизации генетической информации с минимальным количеством SNP. Даже если бы блоки гаплотипов, созданные рекомбинационными горячими точками,неБудучи широко распространенным по всему геному, использование самостоятельно построенных карт гаплотипов, вероятно, повысит эффективность ассоциативных исследований. Общедоступные карты гаплотипов имеют потенциал для дальнейших исследований LD, направленных на выявление более космополитических мутаций болезней. Это будет очень важно для расширения наших генетических знаний о сложных заболеваниях. Однако они сделают это только при соблюдении более строгих условий. В настоящее время отсутствуют эмпирические данные, необходимые для оценки этих условий, поэтому потребуется время, чтобы понять, в какой степени этот потенциал общедоступных карт гаплотипов может быть реализован.

использованная литература

  1. 1

Кругляк Л, Никерсон Д.А. Вариация - это изюминка жизни.Nat Genet2001;27: 234–236.

Выбор пола: как зачать девочку или мальчика

Если вы уже ожидаете, вы, вероятно, захотите узнать, есть ли у вас мальчик или девочка, но если вы еще не забеременели, вам может быть интересно, как зачать девочку или как зачать мальчика, до того, как вы забеременеете.

Как получить максимальное пособие по социальному обеспечению

Максимальный размер пособия по социальному обеспечению в 2020 году составляет 3790 долларов в месяц или 45 480 долларов в год.

Руководство по ставкам для начинающих

Работа букмекера или букмекера состоит в том, чтобы принимать и выплачивать ставки от игроков, ставки обычно делаются на спортивные события, но букмекеры также принимают ставки на скачки и игры в казино.

Где снимался Джеймс Бонд?

Сообщение C Clayton. Опубликовано в Джеймс Бонд, Новости, Места телепередач / кино, 5 декабря 2018 г.

Казино Beckley Wv | Бесплатный бонус для игровых автоматов онлайн 2020

Давайте подробнее рассмотрим новое онлайн-казино Caesars Casino в Пенсильвании и то, что вы можете ожидать в качестве клиента, 8610 Uster.

Больше новостей
3-14

Ставки Amahasala - Lemondogs

7-58

Ставки на матч G2 Esports - CeX

1-44

Сделать ставку rEAK - Аргентина

2-35

Ставки на игру Ronin Horde - ex-Titan

2-56

Ставки на киберспорт Desperados - Rekt eSports

6-11

Ставка Infuzed - TBA

Больше ставок