Лучшее казино в мире

Одновременная идентификация нескольких путей развития рака

Отличить соматические мутации, вызывающие рак ( драйверные мутации), от случайных, пассажирских мутаций - ключевая задача в геномике рака. Драйверные мутации обычно нацелены на клеточные сигнальные и регуляторные пути, состоящие из множества генов. Эта неоднородность затрудняет идентификацию водительских мутаций по их повторению в выборках, поскольку в разных образцах наблюдаются разные комбинации мутаций в водительских путях. Мы представляем алгоритм Multi-Dendrix для одновременной идентификации нескольких путей драйвера de novo.в данных соматических мутаций из когорты образцов рака. Алгоритм основан на двух комбинаторных свойствах мутаций в пути драйвера: высокий охват и взаимная исключительность. Мы выводим целочисленную линейную программу, которая находит набор мутаций, проявляющих эти свойства. Мы применяем Multi-Dendrix для соматических мутаций из образцов глиобластомы, рака груди и рака легких. Multi-Dendrix идентифицирует наборы мутаций в генах, которые перекрываются с известными путями, включая Rb, p53, PI (3) K и пути клеточного цикла, а также новые наборы взаимоисключающих мутаций, включая мутации в нескольких факторах транскрипции или других вовлеченных генах. в регуляции транскрипции. Эти наборы обнаруживаются непосредственно из данных о мутациях без каких-либо предварительных знаний.путей или генных взаимодействий. Мы показываем, что Multi-Dendrix превосходит другие алгоритмы для определения комбинаций мутаций, а также на порядки быстрее на данных в масштабе генома. Программное обеспечение доступно по адресу: http://compbio.cs.brown.edu/software.

Резюме автора

Рак - это заболевание, в основе которого лежит накопление соматических мутаций в течение жизни человека. Снижение стоимости секвенирования генома теперь позволяет измерять соматические мутации в сотнях раковых геномов. Ключевой задачей является отличить водительские мутации, вызывающие рак, от случайного пассажира.мутации. Эта проблема усугубляется наблюдением, что разные комбинации водительских мутаций наблюдаются у разных пациентов с одним и тем же типом рака. Одна из причин такой неоднородности заключается в том, что мутации драйверов нацелены на сигнальные и регуляторные пути, которые имеют несколько точек отказа. Мы представляем алгоритм Multi-Dendrix, чтобы найти эти пути исключительно на основе моделей взаимной исключительности между мутациями в когорте пациентов. В отличие от более ранних подходов, мы одновременно находим несколько путей, что является важной функцией для анализа геномов рака, где обычно нарушается несколько путей. Мы применяем наш алгоритм к данным о мутациях сотен пациентов с глиобластомой, раком груди и аденокарциномой легких. Мы идентифицируем наборы взаимодействующих генов, которые перекрывают известные пути,и наборы генов, содержащие специфичные для подтипа мутации. Эти результаты показывают, что множественные пути рака могут быть идентифицированы непосредственно на основе паттернов в данных о мутациях, и обеспечивают подход к анализу постоянно растущих наборов данных о мутациях рака.

Цитирование:Leiserson MDM, Blokh D, Sharan R, Raphael BJ (2013) Одновременная идентификация множественных движущих путей в раке. PLoS Comput Biol 9 (5): e1003054. https://doi.org/10.1371/journal.pcbi.1003054

Редактор:Нико Беренвинкель, ETH Zurich, Швейцария

Поступила:29 августа 2012 г .;Принята в печать:26 марта 2013 г .;Опубликовано:23 мая 2013 г.

Авторское право:© 2013 Leiserson et al. Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.

Финансирование:эта работа поддержана грантом NSF IIS-1016648. BJR поддерживается премией Career Award в Scientific Interface от фонда Burroughs Wellcome Fund, исследовательской стипендией Альфреда П. Слоана и наградой NSF CAREER Award (CCF-1053753). РС поддержан исследовательским грантом Израильского научного фонда (грант № 241/11). MDML поддерживался NSF GRFP DGE 0228243. Спонсоры не играли никакой роли в дизайне исследования, сборе и анализе данных, решении опубликовать или подготовке рукописи.

Конкурирующие интересы:авторы заявили, что никаких конкурирующих интересов не существует.

Вступление

Рак - это болезнь, отчасти вызванная соматическими мутациями, которые накапливаются в течение жизни человека. Снижение стоимости секвенирования генома теперь позволяет измерять эти соматические мутации в большом количестве раковых геномов. Такие проекты, как Атлас генома рака (TCGA) и Международный консорциум генома рака (ICGC), в настоящее время решают эту задачу на сотнях образцов из десятков типов рака. Ключевой проблемой при интерпретации этих данных является различение мутаций функционального драйвера, важных для развития рака, от случайного пассажира.мутации, не имеющие последствий для рака. Конечным фактором, определяющим, является ли мутация водителем или пассажиром, является проверка ее биологической функции. Однако, поскольку способность обнаруживать соматические мутации в настоящее время намного превышает возможность экспериментального подтверждения их функции, вычислительные подходы, которые предсказывают мутации драйверов, являются неотложным приоритетом. Один из подходов заключается в прямом прогнозировании функционального воздействия соматических мутаций с использованием дополнительных биологических знаний об эволюционной консервации, структуре белка и т. Д., И был введен ряд методов, реализующих этот подход (см. [1] - [4]). Эти методы успешно предсказывают влияние некоторых мутаций, но, как правило, не объединяют информацию о различных типах мутаций (одиночный нуклеотид, инделки, аберрации с большим числом копий и т. Д.); Кроме того,эти методы менее успешны для менее консервативных / изученных белков.

Учитывая снижение затрат на секвенирование ДНК, стандартный подход к различению мутаций водителя и пассажира заключается в выявлении повторяющихся мутаций.мутации, наблюдаемая частота которых в большой группе онкологических больных намного выше, чем ожидалось [5], [6]. Почти все статьи по секвенированию генома рака, в том числе из TCGA [7] - [10] и других проектов [5], [11], [12], содержат список значительно мутировавших генов. Тем не менее, драйверные мутации сильно различаются между онкологическими больными - даже с одним и тем же (под) типом рака - и эта неоднородность значительно снижает статистическую мощность для обнаружения драйверных мутаций с помощью тестов на рецидив. Одно из основных биологических объяснений этой мутационной гетерогенности состоит в том, что мутации-драйверы нацелены не только на отдельные геномные локусы (например, нуклеотиды или гены), но также на целевые группы генов в клеточных сигнальных и регуляторных путях. Следовательно,разные больные раком могут иметь мутации в разных участниках пути, важного для развития рака. Таким образом, помимо тестирования отдельных локусов или генов на повторяющуюся мутацию в когорте пациентов, исследователи также проверяют, подвергаются ли группы генов повторяющимся мутациям. Поскольку исчерпывающее тестирование всех групп генов невозможно без чрезмерно больших размеров выборки (из-за необходимой коррекции множественной проверки гипотез), современные подходы сосредоточены на группах генов, определенных на основе предшествующих биологических знаний, таких как известные пути (например, из KEGG [13 ]) или функциональных групп (например, из GO [14]), и были введены методы поиска обогащения в таких заранее определенных группах генов (например, [15] - [17]). В последнее время,также были разработаны методы, которые идентифицируют повторно мутировавшие подсети в сетях белок-белкового взаимодействия, такие как NetBox [18], MeMO [19], HotNet [20] и EnrichNet [21].

Знания о взаимодействиях генов и белков у людей остаются неполными, и большинство существующих баз данных о путях и сетей взаимодействия не точно представляют пути и взаимодействия, которые происходят в конкретной раковой клетке. Таким образом, ограничение внимания только теми комбинациями мутаций, которые записаны в этих источниках данных, может ограничить возможность новых биологических открытий. Таким образом, желательны алгоритмы, которые не делают этого ограничения, но также избегают проблем проверки множественных гипотез, связанных с исчерпывающим перечислением. Недавно были введены алгоритмы RME [22] и De novo Driver Exclusivity (Dendrix) [23] для обнаружения путей драйвера.использование комбинаторных ограничений, полученных из биологических знаний о том, как мутации-драйверы появляются в путях [24], [25]. В частности, каждый больной раком содержит относительно небольшое количество мутаций-драйверов, и эти мутации нарушают множественные клеточные пути. Таким образом, каждый путь драйвера будет содержать приблизительно одну мутацию драйвера на пациента. Это приводит к паттерну взаимной исключительности между мутациями в разных генах пути. Кроме того, важный путь-драйвер должен быть мутирован у многих пациентов или иметь высокий охват мутациями. Таким образом, пути-драйверы соответствуют наборам генов, которые мутировали у многих пациентов, но чьи мутации являются взаимоисключающими, или примерно так. Подчеркнем, чтопути драйверов, демонстрирующие взаимоисключающие модели и высокий охват, как правило, меньше по размеру и более целенаправленны.чем большинство путей, описанных в литературе и базах данных путей. Последние обычно содержат множество генов и выполняют множество различных функций; например, путь «клеточного цикла» в KEGG содержит 143 гена. Хорошо известно, что сопутствующие (т. Е. Не исключительные) мутации наблюдаются в этих более крупных многофункциональных биологических путях [25]. Алгоритмы RME и Dendrix используют разные подходы для поиска наборов генов с высоким охватом и взаимной исключительностью: RME строит наборы генов из попарных оценок исключительности, в то время как Dendrix вычисляет единую оценку для взаимной исключительности набора генов и находит набор наивысших баллов. Вышеупомянутый алгоритм MeMO [19] также учитывает взаимную исключительность между мутациями, но только для пар генов, которые зарегистрировали взаимодействия в сети взаимодействия белок-белок. Таким образом,MeMO не пытается идентифицировать пути водителяde novo и может определять подсети только в существующих сетях взаимодействия. Хотя многие из самых сильных сигналов о взаимной исключительности возникают между генами с известными взаимодействиями, ниже мы приводим примеры из данных рака о взаимоисключающих мутациях между генами без известных прямых итераций.

Два существующих алгоритма de novo , RME и Dendrix, рассматривают обнаружение только одного пути драйвера из паттерна взаимной исключительности между мутациями. Однако хорошо известно, что при раке обычно требуются мутации в нескольких путях [26]. Есть мало оснований предполагать, что мутации в разных путях будут взаимоисключающими и, напротив, могут иметь значительные закономерности совместного возникновения у разных пациентов. Множественные пути могут быть обнаружены с использованием этих алгоритмов, выполняя алгоритм итеративно, удаляя гены, обнаруженные в каждой предыдущей итерации, и такой подход был использован для Dendrix [23]. Однако такой итеративный подход не гарантирует получение оптимального набора путей.

Здесь мы расширяем алгоритм Дендрикса тремя способами. Во-первых, мы формулируем задачу поиска эксклюзивных или приблизительно исключительных наборов генов с высоким охватом в виде целочисленной линейной программы (ILP). Эта формулировка позволяет нам напрямую находить оптимальные пути драйверов различного размера - в отличие от жадного приближения и алгоритмов Монте-Карло цепи Маркова, используемых в Dendrix. Во-вторых, мы обобщаем ПДОДИ для одновременного поиска нескольких путей драйверов. В-третьих, мы дополняем основной алгоритм дополнительными анализами, включая: изучение наборов генов на предмет специфичных для подтипов мутаций, обобщение стабильности результатов по разному количеству и разному размеру путей и введение большей эксклюзивности наборов генов.

Мы применяем новый алгоритм, называемый Multi-Dendrix, к четырем наборам данных соматических мутаций: данные всего экзома и массив числа копий у 261 пациента с глиобластомой (GBM) из Атласа генома рака (TCGA) [7], полный экзом и число копий. массив данных у 507 пациентов с раком груди (BRCA) из TCGA [8], 601 секвенированный ген у 84 пациентов с мультиформной глиобластомой (GBM) из TCGA [7] и 623 секвенированных гена у 188 пациентов с аденокарциномой легкого [27]. В каждом наборе данных Multi-Dendrix находит биологически интересные группы генов, которые являются в высшей степени эксклюзивными, и каждая группа которых мутирована у многих пациентов. Во всех наборах данных они включают группы генов, которые являются членами известных путей, критических для развития рака, включая: пути передачи сигналов Rb, p53 и RTK / RAS / PI (3) K в GBM и p53, а также передачу сигналов PI (3) K / AKT в рак молочной железы.Multi-Dendrix успешно восстанавливает эти пути исключительно на основе модели взаимной исключительности ибез какой-либо предварительной информации о взаимодействиях между этими генами. Более того, Multi-Dendrix также выявляет мутации, которые являются взаимоисключающими с этими хорошо известными путями и потенциально представляют собой новые взаимодействия или перекрестные помехи между путями. Известные примеры включают взаимную исключительность между: мутациями в сигнальном пути PI (3) K и амплификацией PRDM2 (и PDPN) в глиобластоме; мутации в генах p53, GATA3 и кадгерина при раке груди.

Наконец, мы сравниваем Multi-Dendrix с альтернативным подходом итеративным применением Dendrix [23] или RME [22], двух других алгоритмов, которые ищут взаимоисключающие множества. Мы показываем, что эти итеративные подходы обычно не позволяют найти оптимальный набор путей на смоделированных данных, в то время как Multi-Dendrix находит правильные пути даже при наличии большого количества ложноположительных мутаций. Согласно реальным данным секвенирования рака, группы генов, обнаруженные Multi-Dendrix, включают больше генов с известными биологическими взаимодействиями. Более того, Multi-Dendrix на порядки быстрее, чем эти другие алгоритмы, что позволяет Multi-Dendrix масштабироваться до новейших наборов данных всего экзома на сотнях образцов, которые в значительной степени выходят за рамки возможностей Dendrix и RME.Multi-Dendrix - это новый и практичный подход к поиску нескольких групп взаимоисключающих мутаций, который дополняет другие подходы, которые предсказывают комбинации мутаций драйверов с использованием биологических знаний о путях, сетях взаимодействия, структуре белка или консервативности белковой последовательности.

Результаты

Алгоритм Multi-Dendrix

Алгоритм Multi-Dendrix принимает данные соматических мутаций от больных раком в качестве входных данных и идентифицирует несколько наборов мутаций, каждый из которых удовлетворяет двум свойствам: (1) набор имеет высокий охват со многими пациентами, имеющими мутацию в наборе; (2) набор демонстрирует образец взаимной исключительности, когда у большинства пациентов есть ровно одна мутация в наборе. Здесь мы кратко опишем алгоритм Multi-Dendrix. Более подробная информация представлена ​​в разделе "Методы" ниже.

Мы предполагаем, что соматические мутации были измерены у онкологических больных и что эти мутации подразделяются на разные классы мутаций . Класс мутации - это группа различных типов мутаций в определенном геномном локусе. В простейшем случае класс мутации соответствует группировке всех типов мутаций (однонуклеотидные варианты, аберрации числа копий и т. Д.) В одном гене. Мы представляем данные соматической мутации в виде бинарной матрицы мутаций , где запись определяется следующим образом: (1)

В более общем смысле, класс мутации может быть определен для произвольного геномного локуса, а не только для гена, и может различать разные типы мутаций. Например, класс мутаций можно определить как однонуклеотидные мутации в отдельном остатке в последовательности белка или в домене белка. Или, альтернативно, можно разделить разные типы мутаций в гене (например, однонуклеотидные мутации, делеции или амплификации), создав отдельные классы мутаций для каждого типа мутации в каждом гене. Мы будем использовать это более позднее определение классов мутаций в приведенных ниже результатах. Для простоты изложения мы будем предполагать до конца этого раздела, что каждый класс мутации является геном.

Vandin et al. [23] формулируют задачу поиска набора генов с высоким охватом и высокой эксклюзивностью как проблему подматрицы максимального веса . Здесь вес набора генов - это разница между охватом, количеством пациентов с мутацией в одном из генов и перекрывающимся охватом, количеством пациентов, имеющих мутацию более чем в одном гене в. Vandin et al. [23] представляют алгоритм De novo Driver Exclusibility (Dendrix) [23], который находит набор генов с максимальным весом.

Хотя поиск путей с одним драйвером важен, ожидается, что у большинства больных раком будут мутации-драйверы по нескольким путям. Дендрикс использовал жадный итерационный подход для поиска нескольких наборов генов (описанных ниже), что не гарантирует нахождение оптимальных наборов генов. Идентификация множественных движущих путей требует критерия для оценки возможных наборов генов. Обращаясь к той же биологической мотивации, что и выше, мы ожидаем, что каждый путь содержит приблизительно одну мутацию драйвера. Более того, поскольку каждый путь-драйвер важен для развития рака, мы также ожидаем, что большинство людей содержат мутацию-драйвер в большинстве путей-драйверов. Таким образом, мы ожидаем высокой эксклюзивности генов каждого пути и высокого охвата каждого пути отдельно. Одна из мер, удовлетворяющих этим критериям, - найтинабор наборов генов, сумма весов которых максимальна.

Мы определяем проблему множественных подматриц максимального веса как проблему поиска такого набора максимальных весов. Мы решаем задачу множественной подматрицы максимального веса с помощью целочисленной линейной программы (ILP) и называем полученный алгоритм Multi-Dendrix (см. Методы). Кроме того, формулировка ILP, используемая в Multi-Dendrix, использует модифицированную весовую функцию, где является параметром, который регулирует компромисс между поиском наборов с более высоким охватом (больше пациентов с мутацией) и более высоким перекрытием покрытия (большая неисключительность между мутациями). . Мы используем этот параметр в наборе данных рака груди ниже. Напротив, Dendrix был ограничен.

Смоделированные данные

Мы сравниваем Multi-Dendrix с итеративными версиями Dendrix [23] и RME [22] на данных моделирования мутаций с обоими мутациями-драйверами, имплантированными в пути взаимоисключающим образом, и случайными мутациями-пассажирами. Цель этого моделирования - сравнить Multi-Dendrix с другими алгоритмами, которые идентифицируют взаимоисключающие гены в простых наборах данных, содержащих нескольковзаимоисключающие наборы. Мы генерируем данные о мутациях для пациентов и генов следующим образом. Мы выбираем набор из четырех путей, каждый из которых содержит четыре гена. Покрытие выбираем равномерно из следующих интервалов:,,, соответственно. Размер этого набора данных и различные покрытия путей моделируют то, что наблюдается в реальных данных (см. § Данные соматических мутаций), и согласуется с моделями прогрессирования мутаций, в которых мутации-драйверы накапливаются в путях [28]. Для каждого пути мы выбираем пациентов случайным образом и добавляем мутацию драйвера ровно к одному гену из набора. Таким образом, мутации драйвера в каждом пути исключают друг друга. Затем мы добавляем мутации пассажира путем случайной мутации генов у каждого пациента с вероятностью, вероятность мутации пассажираМы использовали значения, аналогичные нашим оценкам для наборов данных TCGA GBM и рака легкого (в § Данные соматической мутации ниже), которые были и, соответственно. Мы подчеркиваем, что это моделирование не моделирует все сложности соматических мутаций при раке, например, частоту генных и специфичных для пациента мутаций, наличие генов в нескольких путях и т. Д.

Поскольку алгоритмы Dendrix и RME предназначены для поиска отдельных путей, мы сравнили Multi-Dendrix с итеративными версиями этих методов, которые возвращают несколько наборов генов. Для Dendrix мы использовали итеративный подход, описанный в [23]: примените Dendrix, чтобы найти набор генов с наивысшей оценкой, удалите эти гены из набора данных и примените Dendrix к сокращенному набору данных, повторяя эти шаги до тех пор, пока не будет найдено желаемое количество наборов генов. . Мы будем называть этот алгоритм Iter-Dendrix. Таким образом, Iter-Dendrix возвращает набор наборов генов, такой что. Мы реализовали аналогичную итеративную версию RME и будем называть этот алгоритм Iter-RME. Мы сравнили набор наборов генов, найденных каждым алгоритмом, с засаженными путями, вычислив симметричную разницу между и, как описано в разделе «Методы».

В таблице 1 показано сравнение Multi-Dendrix, Iter-Dendrix и Iter-RME с данными моделирования мутаций для различных значений. Обратите внимание, что мы не показываем сравнения с Iter-RME, поскольку Iter-RME не завершился после 24 часов работы ни для одного из 1000 наборов данных смоделированных мутаций. В то время как публикация RME [22] анализировала матрицы мутаций с тысячами генов и сотнями пациентов, этот анализ (и выпущенное программное обеспечение RME) требовало, чтобы мутации были представлены как минимум в 10% образцов, что значительно уменьшило количество генов / образцов. вход в алгоритм. Фактически, порог в 10% удалит почти все гены в текущих исследованиях полного экзома (см. § Сравнение мульти-дендриксов и RME).

Руководители против рейдеров, неделя 11: ставки, линии и советы

Взгляните на линии, которые букмекеры установили для игры между вождями и рейдерами.

Ставки на фьючерсы на НФЛ, НБА, НХЛ, MLB и другие

Кто выиграет следующий Суперкубок? И стану ли я миллионером после того, как поставлю на них?

Шансы Bears vs. Saints, строка: выборы плей-офф НФЛ, прогнозы Wild Card на 2021 год от топ-модели в броске 119-77

Проверенная компьютерная модель SportsLine 10 000 раз смоделировала воскресную игру Saints vs.

Ставки на финансовые спреды - это азартные игры?

На первый взгляд, термин «ставки на спред» будет означать уровень риска, равный азартным играм, а не обычно более взвешенную торговлю.

Опека и посещения бабушек и дедушек

Некоторые суды принимают во внимание только интересы ребенка при принятии решения о предоставлении права посещения бабушке и дедушке, но другие принимают во внимание как интересы ребенка, так и пожелания родителей.

Больше новостей
4-27

Ставка на игру BLUEJAYS International - Magnitude eSports

4-33

Ставка на игру aera - 6e3t9n

4-10

Ставка iNTACT eSports - Red Reserve Female

2-53

Сделать ставку p@p@d@s - myXMG

2-10

Ставки на матч Lemondogs - Primum Post Deus

6-36

Ставки на матч Team Named - RealNoobs

Больше ставок