Лучшее казино в мире

Основы анализа выживаемости



Анализ выживаемостисоответствует набору статистических подходов, используемых для исследования времени, необходимого для возникновения интересующего события.

Анализ выживаемостииспользуется в различных областях, таких как:

  • Исследования рака для анализа времени выживания пациентов,
  • Социология для «анализа истории событий»,
  • и в инженерии для «анализа времени отказа».

В исследованиях рака типичные исследовательские вопросы выглядят так:

  • Какое влияние оказывают определенные клинические характеристики на выживаемость пациента
  • Какова вероятность того, что человек проживет 3 года?
  • Есть ли различия в выживаемости между группами пациентов?

Цели

Цель этой главы - описать основные концепции анализа выживаемости. В исследованиях рака в большинстве анализов выживаемости используются следующие методы:

  • Графики Каплана-Мейера для визуализации кривых выживаемости
  • Логранговый тест для сравнения кривых выживаемости двух или более групп.
  • Регрессия пропорциональных рисков Кокса для описания влияния переменных на выживаемость. Модель Кокса обсуждается в следующей главе: Модель пропорциональных рисков Кокса.

Здесь мы начнем с объяснения основных концепций анализа выживаемости, в том числе:

  • как построить и интерпретировать кривые выживаемости,
  • и как количественно оценить и проверить различия в выживаемости между двумя или более группами пациентов.

Затем мы продолжим описание многомерного анализа с использованием модели пропорциональных рисков Кокса.

Основные понятия

Здесь мы начнем с определения основных терминов анализа выживаемости, включая:

  • Время выживания и событие
  • Цензура
  • Функция выживания и функция опасности

Время выживания и тип событий в исследованиях рака

Есть разные типы событий, в том числе:

  • Рецидив
  • Прогресс
  • Смерть

Время от «ответа на лечение» (полная ремиссия) до наступления интересующего события обычно называется временем выживания (или временем до события).

Двумя наиболее важными показателями в исследованиях рака являются: i) время до смерти ; и ii) время безрецидивной выживаемости , которое соответствует времени между ответом на лечение и рецидивом заболевания. Это также известно как время выживания без болезней и время выживания без событий .

Цензура

Как упоминалось выше, анализ выживаемости фокусируется на ожидаемой продолжительности времени до наступления интересующего события (рецидива или смерти). Однако это событие может не наблюдаться для некоторых людей в течение периода исследования, что приводит к так называемым цензурированным наблюдениям.

Цензура может возникать следующими способами:

  1. пациент (еще) не испытал интересующего события, такого как рецидив или смерть, в течение периода исследования;
  2. пациент потерян для последующего наблюдения в течение периода исследования;
  3. пациент переживает другое событие, которое делает невозможным дальнейшее наблюдение.

Этот тип цензуры, называемый правой цензурой , применяется при анализе выживаемости.

Функции выживания и опасности

Два смежных вероятности используются для описания данных выживания: на вероятность выживания и вероятность опасности .

Вероятность выживания , также известная как функция выжившего \ (S (т) \), есть вероятность того, что индивидуум выживает от времени происхождения (например , диагноз рака) до определенного времени в будущем т.

Опасности , обозначаемые \ (Л (т) \), есть вероятность того, что человек , который находится под наблюдением в момент времени т есть событие , в то время.

Обратите внимание, что, в отличие от функции оставшегося в живых, которая фокусируется на отсутствии события, функция опасностей фокусируется на происходящем событии.

Оценка выживаемости Каплана-Мейера

Метод Каплана-Мейера (КМ) - это непараметрический метод, используемый для оценки вероятности выживания на основе наблюдаемого времени выживания (Kaplan and Meier, 1958).

Вероятность выживания в момент времени \ (t_i \), \ (S (t_i) \) рассчитывается следующим образом:

  • \ (S (t_ ) \) = вероятность остаться в живых в \ (t_ \)
  • \ (n_i \) = количество живых пациентов непосредственно перед \ (t_i \)
  • \ (d_i \) = количество событий в \ (t_i \)
  • \ (t_0 \) = 0, \ (S (0) \) = 1

Расчетная вероятность (\ (S (t) \)) - это ступенчатая функция, которая меняет значение только во время каждого события. Также возможно вычислить доверительные интервалы для вероятности выживания.

Кривая выживаемости KM, график зависимости вероятности выживания KM от времени, дает полезную сводку данных, которую можно использовать для оценки таких показателей, как среднее время выживания.

Анализ выживаемости в R

Установите и загрузите необходимый пакет R

Мы будем использовать два пакета R:

    выживаемость для вычисления анализов выживаемости

Survminer для обобщения и визуализации результатов анализа выживаемости

Установите пакеты

  • Загрузите пакеты

Примеры наборов данных

Мы будем использовать данные о раке легких, имеющиеся в пакете выживания.

  • inst: код учреждения
  • time: Время выживания в днях
  • статус: статус цензуры 1 = цензура, 2 = мертв
  • age: Возраст в годах
  • пол: Мужской = 1 Женский = 2
  • ph.ecog: оценка эффективности ECOG (0 = хорошо, 5 = нет)
  • ph.karno: оценка эффективности по Карновски (плохая = 0-хорошая = 100) по оценке врача
  • pat.karno: Оценка результатов по Карновски по оценке пациента
  • food.cal: калории, потребляемые во время еды.
  • потеря веса: потеря веса за последние шесть месяцев.

Вычислить кривые выживаемости: Survfit ()

Мы хотим вычислить вероятность выживания по полу.

Функция Survfit () [в пакете выживания ] может использоваться для вычисления оценки выживаемости по Каплану-Мейеру . К его основным аргументам можно отнести:

  • объект выживания, созданный с помощью функции Surv ()
  • и набор данных, содержащий переменные.

Чтобы вычислить кривые выживаемости, введите следующее:

По умолчанию функция print () показывает краткую сводку кривых выживаемости. Он печатает количество наблюдений, количество событий, медианное значение выживаемости и доверительные границы для медианы.

Если вы хотите отобразить более полную сводку кривых выживаемости, введите следующее:

Доступ к значению, возвращаемому функцией Survfit ()

Функция Surfit () возвращает список переменных, включая следующие компоненты:

  • n: общее количество субъектов на каждой кривой.
  • время: моменты времени на кривой.
  • n.risk: количество субъектов риска в момент времени t
  • n.event: количество событий, произошедших в момент времени t.
  • n.censor: количество подвергнутых цензуре субъектов, которые вышли из группы риска без события в момент времени t.
  • нижний, верхний: нижний и верхний доверительные границы для кривой соответственно.
  • страты: указывает на стратификацию оценки кривой. Если strata не NULL, в результате будет несколько кривых. Уровни страт (фактор) - это метки для кривых.

Доступ к компонентам можно получить следующим образом:

Визуализируйте кривые выживания

Мы будем использовать функцию ggsurvplot () [в пакете Survminer R], чтобы построить кривые выживаемости для двух групп субъектов.

Также можно показать:

  • 95% доверительный интервал функции выжившего с использованием аргумента conf.int = TRUE .
  • количество и / или процент лиц, подверженных риску по времени с использованием таблицы риска опционов . Допустимые значения для таблицы риска включают:
    • ИСТИНА или ЛОЖЬ, определяющие, показывать ли таблицу рисков. По умолчанию - ЛОЖЬ.
    • «Абсолютный» или «процентный»: чтобы показать абсолютное количество и процент субъектов риска по времени, соответственно. Используйте «abs_pct», чтобы показать как абсолютное число, так и процент.

    Сюжет можно дополнительно настроить, используя следующие аргументы:

    • conf.int.style = «step», чтобы изменить стиль полос доверительного интервала.
    • xlab, чтобы изменить метку оси x.
    • break.time.by = 200 разбивать ось x по временным интервалам на 200.
    • риск.table = «abs_pct», чтобы показать как абсолютное количество, так и процент лиц, подверженных риску.
    • риск.table.y.text.col = ИСТИНА и риск.table.y.text = ЛОЖЬ, чтобы предоставить столбцы вместо имен в текстовых аннотациях легенды таблицы рисков.
    • ncensor.plot = TRUE, чтобы отобразить количество подвергнутых цензуре субъектов в момент времени t. По предположению Марцина Косински, это хорошая дополнительная обратная связь для кривых выживаемости, чтобы можно было понять: как выглядят кривые выживаемости, каково количество наборов рисков И какова причина того, что набор рисков стал меньше: вызвано событиями или событиями, подвергшимися цензуре?
    • legend.labs, чтобы изменить метки легенды.

    График Каплана-Мейера можно интерпретировать следующим образом:

    Горизонтальная ось (ось X) представляет время в днях, а вертикальная ось (ось Y) показывает вероятность выживания или долю выживших людей. Линии представляют кривые выживаемости двух групп. Вертикальный спад на кривых указывает на событие. Вертикальная отметка на кривых означает, что в это время пациент подвергался цензуре.

    • В нулевой момент времени вероятность выживания составляет 1,0 (или 100% участников живы).
    • В момент времени 250 вероятность выживания составляет приблизительно 0,55 (или 55%) для пола = 1 и 0,75 (или 75%) для пола = 2.
    • Средняя выживаемость составляет примерно 270 дней для секса = 1 и 426 дней для секса = 2, что предполагает хорошую выживаемость для секса = 2 по сравнению с сексом = 1.

    Среднее время выживания для каждой группы можно получить, используя приведенный ниже код:

    Среднее время выживания для каждой группы представляет собой время, при котором вероятность выживания S (t) равна 0,5.

    Среднее время выживания для пола = 1 (мужская группа) составляет 270 дней, по сравнению с 426 днями для пола = 2 (женская). Похоже, что у женщин с раком легких есть преимущество в выживаемости по сравнению с мужчинами. Однако, чтобы оценить, является ли эта разница статистически значимой, требуется формальный статистический тест, который обсуждается в следующих разделах.

    Обратите внимание, что доверительные границы широки в хвосте кривых, что затрудняет значимую интерпретацию. Это можно объяснить тем, что на практике обычно есть пациенты, которые потеряны для последующего наблюдения или живы к концу наблюдения. Таким образом, может быть разумным сократить графики до окончания наблюдения по оси x (Pocock et al, 2002).

    Кривые выживаемости можно сократить, используя аргумент xlim следующим образом:

    Обратите внимание, что с помощью аргумента fun можно указать три часто используемых преобразования :

    • «Журнал»: преобразование журнала функции выжившего,
    • «Событие»: графики кумулятивных событий (f (y) = 1-y). Это также известно как совокупная заболеваемость,
    • «Cumhaz» строит кумулятивную функцию риска (f (y) = -log (y))

    Например, чтобы построить кумулятивные события, введите следующее:

    Cummulative опасностиобычно используется для оценки вероятности опасности. Он определяется как \ (H (t) = -log (функция выживания) = -log (S (t)) \). Кумулятивный риск (\ (H (t) \)) можно интерпретировать как совокупную силу смертности. Другими словами, это соответствует количеству событий, которые можно было бы ожидать для каждого человека к моменту t, если бы событие было повторяющимся процессом.

    Чтобы построить кумулятивную опасность, введите следующее:

    Таблица выживаемости Каплана-Мейера: сводка кривых выживаемости

    Как упоминалось выше, вы можете использовать функцию summary (), чтобы получить полную сводку кривых выживаемости:

    Также можно использовать функцию Surv_summary () [в пакете Survminer ], чтобы получить сводку кривых выживаемости. По сравнению с функцией summary () по умолчанию, Surv_summary () создает фрейм данных, содержащий красивую сводку по результатам Surfit.

    Функция Surv_summary () возвращает фрейм данных со следующими столбцами:

    • время: моменты времени, в которых кривая имеет ступеньку.
    • n.risk: количество субъектов риска в t.
    • n.event: количество событий, которые происходят в момент времени t.
    • n.censor: количество цензурированных событий.
    • Surv: оценка вероятности выживания.
    • std.err: стандартная ошибка выживания.
    • верхний: верхний предел доверительного интервала
    • нижний: нижний предел доверительного интервала
    • страты: указывает на стратификацию оценки кривой. Уровни страт (фактор) - это метки для кривых.

    В ситуации, когда кривые выживаемости были оснащены одной или несколькими переменными, объект Surv_summary содержит дополнительные столбцы, представляющие переменные. Это позволяет разделить выходные данные ggsurvplot по слоям или по некоторым комбинациям факторов.

    Объект Surv_summary также имеет атрибут с именем «таблица», содержащий информацию о кривых выживаемости, включая медианы выживаемости с доверительными интервалами, а также общее количество субъектов и количество событий на каждой кривой. Чтобы получить доступ к атрибуту table, введите следующее:

    Лог-ранговый тест, сравнивающий кривые выживаемости: Survdiff ()

    Лог-ранговый критерий является наиболее широко используемым методом сравнения два или более кривых выживаемости. Нулевая гипотеза состоит в том, что между двумя группами нет разницы в выживаемости. Лог-ранговый тест - это непараметрический тест, который не делает никаких предположений о распределении выживаемости. По сути, логарифмический ранговый тест сравнивает наблюдаемое количество событий в каждой группе с тем, что можно было бы ожидать, если бы нулевая гипотеза была верной (т. Е. Если бы кривые выживаемости были идентичными). Статистика логарифмического ранга приблизительно распределена как статистика критерия хи-квадрат.

    Функцию Survdiff () [в пакете выживания ] можно использовать для вычисления лог- рангового теста, сравнивающего две или более кривых выживания.

    Survdiff () можно использовать следующим образом:

    Функция возвращает список компонентов, в том числе:

    • n: количество испытуемых в каждой группе.
    • obs: взвешенное наблюдаемое количество событий в каждой группе.
    • exp: взвешенное ожидаемое количество событий в каждой группе.
    • chisq: статистика chisquare для проверки равенства.
    • страты: необязательно количество субъектов, содержащихся в каждой страте.

    Лог-ранговый тест на разницу в выживаемости дает p-значение p = 0,0013, что указывает на то, что половые группы значительно различаются по выживаемости.

    Подбирайте сложные кривые выживаемости

    В этом разделе мы рассчитаем кривые выживаемости, используя комбинацию нескольких факторов. Затем мы разберем вывод ggsurvplot () с помощью комбинации факторов

    1. Подходящие (сложные) кривые выживаемости с использованием наборов данных о толстой кишке
    1. Визуализируйте результат с помощью Survminer. На приведенном ниже графике показаны кривые выживаемости по переменной пола, разбитые в соответствии со значениями rx & adhere.

    Резюме

    Анализ выживаемости - это набор статистических подходов к анализу данных, в котором интересующей переменной результата является время до наступления события.

    Данные о выживаемости обычно описываются и моделируются в терминах двух связанных функций:

    функция выживания, представляющая вероятность того, что человек выживет с момента происхождения до некоторого времени после времени t. Обычно оценивается по методу Каплана-Мейера. Тест логарифмического ранжирования может использоваться для проверки различий между кривыми выживаемости для групп, таких как группы лечения.

    Функция риска дает мгновенный потенциал события в определенный момент времени с учетом выживаемости до этого времени. Он используется в основном как диагностический инструмент или для определения математической модели для анализа выживаемости.

    В этой статье мы продемонстрируем, как выполнять и визуализировать анализ выживаемости, используя комбинацию двух пакетов R: выживаемость (для анализа) и выживший (для визуализации).

    использованная литература

    • Кларк Т.Г., Брэдберн М.Дж., Лав С.Б. и Альтман Д.Г. Анализ выживания Часть I: Основные концепции и первые анализы. Британский журнал рака (2003) 89, 232 - 238
    • Каплан Е.Л., Мейер П. (1958) Непараметрическая оценка по неполным наблюдениям. J Am Stat Assoc 53: 457–481.
    • Покок С., Клейтон Т.К., Альтман Д.Г. (2002) Графики выживаемости в зависимости от времени до наступления события в клинических испытаниях: передовая практика и подводные камни. Ланцет 359: 1686–1689.

    Информация

    Этот анализ был выполнен с использованиемпрограммного обеспечения R(версия 3.3.2).

    Понравилась эта статья? Я был бы очень благодарен, если бы вы помогли его распространению, отправив его другу по электронной почте или поделившись им в Twitter, Facebook или Linked In.

    Покажи мне немного любви с кнопками «Нравится» ниже. Спасибо и, пожалуйста, не забывайте делиться и комментировать ниже !!

    Avez vous aimé cet article? Je vous serais très recnaissant si vous aidiez à sa diffusion en l'envoyant par courriel à un ami or le partageant на Twitter, Facebook или Linked In.

    Montrez-moi un peu d'amour avec les like ci-dessous. Merci et n'oubliez pas, s'il vous plaît, departager et de commenter ci-dessous!

Как использовать приложение Nomorobo Robocall Blocking для борьбы с Robocalls

Знаете ли вы, что,по даннымUSA Today, в 2019 году американцы получили 58,5 миллиарда звонков от роботов?

Пошаговое руководство по орошению ушей

Медсестры помогают своим пациентам несколькими способами. В зависимости от условий работы им может потребоваться промывание ушей для удаления ушной серы или удаления посторонних предметов из слухового прохода пациента.

Риски и причины

Ваш риск развития рака яичников зависит от многих факторов, включая возраст, генетику, образ жизни и факторы окружающей среды.

Домашний турнир по покеру Как провести

Покерные турниры - это лучший опыт в покерных соревнованиях. Они сочетают в себе азарт спринта с дисциплиной дистанционной гонки.

<strong>Как играть в баккару и чаще выигрывать</strong>

Что может быть лучше, чем найти статью, которая поможет увеличить прибыль от игры в баккара?

Больше новостей
8-53

Ставки на матч Gdansk Lions - VG.FlashGaming

6-41

Ставки на игру ElFamoso Pascal - ProDota Avengers

4-35

Ставки на матч ARCY - circo

2-9

Ставки на киберспорт ArchAngels - Save's eSports

3-7

Ставки на игру MeowSports - WhyTry

8-19

Ставка Oblique Gaming - LMQ

Больше ставок