Лучшее казино в мире

Логистическая регрессия

Логистическая регрессия- это статистический метод анализа набора данных, в котором есть одна или несколько независимых переменных, определяющих результат. Результат измеряется дихотомической переменной (в которой есть только два возможных результата).

В логистической регрессии зависимая переменная является двоичной или дихотомической, то есть она содержит только данные с кодом 1 (ИСТИНА, успех, беременность и т. Д.) Или 0 (ЛОЖЬ, неудача, небеременность и т. Д.).

Цель логистической регрессии - найти наиболее подходящую (но биологически разумную) модель для описания взаимосвязи между интересующей дихотомической характеристикой (зависимая переменная = ответ или переменная результата) и набором независимых (предикторных или объясняющих) переменных. Логистическая регрессия генерирует коэффициенты (и их стандартные ошибки и уровни значимости) формулы для прогнозированиялогит-преобразованиявероятности присутствия интересующей характеристики:

где p - вероятность наличия интересующей характеристики. Преобразование логита определяется как зарегистрированные шансы:

$$ logit (p) = \ ln \ left (\ frac

\ right) $$

Вместо того, чтобы выбирать параметры, которые минимизируют сумму квадратов ошибок (как в обычной регрессии), оценка в логистической регрессии выбирает параметры, которые максимизируют вероятность наблюдения значений выборки.

Как ввести данные

В следующем примере есть две переменные-предикторы: ВОЗРАСТ и КУРЕНИЕ. Зависимая переменная или переменная ответа - OUTCOME. Зависимая переменная OUTCOME кодируется 0 (отрицательный) и 1 (положительный).

Обязательный ввод

Зависимая переменная

Переменная, значения которой вы хотите предсказать. Зависимая переменная должна быть двоичной или дихотомической и содержать только данные с кодом 0 или 1. Если ваши данные закодированы по-другому, вы можете использовать инструмент «Определить статус», чтобы перекодировать данные.

Независимые переменные

Выберите различные переменные, которые, как вы ожидаете, будут влиять на зависимую переменную.

Фильтр

(Необязательно) введите фильтр данных, чтобы включить в анализ только выбранную подгруппу наблюдений.

Опции

  • Метод: выберите способ ввода независимых переменных в модель.
  • Enter: введите все переменные в модели за один шаг, не проверяя
  • Вперед: вводите значимые переменные последовательно
  • Назад: сначала введите все переменные в модель, а затем последовательно удалите незначимые переменные.
  • Пошаговый: вводите значимые переменные последовательно; после ввода переменной в модель проверьте и, возможно, удалите переменные, которые стали незначительными.

Переменная вводится в модель, если связанный с ней уровень значимости меньше этого P-значения.

Переменная удаляется из модели, если связанный с ней уровень значимости превышает это P-значение.

График

Возможность построения графика, показывающего кривую логистической регрессии, доступна только при наличии только одной независимой переменной.

Результаты

После того, как вы нажмете ОК, отобразятся следующие результаты:

Размер выборки и случаи с отрицательным и положительным исходом

Сначала программа дает размер выборки, а также количество и долю случаев с отрицательным (Y = 0) и положительным (Y = 1) исходом.

Общая модель подходит

Нулевая модель-2 логарифмическое правдоподобие задается -2 * Ln (L 0 ) , где L 0 представляет собой вероятность получения наблюдений , если независимые переменные не имели никакого влияния на результат.

Полная модель-2 логарифмическое правдоподобие задается -2 * Ln (L) , где L представляет собой вероятность получения наблюдений со всеми независимыми переменными , включенными в модели.

Разница этих двух значений дает статистику хи-квадрат, которая является мерой того, насколько хорошо независимые переменные влияют на результат или зависимую переменную.

Если P-значение для общей статистики соответствия модели меньше, чем стандартные 0,05, то есть свидетельства того, что по крайней мере одна из независимых переменных способствует прогнозированию результата.

Cox & Snell R 2 и Nagelkerke R 2 - это другие критерии согласия, известные как псевдо R-квадраты. Обратите внимание, что псевдо-R-квадрат Кокса и Снелла имеет максимальное значение, отличное от 1. Nagelkerke R 2 регулирует значения Кокса и Снелла так, что диапазон возможных значений расширяется до 1.

Коэффициенты регрессии

Коэффициенты логистической регрессии - это коэффициенты b 0 , b 1 , b 2 ,. b k уравнения регрессии:

Независимая переменная с коэффициентом регрессии, незначительно отличающимся от 0 (P>0,05), может быть удалена из модели регрессии (нажмите функциональную клавишу F7, чтобы повторить процедуру логистической регрессии). Если P

Коэффициенты логистической регрессии показывают изменение (увеличение, когда b i >0, уменьшение, когда b i

Когда независимые переменные X a и X b являются дихотомическими переменными (например, курение, пол), то влияние этих переменных на зависимую переменную можно просто сравнить, сравнив их коэффициенты регрессии b a и b b .

Статистика Вальда - это коэффициент регрессии, деленный на квадрат стандартной ошибки: (b / SE) 2.

Отношения шансов при 95% доверительном интервале

Взяв экспоненту обеих сторон уравнения регрессии, как указано выше, уравнение можно переписать как:

Ясно, что, когда переменная X i увеличивается на 1 единицу, при том, что все другие факторы остаются неизменными, то шансы увеличиваются в раз eb i .

Этот коэффициент eb i представляет собой отношение шансов (ИЛИ) для независимой переменной X i и даетотносительнуювеличину, на которую шансы результата увеличиваются (ИЛИ больше 1) или уменьшаются (ИЛИ меньше 1), когда значение независимая переменная увеличивается на 1 единицу.

Например, переменная КУРЕНИЕ кодируется как 0 (= не курить) и 1 (= курить), а отношение шансов для этой переменной составляет 2,64. Это означает, что в модели шансы на положительный результат в случаях, когда курят, в 2,64 раза выше, чем в случаях, когда они не курят.

Интерпретация подобранного уравнения логистической регрессии

Уравнение логистической регрессии:

Таким образом, для курящих пациентов в возрасте 40 лет логит (p) равен 2,026. Logit (p) можно преобразовать обратно в p по следующей формуле:

В качестве альтернативы вы можете использовать таблицу Logit или калькулятор функции ALOGIT. Для logit (p) = 2,026 вероятность p положительного результата равна 0,88.

Тест Хосмера-Лемешоу

Тест Хосмера-Лемешоу - это статистический тест на соответствие модели логистической регрессии. Данные разделены примерно на десять групп, определяемых в порядке возрастания оценочного риска. Рассчитывается наблюдаемое и ожидаемое количество случаев в каждой группе, а статистика хи-квадрат рассчитывается следующим образом:

гдеO g,E gиn g- наблюдаемые события, ожидаемые события и количество наблюдений дляg-йдецильной группы риска, аG- количество групп. Статистика теста следует распределению хи-квадрат сG − 2степенями свободы.

Большое значение хи-квадрат (с небольшим значением p

Непредвиденный Стол для Хосмера и Lemeshow испытанийтаблицы показывает деталь теста с наблюдаемым и ожидаемым числом случаев в каждой группе.

Таблица классификации

Таблица классификации - это еще один метод оценки точности прогнозов модели логистической регрессии. В этой таблице перекрестно классифицированы наблюдаемые значения для зависимого результата и прогнозируемые значения (при заданном пользователем пороговом значении, например, p = 0,50). В нашем примере модель правильно предсказывает 70% случаев.

Анализ кривой ROC

Другой метод оценки модели логистической регрессии использует анализ кривой ROC. В этом анализе способность прогнозируемых значений модели различать положительные и отрицательные случаи количественно оценивается площадью под кривой ROC (AUC). AUC, иногда называемый C-статистикой (или индексом соответствия), представляет собой значение, которое варьируется от 0,5 (дискриминирующая способность не лучше, чем шанс) до 1.0 (идеальная дискриминирующая способность).

Чтобы выполнить полный анализ кривой ROC для прогнозируемых вероятностей, вы можете сохранить прогнозируемые вероятности и затем использовать эту новую переменную в анализе кривой ROC. Зависимая переменная, используемая в логистической регрессии, затем действует как переменная классификации в диалоговом окне анализа кривой ROC.

Оценка склонности

Оценки склонности - это прогнозируемые вероятности модели логистической регрессии. Чтобы сохранить оценки склонности в таблице, щелкните ссылку «Сохранить прогнозируемые вероятности» в окне результатов.

Соображения относительно размера выборки

Расчет размера выборки для логистической регрессии - сложная задача, но на основе работы Peduzzi et al. (1996) можно предложить следующие рекомендации по минимальному количеству случаев, которые следует включить в ваше исследование.

Пустьpбудет наименьшей из долей отрицательных или положительных наблюдений в генеральной совокупности, аk- числом ковариат (количество независимых переменных), тогда минимальное количество наблюдений, которое следует включить, составляет:

Например: у вас есть 3 ковариаты, которые нужно включить в модель, а доля положительных случаев в популяции составляет 0,20 (20%). Минимальное необходимое количество случаев:

N = 10 х 3 / 0,20 = 150

Если полученное число меньше 100, вы должны увеличить его до 100, как это было предложено Лонгом (1997).

График

MedCalc может построить кривую логистической регрессии, когда есть только одна независимая переменная:

Создается следующий график:

использованная литература

  • Хосмер Д.В. Младший, Лемешоу С., Стурдивант RX (2013) Прикладная логистическая регрессия. Третье издание. Нью-Джерси: Джон Вили и сыновья.
  • Long JS (1997) Модели регрессии для категориальных и ограниченно зависимых переменных. Таузенд-Оукс, Калифорния: Sage Publications.
  • Pampel FC (2000) Логистическая регрессия: учебник. Серия документов Sage University по количественным приложениям в социальных науках, 07-132. Таузенд-Оукс, Калифорния: Sage Publications.
  • Peduzzi P, Concato J, Kemper E, Holford TR, Feinstein AR (1996) Имитационное исследование количества событий на переменную в логистическом регрессионном анализе. Журнал клинической эпидемиологии 49: 1373-1379.

Смотрите также

внешние ссылки

    в Википедии. в Википедии.

Рекомендуемая книга

Прикладная логистическая регрессия

Дэвид В. Хосмер мл., Стэнли Лемешоу, Родни X. Стердивант

Прикладная логистическая регрессия делает упор на приложениях в области здравоохранения и выбирает темы, которые лучше всего подходят для использования современного статистического программного обеспечения. Книга предоставляет читателям самые современные методы построения, интерпретации и оценки производительности моделей LR.

Эта книга является обязательным руководством для профессионалов и исследователей, которым необходимо моделировать номинальные или порядковые переменные результатов в области общественного здравоохранения, медицины и социальных наук, а также в широком спектре других областей и дисциплин.

Как устроить идеальную ночь покера у вас дома

Пребывание в доме не только сэкономит вам деньги - вы даже можете заработать немного дополнительных денег, если будете правильно разыгрывать свои карты.

5 лучших карточных игр с фокусами

Карточная игра с уловкой - это игра, в которой игроки по очереди играют в карты, и самая высокая карта, сыгранная в каждом раунде, выигрывает так называемый трюк .

Доказательства ДНК: основы анализа

Во время тестирования ДНК выполняются несколько основных шагов, независимо от типа теста.

Справедливость на рабочем месте

Федеральный закон не требует, чтобы работодатели предлагали своим сотрудникам отпуск. В отличие от многих других стран, хотя это и не требуется по федеральному закону, многие работодатели предпочитают предоставлять своим сотрудникам такие льготы, чтобы предотвратить выгорание сотрудников и повысить их моральный дух.

Руководство по применению TMDSAS на 2021 год для медицинских школ Техаса

Возможно, вы подумываете о поступлении в медицинские школы Техаса по разным причинам.

Больше новостей
5-14

Сделать ставку kerchNet - BIG Academy

3-13

Ставка ex-Windigo - Imperial Dragons

9-45

Ставки Cant - NEWGS

9-10

Ставки SYF Gaming - ex-Space Soldiers

3-22

Ставки на киберспорт Epsilon Ladies - TEAMGOK

1-26

Сделать ставку TNC Pro Team - My Virtual World

Больше ставок