Лучшее казино в мире

Глава 33 Трехкомпонентные таблицы: таблица 2x2xK и анализ Мантеля-Хензеля

Материал, который я обсуждаю в этом разделе, принадлежит Джеффу Симонову и его книге « Анализ категориальных данных» . Пример взят из раздела 8.1 этой книги.

Трехмерная или трехкомпонентная таблица подсчетов часто отражает ситуацию, когда строки и столбцы относятся к переменным, ассоциация которых представляет для нас основной интерес, а третий фактор (слой или страты) описывает управляющую переменную, влияние которой на нашей первичной ассоциации - это то, что мы контролируем в анализе.

33.1 Курение и смертность в Великобритании

В начале 1970-х годов, а затем снова через 20 лет в Уикхэме, Соединенное Королевство, опросы выявили следующую взаимосвязь между тем, был ли человек курильщиком во время первоначального опроса и жив ли он еще 20 лет спустя.

В живых Мертвый Сумма
Курильщик443139582
Некурящий502230732
Сумма9453691314

Вот анализ таблицы два на два.

Существует значительная связь между курением и смертностью (\ (\ chi ^ 2 \) = 8,75 на 1 df, p = 0,003), но это не та, которую можно было бы ожидать.

  • Отношение шансов составляет 1,46, что означает, что шансы выжить у курильщиков на 46% выше, чем у некурящих.
  • Означает ли это, что курение полезно для вас?

Скорее всего, не. Здесь есть ключевая «скрытая» переменная - переменная, связанная как с курением, так и со смертностью, которая затемняет реальную взаимосвязь, а именно возраст.

33.2 Данные Whickham, включая возраст, а также курение и смертность

В таблице ниже представлены данные о смертности, разделенные на подтаблицы по исходным возрастным группам.

Отношения шансов для каждой из этих подтаблиц, кроме последней, где она не определена, следующие:

Возрастная группа Соотношение шансов
18-240,43
25–341,33
35–440,42
45-540,69
55–640,62
65-740,87
75+неопределенный

Таким образом, для всех возрастных групп, кроме 25-34 лет, курение связано с более высокой смертностью.

Почему? Неудивительно, что существует сильная связь между возрастом и смертностью, при этом показатели смертности очень низкие для молодых людей (2,5% для 18–24 лет) и возрастают до 100% для лиц старше 75 лет.

Существует также связь между возрастом и курением: пиковые показатели курения приходится на возрастной диапазон 45–54 лет, а затем быстро снижаются. В частности, у респондентов, которым на момент первого опроса было 65 лет и старше, был очень низкий уровень курения (25,4%), но очень высокий уровень смертности (85,5%). Однако курение вряд ли было причиной, поскольку даже среди людей в возрасте 65-74 лет смертность среди курильщиков была выше (80,6%), чем среди некурящих (78,3%). Плоская версия таблицы (таблица на R) может помочь нам в этих расчетах.

33.2.1 Тест Кокрана-Мантеля-Хензеля

Таким образом, маргинальная таблица, в которой рассматриваются курение и смертность, объединяющая все возрастные группы, не является наиболее значимым обобщением взаимосвязи между курением и смертностью. Вместо этого нам нужно посмотреть на условную связь курения и смертности сучетом возраста, чтобы удовлетворить наши интересы.

Нулевая гипотеза будет заключаться в том, что в популяции курение и смертность не зависят друг от друга в пределах слоев, сформированных по возрастным группам. Другими словами, H 0 требует, чтобы курение не имело значения для прогнозирования смертности после учета возраста.

Альтернативная гипотеза заключалась бы в том, что в популяции курение и смертность связаны в пределах слоев, сформированных по возрастным группам. Другими словами, H A требует, чтобы курение имело хоть какую-то ценность для прогнозирования смертности даже после того, как возраст был учтен.

Мы можем рассмотреть доказательства, которые помогают нам выбирать между этими двумя гипотезами, с помощью теста Кохрана-Мантеля-Хензеля, который получается в R с помощью функции mantelhaen.test. Этот тест требует, чтобы мы предположили, что среди населения и внутри каждой возрастной группы отношение шансов смертности от курения одинаково. По сути, это означает, что курение связано со смертностью одинаково как для пожилых, так и для молодых людей.

  • Статистический показатель критерия Кокрана-Мантеля-Хензеля составляет 5,44 (после поправки на непрерывность), что приводит к значению p 0,02, что указывает на решительное отклонение нулевой гипотезы об условной независимости курения и выживаемости с учетом возраста.
  • Расчетное обычное условное отношение шансов составляет 0,65. Это означает, что (учитывая возраст) курение на 35% снижает шансы остаться в живых на 20 лет позже, чем некурящий.
  • 90% доверительный интервал для этого общего отношения шансов составляет (0,49, 0,87), что усиливает отказ от условной независимости (где отношение шансов будет равно 1).

33.2.2 Проверка предположений: тест Вульфа

Мы также можем получить тест (используя функцию woolf_test в библиотеке vcd), чтобы убедиться, что общее отношение шансов, оцененное с помощью процедуры Mantel-Haenszel, приемлемо для всех возрастных групп. Другими словами, тест Вульфа - это проверка предположения об однородности отношения шансов в шести возрастных группах.

Если тест Вульфа значим, это говорит о том, что тест Кокрана-Мантеля-Хензеля не подходит, поскольку отношения шансов для курения и смертности слишком сильно различаются в подтаблицах по возрастным группам. Здесь у нас есть следующие логарифмические отношения шансов (оцененные с использованием условного максимального правдоподобия, а не отношений перекрестных произведений) и связанный с ними тест Вульфа.

Как видите, тест Вульфа не близок к статистически значимому, подразумевая, что общее отношение шансов, по крайней мере, потенциально разумно для всех возрастных групп (или, по крайней мере, для тех, кто моложе 75 лет, если доступны некоторые данные).

33.2.3 Без коррекции непрерывности

По умолчанию R представляет тест Mantel-Haenszel с поправкой на непрерывность при использовании для таблицы 2x2xK. Практически во всех случаях продолжайте и делайте это, но, как вы можете видеть ниже, разница в этом случае незначительна.

Без кейворда

У вас, конечно же, есть Zeus, игровой автомат giovanni's gems, но это не так.

Используйте слоты myVEGAS, чтобы получать БЕСПЛАТНОЕ питание и проживание

Эта статья может содержать ссылки на некоторых наших рекламных партнеров. Если вы нажмете на эти ссылки, мы можем получить компенсацию.

Частые цветы объединяются: почему ваши месячные появлялись дважды в этом месяце

Когда у вас начинается покалывание во время месячных (то есть у вас очень сильные судороги), вы знаете, что в ваших нижних регионах это скоро станет ужасным.

Пример того, как чаевые могут быть прибыльными в казино

Я играл с некоторыми по-настоящему упорными игроками, которые хотели максимизировать свою прибыль, несмотря ни на что.

Как получить максимальное пособие по социальному обеспечению

Максимальный размер пособия по социальному обеспечению в 2020 году составляет 3790 долларов в месяц или 45 480 долларов в год.

Больше новостей
5-37

Ставка Lyngby Vikings - zbrilo

6-40

Ставка на игру Me Myself and I - SJ Gaming

5-35

Ставки Angry Balkan Beavers - Slayers

3-33

Ставка на игру Aggressive 5 - URSAL

8-41

Ставка PENTA Sports - Rush

7-56

Ставки на матч Allusions - Team Crucial

Больше ставок