Cox proporcjonalna Analiza zagrożeń Analiza regresji
metody analizy przeżycia można również rozszerzyć o ocenę kilku czynników ryzyka jednocześnie podobnych do wielokrotnej liniowej i wielokrotnej analizy regresji logistycznej, jak opisano w modułach omawiających zakłócanie, modyfikację efektów, korelację i metody wielowymiarowe. Jedną z najpopularniejszych technik regresji w analizie przeżycia jest regresja proporcjonalnego ryzyka Coxa, która jest używana do powiązania kilku czynników ryzyka lub ekspozycji, rozważanych jednocześnie, z czasem przeżycia., W modelu regresji zagrożeń proporcjonalnych Coxa miarą efektu jest wskaźnik zagrożenia, który jest ryzykiem niepowodzenia (tj. ryzykiem lub prawdopodobieństwem wystąpienia zdarzenia będącego przedmiotem zainteresowania), biorąc pod uwagę, że uczestnik przetrwał do określonego czasu. Prawdopodobieństwo musi mieścić się w zakresie od 0 do 1. Jednak zagrożenie reprezentuje oczekiwaną liczbę zdarzeń na jedną jednostkę czasu. W rezultacie zagrożenie w grupie może przekroczyć 1. Na przykład, jeśli zagrożenie wynosi 0,2 w czasie t, a jednostkami czasu są miesiące, to średnio oczekuje się 0,2 zdarzeń na osobę zagrożoną na miesiąc., Inna interpretacja opiera się na wzajemności zagrożenia. Na przykład 1/0. 2 = 5, co jest oczekiwanym czasem wolnym od zdarzeń (5 miesięcy) na osobę zagrożoną.
w większości sytuacji jesteśmy zainteresowani porównaniem grup pod względem ich zagrożeń i używamy współczynnika ryzyka, który jest analogiczny do współczynnika kursów w ustawieniu wielokrotnej analizy regresji logistycznej. Współczynnik ryzyka można oszacować na podstawie danych, które organizujemy w celu przeprowadzenia testu rangi dziennika., W szczególności współczynnik ryzyka jest stosunkiem całkowitej liczby obserwowanych do spodziewanych zdarzeń w dwóch niezależnych grupach porównawczych:
w niektórych badaniach rozróżnienie między narażonymi lub leczonymi w porównaniu z grupami nienaświetlonymi lub kontrolnymi jest wyraźne. W innych badaniach tak nie jest., W tym drugim przypadku każda z grup może pojawić się w liczniku, a interpretacją współczynnika ryzyka jest wówczas ryzyko zdarzenia w grupie w liczniku w porównaniu z ryzykiem zdarzenia w grupie w mianowniku.
w przykładzie 3 porównuje się dwie aktywne metody leczenia (chemioterapię przed operacją i chemioterapię po operacji). W związku z tym nie ma znaczenia, który wskaźnik ryzyka występuje w liczniku., Na podstawie danych z przykładu 3 współczynnik ryzyka oszacowano następująco:
ryzyko zgonu jest 4, 870 razy większe w grupie otrzymującej chemioterapię przed operacją w porównaniu do grupy otrzymującej chemioterapię po operacji.
przykład 3 badał skojarzenie pojedynczej zmiennej niezależnej (chemioterapia przed lub po zabiegu chirurgicznym) na przeżywalność. Jednak często interesująca jest ocena związku między kilkoma czynnikami ryzyka, rozważanymi jednocześnie, a czasem przeżycia., Jedną z najpopularniejszych technik regresji dla wyników przeżycia jest analiza regresji proporcjonalnych zagrożeń Coxa. Istnieje kilka ważnych założeń dotyczących właściwego stosowania modelu regresji proporcjonalnej zagrożeń Coxa, w tym
- niezależność czasu przeżycia między różnymi osobnikami w próbie,
- multiplikatywna zależność między predyktorami a Zagrożeniem (w przeciwieństwie do liniowej, jak miało to miejsce w przypadku wielokrotnej analizy regresji liniowej, omówionej bardziej szczegółowo poniżej) oraz
- stały współczynnik ryzyka w czasie.,
model regresji zagrożeń proporcjonalnych Cox można zapisać w następujący sposób:
gdzie h(T) jest oczekiwanym Zagrożeniem w czasie t, h0(t) jest Zagrożeniem wyjściowym i reprezentuje zagrożenie, gdy wszystkie predyktory (lub zmienne niezależne) X1 , X2, XP są równe zeru. Należy zauważyć, że przewidywane zagrożenie(tj. h (t)) lub stopa cierpienia w przypadku zainteresowania w następnej chwili, jest iloczynem zagrożenia podstawowego (h0 (t)) i funkcji wykładniczej kombinacji liniowej predyktorów., W ten sposób predykatory mają mnożnikowy lub proporcjonalny wpływ na przewidywane zagrożenie.
rozważ prosty model z jednym predyktorem, X1., Model zagrożeń proporcjonalnych Coxa to:
czasami model wyraża się w różny sposób, w odniesieniu do względnego zagrożenia, czyli stosunku zagrożenia w czasie t do zagrożenia początkowego, do czynników ryzyka:
iv id
możemy przyjąć logarytm naturalny (LN) każdej strony proporcjonalnego modelu regresji zagrożeń Coxa, aby uzyskać następujące dane, które odnoszą się do logu względnego zagrożenia do liniowej funkcji predykatorów., Zwróć uwagę, że prawa strona równania wygląda jak bardziej znana kombinacja liniowa predyktorów lub czynników ryzyka (jak widać w modelu wielokrotnej regresji liniowej).
w praktyce zainteresowanie leży w powiązaniach między każdym z czynników ryzyka lub predyktorów (X1, X2,…, Xp) i wynik. Skojarzenia są kwantyfikowane przez współczynniki regresji (b1, b2, …, bp)., Technika szacowania współczynników regresji w modelu regresji zagrożeń proporcjonalnych Cox wykracza poza zakres tego tekstu i jest opisana w Cox i Oakes.9 tutaj skupiamy się na interpretacji. Na przykład szacunkowe współczynniki w proporcjonalnym modelu regresji zagrożeń Cox, b1, reprezentują zmianę w oczekiwanym logu współczynnika ryzyka w stosunku do jednostkowej zmiany w X1, utrzymując wszystkie inne predyktory na stałym poziomie.
antylog szacunkowego współczynnika regresji, exp(bi), daje współczynnik ryzyka. Jeśli predyktor jest dychotomiczny (np.,, X1 jest wskaźnikiem rozpowszechnionej choroby sercowo-naczyniowej lub płci męskiej), a następnie exp (b1) jest współczynnikiem ryzyka porównującym ryzyko zdarzenia dla uczestników z X1=1 (np. rozpowszechnionej choroby sercowo-naczyniowej lub płci męskiej) do uczestników z X1=0 (np. wolne od chorób sercowo-naczyniowych lub płci żeńskiej).
Jeśli współczynnik ryzyka dla predyktora jest bliski 1, to ten predyktor nie wpływa na przeżycie. Jeśli współczynnik ryzyka jest mniejszy niż 1, to predyktor jest ochronny (tj., jeśli współczynnik ryzyka jest większy niż 1, to predyktor jest związany ze zwiększonym ryzykiem (lub zmniejszonym przeżyciem).
testy hipotezy są używane do oceny, czy istnieją statystycznie istotne skojarzenia między predyktorami a czasem do zdarzenia. Poniższe przykłady ilustrują te testy i ich interpretację.
model zagrożenia proporcjonalnego Coxa nazywa się modelem półparametrycznym, ponieważ nie ma założeń co do kształtu funkcji zagrożenia podstawowego. Istnieją jednak inne założenia, jak wspomniano powyżej (tj.,, niezależność, zmiany w predyktorach powodują proporcjonalne zmiany w zagrożeniu bez względu na czas oraz liniowy związek między logarytmem naturalnym względnego zagrożenia a predyktorami). Istnieją inne modele regresji stosowane w analizie przeżycia, które zakładają specyficzne rozkłady dla czasu przeżycia, takie jak wykładnicze, Weibull, Gompertz i log-normalne dystrybucje1, 8. Na przykład model regresji wykładniczej zakłada, że funkcja zagrożenia jest stała., Inne rozkłady zakładają, że zagrożenie rośnie w czasie, maleje w czasie, lub wzrasta początkowo, a następnie maleje. Przykład 5 ilustruje estymację modelu regresji zagrożeń proporcjonalnych Coxa i omawia interpretację współczynników regresji.
przykład:
przeprowadzono analizę w celu zbadania różnic w śmiertelności z jakiejkolwiek przyczyny pomiędzy mężczyznami i kobietami uczestniczącymi w badaniu Framingham Heart. Łącznie 5180 uczestników w wieku 45 lat i starszych jest obserwowanych do czasu śmierci lub do 10 lat, w zależności od tego, co nastąpi wcześniej., Czterdzieści sześć procent próbki to mężczyźni, średni wiek próbki wynosi 56,8 lat (odchylenie standardowe = 8,0 lat), a wiek waha się od 45 do 82 lat na początku badania. W sumie odnotowano 402 zgony wśród 5180 uczestników. Poniżej przedstawiono opisowe statystyki dotyczące wieku i płci uczestników na początku badania sklasyfikowane według tego, czy umierają, czy nie umierają w okresie obserwacji.,
|
Die (n=402) |
Do Not Die (n=4778) |
---|---|---|
Mean (SD) Age, years |
65.6 (8.7) |
56.1 (7.,5) |
n (%) Mężczyzna |
221 (55%) |
2145 (45%) |
szacujemy teraz model regresji zagrożeń proporcjonalnych Cox i odnosimy wskaźnik płci i wieku mężczyzn, w latach, do czasu zgonu. Szacunki parametrów są generowane w SAS przy użyciu procedury regresji zagrożeń proporcjonalnych SAS cox12 i są przedstawione poniżej wraz z ich wartościami P.,
Risk Factor |
Parameter Estimate |
P-Value |
---|---|---|
Age, years |
0.11149 |
0.0001 |
Male Sex |
0.,67958 |
0.0001 |
zauważ, że istnieje pozytywny związek między wiekiem a śmiertelnością z jakiejkolwiek przyczyny oraz między płcią męską a śmiertelność (to znaczy, istnieje zwiększone ryzyko śmierci dla starszych uczestników i dla mężczyzn).
Jest 0.,11149 jednostkowy wzrost oczekiwanego logu względnego zagrożenia dla każdego rocznego wzrostu wieku, przy stałej płci utrzymującej, oraz jednostkowy wzrost oczekiwanego logu względnego zagrożenia dla mężczyzn w porównaniu do kobiet przy stałej wieku utrzymującej.
dla interpretacji, obliczamy współczynniki ryzyka poprzez wykładnicze szacunki parametrów. Dla wieku, exp(0.11149) = 1.118. Istnieje 11,8% wzrost oczekiwanego zagrożenia w stosunku do rocznego wzrostu wieku (lub oczekiwane zagrożenie jest 1,12 razy większe u osoby, która jest o rok starsza od innego), utrzymując stałą płeć. Exp(0.67958) = 1.,973. Oczekiwane zagrożenie jest 1,973 razy większe u mężczyzn w porównaniu do kobiet, utrzymując stały wiek.
Załóżmy, że rozważymy dodatkowe czynniki ryzyka dla śmiertelności z wszystkich przyczyn i oszacujemy model regresji zagrożeń proporcjonalnych Coxa odnoszący się do rozszerzonego zestawu czynników ryzyka do czasu zgonu. Szacunki parametrów są ponownie generowane w SAS przy użyciu procedury regresji zagrożeń proporcjonalnych SAS Cox i są przedstawione poniżej wraz z ich wartościami P.Poniżej przedstawiono również współczynniki ryzyka wraz z 95% przedziałem ufności.,
wszystkie szacunki parametrów są szacowane z uwzględnieniem innych predyktorów. Po uwzględnieniu wieku, płci, ciśnienia krwi i stanu palenia tytoniu nie ma statystycznie istotnych powiązań między całkowitym cholesterolem w surowicy a śmiertelnością z jakiejkolwiek przyczyny lub między cukrzycą a śmiertelnością z każdej przyczyny. Nie oznacza to, że te czynniki ryzyka nie są związane ze śmiertelnością z jakiejkolwiek przyczyny; ich brak znaczenia jest prawdopodobnie spowodowany pomieszaniem (wzajemne powiązania między czynnikami ryzyka). Zauważ, że dla statystycznie istotnych czynników ryzyka (tj.,, wiek, płeć, skurczowe ciśnienie krwi i aktualny stan palenia), że 95% przedziały ufności dla współczynników ryzyka nie zawierają 1 (wartość zerowa). Natomiast 95% przedziały ufności dla nieistotnych czynników ryzyka (cholesterolu całkowitego w surowicy i cukrzycy) zawierają wartość zerową.
przykład:
prospektywne badanie kohortowe jest prowadzone w celu oceny związku między wskaźnikiem masy ciała a czasem do wystąpienia choroby sercowo-naczyniowej (CVD). Na początku, wskaźnik masy ciała uczestników jest mierzony wraz z innymi znanymi klinicznymi czynnikami ryzyka chorób układu krążenia (np.,, wiek, płeć, ciśnienie krwi). Uczestnicy są obserwowani przez okres do 10 lat w celu rozwoju CVD. W badaniu z udziałem n=3937 uczestników, 543 rozwija CVD w okresie obserwacji badania. W analizie regresji zagrożeń proporcjonalnych Cox stwierdzono, że związek między BMI a czasem do CVD jest statystycznie istotny z estymacją parametru 0,02312 (p=0,0175) w stosunku do jednostkowej zmiany BMI.
jeśli użyjemy estymatora parametru, mamy współczynnik ryzyka 1,023 z przedziałem ufności (1,004-1,043)., Ponieważ modelujemy BMI jako predyktor ciągły, interpretacja współczynnika ryzyka dla CVD jest względna do jednostkowej zmiany BMI (przypomnienie BMI jest mierzone jako stosunek wagi w kilogramach do wzrostu w metrach do kwadratu). Jednostkowy wzrost BMI wiąże się ze wzrostem oczekiwanego zagrożenia o 2,3%.
aby ułatwić interpretację, Załóżmy, że tworzymy 3 kategorie wagi zdefiniowane przez BMI uczestnika.
- prawidłowa waga jest definiowana jako BMI< 25,0,
- nadwaga jako BMI między 25,0 A 29,9, a
- otyłość jako BMI przekraczająca 29,9.,
w próbie jest 1651 (42%) uczestników, którzy spełniają definicję wagi normalnej, 1648 (42%), którzy spełniają definicję nadwagi, i 638 (16%), którzy spełniają definicję otyłości. Poniżej przedstawiono liczbę zdarzeń CVD w każdej z 3 grup.,
Group |
Number of Participants |
Number (%) of CVD Events |
---|---|---|
Normal Weight |
1651 |
202 (12.,2%) |
Overweight |
1648 |
241 (14.6%) |
Obese |
638 |
100 (15.7%) |
The incidence of CVD is higher in participants classified as overweight and obese as compared to participants of normal weight.,
obecnie stosujemy analizę regresji zagrożeń proporcjonalnych Cox, aby maksymalnie wykorzystać dane dotyczące wszystkich uczestników badania. W poniższej tabeli przedstawiono szacunki parametrów, wartości p, współczynniki ryzyka i 95% przedziały ufności dla współczynników ryzyka, gdy weźmiemy pod uwagę same grupy wagowe( model nieskorygowany), kiedy dostosowujemy się do wieku i płci oraz kiedy dostosowujemy się do wieku, płci i innych znanych klinicznych czynników ryzyka incydentu CVD.
dwa ostatnie modele są modelami wielozmiennymi i są wykonywane w celu oceny związku między wagą a incydentalnym CVD dostosowaniem do czynników zakłócających., Ponieważ mamy trzy grupy wagowe, potrzebujemy dwóch zmiennych obojętnych lub zmiennych wskaźnikowych, aby reprezentować trzy grupy. W modelach uwzględniamy wskaźniki nadwagi i otyłości, a normalną wagę traktujemy jako grupę odniesienia.
*
w modelu niezrównanym istnieje zwiększone ryzyko wystąpienia CVD u osób z nadwagą w porównaniu z prawidłową masą ciała oraz u osób otyłych w porównaniu z prawidłową masą ciała (współczynniki ryzyka 1, 215 i 1.,310, odpowiednio). Jednakże, po dostosowaniu do wieku i płci, nie ma statystycznie istotnej różnicy między uczestnikami z nadwagą i prawidłową masą ciała pod względem ryzyka chorób sercowo-naczyniowych (współczynnik ryzyka = 1,067, p=0,5038). To samo dotyczy modelu dostosowującego się do wieku, płci i klinicznych czynników ryzyka. Jednak po dostosowaniu różnica w ryzyku CVD pomiędzy otyłymi i prawidłową masą ciała uczestników pozostaje statystycznie istotna, przy około 30% wzroście ryzyka CVD wśród otyłych uczestników w porównaniu do uczestników o prawidłowej masie ciała.,
powrót do góry / Poprzednia strona / Następna strona