Cox Proporsjonal Farer regresjonsanalyser
Survival analysis metoder kan også utvides til å vurdere flere risikofaktorer samtidig som ligner multippel lineær og multippel logistisk regresjonsanalyse som beskrevet i moduler for å diskutere Forvirrende, Effekt Endring, Sammenheng, og Multivariabel Metoder. En av de mest populære regresjon teknikker for å overleve analyse er Cox proporsjonal farer regresjon, som er vant til å forholde seg flere risikofaktorer eller eksponeringer, anses samtidig, til overlevelse tid., I en Cox proporsjonal farer regresjonsmodell, mål på effekt er fare pris, som er risikoen for å mislykkes (dvs. risikoen eller sannsynligheten for lidelse tilfelle av interesse), gitt at deltakeren har overlevd opp til en bestemt tid. En sannsynlighet må ligge i intervallet 0 til 1. Men faren representerer forventet antall hendelser per tidsenhet. Som et resultat, er det fare i en gruppe kan overskride 1. For eksempel, hvis det er fare 0.2 ved tid t og tiden enheter er måneder, deretter i gjennomsnitt på 0,2 hendelser er forventet per person på risiko per måned., En annen tolkning er basert på gjensidige i fare. For eksempel, 1/0.2 = 5, som er forventet hendelse-fri tid (5 måneder) per person i fare.
I de fleste situasjoner, vi er interessert i å sammenligne grupper med hensyn til sine farer, og vi bruker en hazard ratio, som er analog til en odds ratio i innstillingen av multippel logistisk regresjonsanalyse. Fare forholdet kan være beregnet ut fra de data vi organiserer for å gjennomføre log-rank test., Spesielt hazard ratio er forholdet mellom totalt antall observert forventet hendelser i to uavhengige sammenligning av grupper:
I noen studier, skillet mellom utsatt eller behandlet i forhold til unexposed eller kontroll-gruppene er klare. I andre studier er det ikke., I sistnevnte tilfelle, enten som gruppe kan vises i teller og tolkningen av hazard ratio er da risikoen for hendelsen i gruppe i telleren i forhold til risikoen for hendelsen i konsernet i nevneren.
I Eksempel 3 er det to aktive behandlinger blir sammenlignet (kjemoterapi før kirurgi versus kjemoterapi etter operasjonen). Følgelig, det gjør ikke saken som vises i telleren av hazard ratio., Ved hjelp av data i Eksempel 3, fare forholdet er beregnet som:
Dermed risikoen for død er 4.870 ganger høyere i kjemoterapi før operasjonen gruppen sammenlignet med cellegift etter operasjonen gruppe.
Eksempel 3 undersøkt foreningen av én uavhengig variabel (kjemoterapi før eller etter operasjonen) på overlevelse. Men, det er ofte av interesse å vurdere sammenhengen mellom flere risikofaktorer, anses samtidig, og overlevelse tid., En av de mest populære regresjon teknikker for å overleve utfall er Cox proporsjonal farer regresjonsanalyser. Det er flere viktige forutsetninger for riktig bruk av Cox proporsjonal farer regresjonsmodell, inkludert
- uavhengighet av overlevelse ganger mellom forskjellige individer i prøven,
- en multiplicative forholdet mellom prediktorer og fare (i motsetning til en lineær en slik tilfellet var med multippel lineær regresjonsanalyse, som er diskutert i mer detalj nedenfor), og
- en konstant fare forhold over tid.,
Cox proporsjonal farer regresjonsmodell kan skrives slik:
hvor h(t) er forventet fare ved tid t, h0(t) er grunnlinjen fare og representerer fare når alle prediktorer (eller uavhengige variabler) X1, X2 , Xp, er lik null. Legg merke til at den forventede fare (dvs., h(t)), eller frekvensen av lidelsen tilfelle av interesse i det neste øyeblikk, er produktet av baseline fare (h0(t)) og den eksponentielle funksjonen av lineær kombinasjon av de beste prediktorer., Dermed prediktorer har en multiplicative eller proporsjonal effekt på spådd fare.
Vurdere en enkel modell med en prediktor, X1., Cox proporsjonal farer modellen er:
noen Ganger modellen er uttrykt på en annen måte, om den relative hazard, som er forholdet i fare ved tid t til referansebanen fare, risiko faktorer:
Vi kan ta den naturlige logaritmen (ln) til hver side av Cox proporsjonal farer regresjonsmodell, til å produsere følgende som knytter logg av den relative fare for en lineær funksjon av prediktorer., Legg merke til at høyre side av ligningen ser ut som de mer kjente lineær kombinasjon av prediktorer eller risikofaktorer (som sett i multippel lineær regresjonsmodell).
I praksis, interesse ligger i assosiasjoner mellom hver av risikofaktorene eller prediktorer (X1, X2, …, Xp) og utfallet. Foreninger er kvantifisert ved regresjon koeffisienter koeffisienter (b1, b2, … bp)., Den teknikk for å estimere regresjon koeffisientene i en Cox proporsjonal farer regresjonsmodell er utenfor omfanget av denne teksten, og er beskrevet i Cox og Oakes.9 Her har vi fokus på tolkning. De estimerte koeffisientene i Cox proporsjonal farer regresjonsmodell, b1, for eksempel, representerer endringen i forventet logg av hazard ratio i forhold til en enhet endring i X1 og holder alle andre prediktorer konstant.
antilog av en estimert regresjons-koeffisient, exp(bi), og produserer en hazard ratio. Hvis en prediktor er dichotomous (f.eks.,, X1 er en indikator på utbredt kardiovaskulær sykdom eller mannlig sex) så exp(b1) er hazard ratio sammenligne risikoen for hendelsen for deltakere med X1=1 (f.eks., utbredt og hjerte-og karsykdommer eller mannlige kjønn) for deltakere med X1=0 (f.eks., gratis for kardiovaskulær sykdom eller kvinnelige sex).
Hvis hazard ratio for en prediktor er nær 1 som prediktor ikke påvirker overlevelse. Hvis hazard ratio er mindre enn 1, og deretter prediktor er beskyttende (dvs.,, assosiert med bedre overlevelse) og hvis det ideelle forholdet er større enn 1, og deretter prediktor er assosiert med økt risiko (eller redusert overlevelse).
Tester av hypotesen som er brukt for å vurdere om det er statistisk signifikante assosiasjoner mellom prediktorer og tid til hendelsen. Eksemplene som følger viser disse testene og deres tolkning.
Cox proporsjonal farer modellen kalles en semi-parametrisk modell, fordi det er ingen forutsetninger om formen på baseline fare funksjon. Det er imidlertid andre forutsetninger som nevnt ovenfor (dvs.,, uavhengighet, endringer i prediktorer produsere proporsjonal endringer i fare, uavhengig av tid, og en lineær sammenheng mellom den naturlige logaritmen av den relative fare og prediktorer). Det er andre regresjonsmodeller benyttes i overlevelse analyse som forutsetter bestemte distribusjoner for overlevelse ganger som den eksponentielle, Weibull, Gompertz og log-normal distributions1,8. Den eksponentiell regresjon overlevelse modell, for eksempel, tar utgangspunkt i at fare-funksjonen er konstant., Andre distribusjoner anta at risikoen er økende over tid, synkende over tid, eller ved å øke først, og deretter synkende. Eksempel 5 vil illustrere estimering av en Cox proporsjonal farer regresjonsmodell og diskutere tolkningen av regresjon koeffisienter.
Eksempel:
En analyse er gjennomført for å undersøke forskjeller i alle-gi dødelighet mellom menn og kvinner som deltar i Framingham Heart Study justering for alder. Totalt 5,180 deltakere i alderen 45 år og eldre er fulgt frem til tidspunktet for dødsfallet eller opp til 10 år, avhengig av hva som kommer først., Førti seks prosent av utvalget er menn, gjennomsnittsalderen i utvalget er 56.8 år (standardavvik = 8.0 år) og alderen spenner fra 45 til 82 år ved starten av studien. Det er en total av 402 dødsfall observert blant 5,180 deltakere. Beskrivende statistikk er vist nedenfor på alder og kjønn av deltakerne ved starten av studien klassifisert etter om de dør eller ikke dø under oppfølging periode.,
|
Die (n=402) |
Do Not Die (n=4778) |
---|---|---|
Mean (SD) Age, years |
65.6 (8.7) |
56.1 (7.,5) |
N (%) Mann |
221 (55%) |
2145 (45%) |
Vi nå anslår en Cox proporsjonal farer regresjons-og relatere en indikator på mannlig kjønn og alder i år, til tid til døden. Parameter estimater er generert i SAS ved hjelp av SAS Cox proporsjonal farer regresjon procedure12 og er vist nedenfor sammen med sine p-verdier.,
Risk Factor |
Parameter Estimate |
P-Value |
---|---|---|
Age, years |
0.11149 |
0.0001 |
Male Sex |
0.,67958 |
0.0001 |
Merk at det er en positiv sammenheng mellom alder og all-cause mortality og mellom mannlige kjønn og alle-gi dødelighet (dvs., det er økt risiko for død for eldre deltakere og for menn).
Igjen, parameter estimater representerer økningen i forventet logg av den relative fare for hver enhet økning i prediktor, holde andre prediktorer konstant. Det er en 0.,11149 enhet økning i forventet logg av den relative fare for hvert års økning i alder, holder sex konstant, og en 0.67958 enhet økning i forventet logg av den relative fare for menn i forhold til kvinner, holde alder konstant.
For interpretability, vi beregne fare prosenter av exponentiating parameter estimater. For alder, exp(0.11149) = 1.118. Det er en 11.8% økning i forventet fare i forhold til ett års økning i alder (eller forventet fare er 1.12 ganger høyere i en person som er ett år eldre enn en annen), holder sex konstant. På samme måte, exp(0.67958) = 1.,973. Forventet fare er 1.973 ganger høyere hos menn i forhold til kvinner, holde alder konstant.
Tenk vi vurdere ytterligere risikofaktorer for all-cause mortality og anslår en Cox proporsjonal farer regresjonsmodell om et utvidet sett av risikofaktorer tid til døden. Parameter estimater er igjen generert i SAS ved hjelp av SAS Cox proporsjonal farer regresjon prosedyre og er vist nedenfor sammen med sine p-verdier.12 Også følger nedenfor er fare forholdstall sammen med sine 95% konfidensintervaller.,
Alle av parameter estimater er beregnet å ta den andre prediktorer i betraktning. Etter at regnskap for alder, kjønn, blodtrykk og røyking status, det er ingen statistisk signifikante assosiasjoner mellom totalt serum-kolesterol og all-cause mortality eller mellom diabetes og all-cause mortality. Dette er ikke å si at disse risikofaktorene er ikke forbundet med all-cause mortality; deres mangel på betydning er sannsynligvis på grunn av confounding (sammenhenger mellom risikofaktorer vurdert). Legg merke til at for de statistisk signifikante risikofaktorer (dvs.,, alder, kjønn, systolisk blodtrykk og nåværende røykere status), at 95% – konfidensintervaller for hazard ratios ikke inkluderer 1 (null-verdi). I kontrast, 95% – konfidensintervaller for de ikke-signifikante risikofaktorer (totalt serum-kolesterol og diabetes) inkluderer null-verdi.
Eksempel:
En prospektiv kohortstudie drives for å vurdere sammenhengen mellom kroppsmasseindeks og tid til hendelsen kardiovaskulær sykdom (CVD). Ved baseline, deltakere» body mass index målt sammen med andre kjente kliniske risikofaktorer for kardiovaskulær sykdom (f.eks.,, alder, kjønn, blodtrykk). Deltakerne blir fulgt i opptil 10 år for utvikling av CVD. I studiet av n=3,937 deltakere, 543 utvikle CVD i løpet av studiet observasjonsperioden. I en Cox proporsjonal farer regresjonsanalyse, finner vi sammenheng mellom BMI og tid til å CVD er statistisk signifikante med en parameter estimat av 0.02312 (p=0.0175) i forhold til en enhet endring i BMI.
Hvis vi exponentiate parameter estimat, vi har en hazard ratio av 1.023 med et konfidensintervall på (1.004-1.043)., Fordi vi modellen BMI som en kontinuerlig prediktor, tolkningen av hazard ratio for CVD er i forhold til en enhet endring i BMI (husker BMI er målt som forholdet mellom vekt i kilo og høyde i meter kvadrat). En enhet økning i BMI er assosiert med en 2,3% økning i forventet fare.
for Å lette tolkningen, antar vi lage 3 kategorier av vekt definert av deltaker»s BMI.
- Normal vekt er definert som BMI < 25.0,
- Overvektige som BMI mellom 25.0 og 29.9, og
- Overvektige som BMI overstiger 29.9.,
I prøven, det er 1,651 (42%) deltakere som oppfyller definisjonen av normal vekt, 1,648 (42%) som oppfyller definisjonen av over vekt, og 638 (16%) som oppfyller definisjonen av fedme. Tallene for CVD hendelser i hver av de 3 gruppene er vist nedenfor.,
Group |
Number of Participants |
Number (%) of CVD Events |
---|---|---|
Normal Weight |
1651 |
202 (12.,2%) |
Overweight |
1648 |
241 (14.6%) |
Obese |
638 |
100 (15.7%) |
The incidence of CVD is higher in participants classified as overweight and obese as compared to participants of normal weight.,
Vi nå bruke Cox proporsjonal farer regresjonsanalyser for å gjøre maksimal bruk av data på alle deltakerne i studien. Følgende tabell viser parameter estimater, p-verdier, hazard ratio og 95% konfidensintervall for de farer forholdstall når vi vurdere vekt grupper alene (ikke-justerte modellen), når vi justerer for alder og kjønn, og når vi justerer for alder, kjønn og andre kjente kliniske risikofaktorer for hendelsen CVD.
De to sistnevnte modellene er multivariabel modeller og er utført for å vurdere sammenhengen mellom vekt og hendelsen CVD justere for confounders., Fordi vi har tre vekt grupper, trenger vi to dummy-variabler eller indikator-variabler for å representere de tre gruppene. I de modellene vi inkluderer indikatorer for overvektige og vurdere normal vekt referanse-gruppe.
* Justert for alder, kjønn, systoliske blodtrykket, behandling for hypertensjon, nåværende røyking status, totalt serum-kolesterol.
I den justerte modellen, er det en økt risiko for CVD i overvektige deltakere i forhold til normal vekt og fedme i forhold til normal vekt deltakerne (hazard ratio av 1.215 og 1.,310, henholdsvis). Imidlertid, etter justering for alder og kjønn, det er ingen statistisk signifikant forskjell mellom overvekt og normal vekt deltakerne i form av risiko for CVD (hazard ratio = 1.067, p=0.5038). Det samme er tilfelle i modellen for å justere for alder, kjønn og kliniske risikofaktorer. Imidlertid, etter justering, forskjellen i risiko for CVD mellom overvektige og normal vekt deltakerne er fortsatt statistisk signifikante, med ca 30% økning i risiko for CVD blant overvektige deltakere i forhold til deltakere med normal vekt.,
tilbake til toppen | forrige side | neste side