Cox Proportional Hazards Regression Analyse
Overlevelse analysemetoder kan også udvides til at vurdere flere risikofaktorer samtidigt lignende til flere lineære og multipel logistisk regressionsanalyse, som er beskrevet i modulerne diskutere Confounding, Effekt Modifikation, Korrelation, og Multivariable Metoder. En af de mest populære regressionsteknikker til overlevelsesanalyse er co.proportional ha .ards regression, som bruges til at relatere flere risikofaktorer eller eksponeringer, der betragtes samtidigt, til overlevelsestid., I en co.proportional ha .ards regressionsmodel er effektmåleren farehastigheden, som er risikoen for fiasko (dvs. risikoen eller sandsynligheden for at lide begivenheden af interesse), da deltageren har overlevet op til et bestemt tidspunkt. En sandsynlighed skal ligge i området 0 til 1. Faren repræsenterer dog det forventede antal hændelser pr. Som følge heraf kan faren i en gruppe overstige 1. For eksempel, hvis faren er 0, 2 på tidspunktet t, og tidsenhederne er måneder, forventes der i gennemsnit 0, 2 begivenheder pr., En anden fortolkning er baseret på den gensidige fare. For eksempel 1/0, 2 = 5, hvilket er den forventede begivenhed-fritid (5 måneder) pr.
I de fleste situationer, vi er interesseret i at sammenligne grupper med hensyn til deres farer, og vi bruger en hazard ratio, som er svarende til en odds ratio på indstilling af multipel logistisk regressionsanalyse. Fareforholdet kan estimeres ud fra de data, vi organiserer for at gennemføre lograngeringstesten., Specifikt, den hazard ratio er forholdet mellem det samlede antal observerede, at forventede begivenheder i to uafhængige sammenligning grupper:
I nogle undersøgelser, er sondringen mellem den udsatte eller behandlet i forhold til den ueksponerede eller kontrol grupper er klar. I andre undersøgelser er det ikke., I sidstnævnte tilfælde kan begge grupper vises i tælleren, og fortolkningen af fareforholdet er derefter risikoen for begivenhed i gruppen i tælleren sammenlignet med risikoen for begivenhed i gruppen i nævneren.i Eksempel 3 er der to aktive behandlinger, der sammenlignes (kemoterapi før operation versus kemoterapi efter operation). Det betyder derfor ikke noget, som fremgår af tælleren for fareforholdet., At bruge data i Eksempel 3, hazard ratio er beregnet som:
Således, at risikoen for død er 4.870 gange højere i kemoterapi før operation gruppe, som i forhold til kemoterapi efter operationen gruppe.eksempel 3 undersøgte sammenhængen mellem en enkelt uafhængig variabel (kemoterapi før eller efter operationen) ved overlevelse. Det er dog ofte af interesse at vurdere sammenhængen mellem flere risikofaktorer, der betragtes samtidigt, og overlevelsestid., En af de mest populære regressionsteknikker til overlevelsesresultater er co.proportional ha .ards regressionsanalyse. Der er flere vigtige forudsætninger for hensigtsmæssig brug af Cox proportional hazards regression model, herunder
- uafhængighed af overlevelse gange mellem forskellige individer i prøven,
- en multiplikativ sammenhæng mellem indikatorer og faren (som modsætning til en lineær som det var tilfældet med multipel lineær regressionsanalyse, der er behandlet mere udførligt nedenfor), og
- en konstant hazard ratio over tid.,
Cox proportional hazards regression model kan skrives som følger:
hvor h(t) er den forventede risiko på tidspunkt t, h0(t) er baseline hazard, og repræsenterer en fare, når alle prædiktorer (eller uafhængige variable) X1, X2 , Xp er lig nul. Bemærk, at den forudsagte fare (dvs, h (T)), eller satsen for lidelse tilfælde af interesse i det næste øjeblik, er produktet af baseline fare (h0(t)) og den eksponentielle funktion af den lineære kombination af prædiktorer., Forudsigelserne har således en multiplikativ eller proportional virkning på den forudsagte fare.
overvej en simpel model med en forudsigelse ,11., Cox proportional hazards model er:
nogle gange er den model, udtrykkes forskelligt, om den relative risiko, som er forholdet i fare på tidspunkt t i forhold til den hidtidige risiko, at de risikofaktorer, som er:
Vi kan tage den naturlige logaritme (ln) i hver side af Cox proportional hazards regression-model, til at fremstille følgende, som vedrører log af den relative risiko for en lineær funktion af prædiktorer., Bemærk, at højre side af ligningen ligner den mere velkendte lineære kombination af forudsigere eller risikofaktorer (som det ses i den multiple lineære regressionsmodel).
I praksis, interesse ligger i de foreninger, mellem hver af de risikofaktorer, eller prædiktorer (X1, X2, … ,pp) og resultatet. Foreningerne kvantificeres ved regressionskoefficienter koefficienter (b1, b2,…, bp)., Teknikken til at estimere regressionskoefficienterne i en co.proportional ha .ards regressionsmodel er uden for rammerne af denne tekst og er beskrevet i Co. og Oakes.9 her fokuserer vi på fortolkning. De estimerede koefficienter i Cox proportional hazards regression model, b1, for eksempel, repræsenterer ændringen i det forventede log-hazard ratio i forhold til en enhed ændring i X1, holde alle andre prædiktorer konstant.
antiloggen af en estimeret regressionskoefficient, e .p(bi), frembringer et Ha .ard ratio. Hvis en forudsigelse er dikotom (f. eks., X1 er en indikator for udbredt hjerte-kar-sygdom eller mandlige køn), så er exp(b1) er det hazard ratio sammenligne risikoen for event for deltagere med X1=1 (fx, almindeligt kendt hjerte-kar-sygdom eller mandlige køn) til deltagere med X1=0 (fx, fri for hjerte-kar-sygdom eller kvindelige køn).
Hvis ha .ard ratio for en prediktor er tæt på 1, påvirker denne prediktor ikke overlevelsen. Hvis fareforholdet er mindre end 1, er forudsigeren beskyttende (dvs ., større end 1, er forudsigeren forbundet med øget risiko (eller nedsat overlevelse).
test af hypotese bruges til at vurdere, om der er statistisk signifikante sammenhænge mellem forudsigere og tid til begivenhed. De følgende eksempler illustrerer disse test og deres fortolkning.
Cox proportional hazards model kaldes en semi-parametrisk model, fordi der ikke er nogen antagelser om formen af baseline hazard funktion. Der er dog andre antagelser som nævnt ovenfor (dvs .,, uafhængighed, ændringer i prædiktorer producere proportionale ændringer i fare, uanset tid, og en lineær sammenhæng mellem den naturlige logaritme af den relative risiko, og den prædiktorer). Der er andre regressionsmodeller, der anvendes i overlevelsesanalyse, der antager specifikke fordelinger for overlevelsestiderne, såsom eksponentiel, Weieibull,Gompert.og log-normale fordelinger1, 8. Den eksponentielle regressionsoverlevelsesmodel antager for eksempel, at farefunktionen er konstant., Andre distributioner antager, at faren stiger over tid, falder over tid eller øges oprindeligt og derefter falder. Eksempel 5 vil illustrere estimering af en co.proportional farer regressionsmodel og diskutere fortolkningen af regressionskoefficienterne.
eksempel:
der udføres en analyse for at undersøge forskelle i dødelighed af alle årsager mellem mænd og kvinder, der deltager i Framingham Heart Study adjusting for age. I alt 5.180 deltagere i alderen 45 år og ældre følges indtil dødstidspunktet eller op til 10 år, alt efter hvad der kommer først., Fyrre seks procent af prøven er mandlige, Den gennemsnitlige alder af prøven er 56,8 år (standardafvigelse = 8,0 år) og alderen spænder fra 45 Til 82 år i starten af undersøgelsen. Der er i alt 402 dødsfald observeret blandt 5,180 deltagere. Beskrivende statistikker er vist nedenfor om deltagernes alder og køn i starten af undersøgelsen klassificeret efter om de dør eller ikke dør i opfølgningsperioden.,
|
Die (n=402) |
Do Not Die (n=4778) |
---|---|---|
Mean (SD) Age, years |
65.6 (8.7) |
56.1 (7.,5) |
N (%) Mand |
221 (55%) |
2145 (45%) |
Vi nu estimere en Cox proportional hazards regression model og vedrører en indikator for mandlige køn og alder, i år, at tid til døden. Parameter estimater er genereret i SAS ved hjælp af SAS Cox proportional hazards regression procedure12 og er vist nedenfor sammen med deres p-værdier.,
Risk Factor |
Parameter Estimate |
P-Value |
---|---|---|
Age, years |
0.11149 |
0.0001 |
Male Sex |
0.,67958 |
0.0001 |
Bemærk, at der er en positiv sammenhæng mellem alder og mortalitet og mellem mandlige køn og mortalitet (dvs, at der er øget risiko for død for ældre deltagere, og for mænd).
igen repræsenterer parameterestimaterne stigningen i den forventede log over den relative fare for hver enkelt enhedsforøgelse i forudsigeren og holder andre forudsigere konstant. Der er en 0.,11149 enhed stigning i den forventede log af den relative risiko for hver enkelt år stigning i alder, holder sex konstant, og en 0.67958 enhed stigning i forventet log af den relative risiko for mænd i forhold til kvinder, holde alder konstant.
for fortolkbarhed beregner vi fareforhold ved at eksponentiere parameterestimaterne. For alder, e .p (0.11149) = 1.118. Der er en 11.8% stigning i den forventede risiko i forhold til en et-år stigning i alder (eller den forventede risiko er 1.12 gange højere i en person, der er et år ældre end den anden), holder sex konstant. Tilsvarende e .p (0,67958) = 1.,973. Den forventede fare er 1, 973 gange højere hos mænd sammenlignet med kvinder, hvilket holder alderen konstant.
Antag, at vi overvejer yderligere risikofaktorer for dødelighed af alle årsager og estimerer en co.proportional ha .ards regressionsmodel, der relaterer et udvidet sæt risikofaktorer til tid til død. Parameterestimaterne genereres igen i SAS ved hjælp af SAS Co.proportional ha .ards regressionsprocedure og vises nedenfor sammen med deres p-værdier.12 også inkluderet nedenfor er Ha .ard ratio sammen med deres 95% konfidensintervaller.,
alle parameterestimaterne estimeres under hensyntagen til de andre forudsigere. Efter regnskab for alder, køn, blodtryk og rygning status, er der ingen statistisk signifikante sammenhænge mellem total serum kolesterol og mortalitet eller mellem diabetes og mortalitet. Dette betyder ikke, at disse risikofaktorer ikke er forbundet med dødelighed af alle årsager; deres manglende betydning skyldes sandsynligvis forvirrende (indbyrdes forhold mellem de betragtede risikofaktorer). Bemærk, at for de statistisk signifikante risikofaktorer (dvs .,, alder, køn, systolisk blodtryk og nuværende rygestatus), at 95% konfidensintervallerne for fareforholdene ikke inkluderer 1 (nullværdien). I modsætning hertil inkluderer 95% konfidensintervaller for de ikke-signifikante risikofaktorer (total serumcholesterol og diabetes) nulværdien.
eksempel:
en prospektiv kohortundersøgelse køres for at vurdere sammenhængen mellem body mass inde.og time to incident cardiovascular disease (CVD). Ved baseline måles deltagerne” body mass inde ” sammen med andre kendte kliniske risikofaktorer for hjerte-kar-sygdomme (f. eks.,, alder, køn, blodtryk). Deltagerne følges i op til 10 år for udvikling af CVD. I undersøgelsen af n=3.937 deltagere Udvikler 543 CVD i studieobservationsperioden. I en Cox proportional hazards regression analyse, finder vi association mellem BMI og tid til at CVD statistisk signifikant med en parameter estimat af 0.02312 (p=0.0175) i forhold til en enhed ændring i BMI.
Hvis vi eksponentierer parameterestimatet, har vi et Ha .ard ratio på 1.023 med et konfidensinterval på (1.004-1.043)., Fordi vi modellerer BMI som en kontinuerlig forudsigelse, er fortolkningen af Ha .ard ratio for CVD i forhold til en enhedsændring i BMI (tilbagekaldelse BMI måles som forholdet mellem vægt i kg og højde i meter kvadreret). En stigning i BMI på BN enhed er forbundet med en stigning på 2,3% i den forventede fare.
for at lette fortolkningen, formoder vi skaber 3 kategorier af vægt defineret af deltageren”s BMI.
- Normal vægt er defineret som BMI < 25.0,
- Overvægt som BMI mellem 25.0 og 29,9, og
- Overvægtige som BMI over 29.9.,
I den prøve, der er 1,651 (42%) af deltagerne, der opfylder definitionen af normal vægt, 1,648 (42%), som opfylder definitionen af over vægt, og 638 (16%), som opfylder definitionen af overvægtige. Antallet af CVD begivenheder i hver af de 3 grupper er vist nedenfor.,
Group |
Number of Participants |
Number (%) of CVD Events |
---|---|---|
Normal Weight |
1651 |
202 (12.,2%) |
Overweight |
1648 |
241 (14.6%) |
Obese |
638 |
100 (15.7%) |
The incidence of CVD is higher in participants classified as overweight and obese as compared to participants of normal weight.,
Vi bruger nu Co.proportional ha .ards regressionsanalyse for at udnytte dataene om alle deltagere i undersøgelsen maksimalt. Den følgende tabel viser de parameter estimater, p-værdier, hazard ratio og 95% konfidensintervaller for de farer, nøgletal, når vi overveje vægten grupper alene (ukorrigerede model), når vi justerer for alder og køn, og når vi justerer for alder, køn og andre kendte risikofaktorer for hændelsen CVD.
de to sidstnævnte modeller er multivariable modeller og udføres for at vurdere sammenhængen mellem vægt og incident CVD justering for confounders., Fordi vi har tre vægtgrupper, vi har brug for to dummy variabler eller indikator variabler til at repræsentere de tre grupper. I modellerne inkluderer vi indikatorerne for overvægt og overvægt og overvejer normalvægt referencegruppen.
* justeret for alder, køn, systolisk blodtryk, behandling for hypertension, nuværende rygestatus, total serumcholesterol.
I den ukorrigerede model, der er en øget risiko for CVD hos overvægtige deltagere sammenlignet med normal vægt og overvægtige sammenlignet med normal vægt deltagere (hazard ratios 1.215 og 1.,310, henholdsvis). Men efter justering for alder og køn, er der ingen statistisk signifikant forskel mellem overvægt og normal vægt deltagerne i form af CVD-risiko (hazard ratio = 1.067, p=0.5038). Det samme er tilfældet i modellen justering for alder, køn og de kliniske risikofaktorer. Efter justering forbliver forskellen i CVD-risiko mellem overvægtige og deltagere i normal vægt statistisk signifikant, med cirka en 30% stigning i risikoen for CVD blandt overvægtige deltagere sammenlignet med deltagere med normal vægt.,
Tilbage til toppen | forrige side / Næste side