Cox Proportional Hazards regressionsanalys
Survival analysis methods kan också utökas för att bedöma flera riskfaktorer samtidigt liknande multipel linjär och multipel logistisk regressionsanalys som beskrivs i modulerna som diskuterar Konfounding, Effektmodifiering, korrelation och Multivariable metoder. En av de mest populära regressionsmetoderna för överlevnadsanalys är Cox proportional hazards regression, som används för att relatera flera riskfaktorer eller exponeringar, betraktade samtidigt, till överlevnadstid., I en Cox proportionell riskregressionsmodell är effektmåttet riskfrekvensen, vilket är risken för fel (dvs. risken eller sannolikheten för att drabbas av intressehändelsen), eftersom deltagaren har överlevt upp till en viss tid. En sannolikhet måste ligga i intervallet 0 till 1. Faran representerar dock det förväntade antalet händelser per en tidsenhet. Som ett resultat kan faran i en grupp överstiga 1. Till exempel, om faran är 0,2 vid tiden t och tidsenheterna är månader, förväntas i genomsnitt 0,2 händelser per person i riskzonen per månad., En annan tolkning är baserad på den ömsesidiga risken. Till exempel 1/0.2 = 5, vilket är den förväntade händelsefritiden (5 månader) per person i riskzonen.
i de flesta situationer är vi intresserade av att jämföra grupper med avseende på deras faror, och vi använder ett farokvot, vilket är analogt med ett oddsförhållande vid inställningen av multipel logistisk regressionsanalys. Riskförhållandet kan beräknas från de data vi organiserar för att utföra log rank-testet., Riskkvoten är i synnerhet förhållandet mellan det totala antalet observerade förväntade händelser i två oberoende jämförelsegrupper:
i vissa studier är skillnaden mellan de exponerade eller behandlade jämfört med de oexponerade eller kontrollgrupperna tydlig. I andra studier är det inte., I det senare fallet kan endera gruppen visas i täljaren och tolkningen av riskförhållandet är då risken för händelse i gruppen i täljaren jämfört med risken för händelse i gruppen i nämnaren.
I exempel 3 jämförs två aktiva behandlingar (kemoterapi före operation mot kemoterapi efter operation). Följaktligen spelar det ingen roll vilken som visas i täljaren av riskförhållandet., Med hjälp av data i Exempel 3 beräknas riskkvoten som:
risken för dödsfall är således 4,870 gånger högre i kemoterapin före operationsgruppen jämfört med kemoterapin efter operationsgruppen.
exempel 3 undersökte föreningen av en enda oberoende variabel (kemoterapi före eller efter operation) på överlevnad. Det är dock ofta av intresse att bedöma sambandet mellan flera riskfaktorer, betraktas samtidigt, och överlevnadstid., En av de mest populära regressionsmetoderna för överlevnadsresultat är Cox proportional hazards regressionsanalys. Det finns flera viktiga antaganden för lämplig användning av Cox proportional hazards regression model, inklusive
- oberoende av överlevnadstider mellan olika individer i provet,
- ett multiplikativt förhållande mellan prediktorer och fara (i motsats till en linjär som var fallet med flera linjär regressionsanalys, diskuteras mer detaljerat nedan), och
- en konstant riskkvot över tiden.,
regressionsmodellen för Cox proportional hazards kan skrivas enligt följande:
där h(t) är den förväntade faran vid tidpunkten t, H0(t) är baseline hazard och utgör faran när alla prediktorer (eller oberoende variabler) är farliga.) x1, x2 , XP är lika med noll. Observera att den förutsagda faran(dvs. h (t)), eller graden av lidande händelsen av intresse i nästa ögonblick, är produkten av baseline hazard(h0 (t)) och exponentiell funktion av den linjära kombinationen av prediktorer., Prediktorerna har således en multiplikativ eller proportionell effekt på den förutsagda faran.
Tänk på en enkel modell med en prediktor, X1., Modellen Cox proportional hazards är:
ibland uttrycks modellen annorlunda och relaterar till den relativa faran, vilket är förhållandet mellan risken vid tidpunkten t och utgångsrisken, till riskfaktorerna:
vi kan ta den naturliga logaritmen (ln) på varje sida av COX proportional hazards regressionsmodell, för att producera följande som relaterar loggen av den relativa faran till en linjär funktion hos prediktörerna., Lägg märke till att den högra sidan av ekvationen ser ut som den mer kända linjära kombinationen av prediktorer eller riskfaktorer (som ses i multipel linjär regressionsmodell).
i praktiken ligger intresset i föreningarna mellan var och en av riskfaktorerna eller prediktörerna (X1, X2,… Xp) och resultatet. Föreningarna kvantifieras av regressionskoefficienterna koefficienter (b1, b2,…, bp)., Tekniken för att uppskatta regressionskoefficienterna i en Cox proportionell riskregressionsmodell ligger utanför denna text och beskrivs i Cox och Oakes.9 här fokuserar vi på Tolkning. De uppskattade koefficienterna i Cox proportional hazards regressionsmodell, b1, representerar till exempel förändringen i den förväntade loggen för riskkvoten i förhållande till en enhetsförändring i X1, som håller alla andra prediktorer konstanta.
antilogen för en beräknad regressionskoefficient, exp(bi), ger ett riskförhållande. Om en prediktor är dikotom (t. ex.,, X1 är en indikator på utbredd kardiovaskulär sjukdom eller manlig kön) då exp (b1) är riskförhållandet som jämför risken för händelse för deltagare med X1=1 (t.ex. utbredd kardiovaskulär sjukdom eller manlig kön) till deltagare med X1=0 (t. ex. fri från hjärt-kärlsjukdom eller kvinnlig kön).
om riskförhållandet för en prediktor är nära 1 påverkar inte prediktorn överlevnaden. Om riskförhållandet är mindre än 1, är prediktorn skyddande (dvs, är större än 1, då prediktorn är associerad med ökad risk (eller minskad överlevnad).
hypotestester används för att bedöma om det finns statistiskt signifikanta samband mellan prediktorer och tid till händelse. De exempel som följer illustrerar dessa tester och deras tolkning.
modellen Cox proportional hazards kallas en halvparametrisk modell, eftersom det inte finns några antaganden om formen på baslinjens farofunktion. Det finns dock andra antaganden som nämnts ovan (dvs.,, oberoende, förändringar i prediktorer ger proportionella förändringar i fara oavsett tid, och en linjär koppling mellan den naturliga logaritmen av den relativa faran och prediktorer). Det finns andra regressionsmodeller som används i överlevnadsanalys som antar specifika fördelningar för överlevnadstider som exponentiell, Weibull,Gompertz och log-normalfördelningar1, 8. Den exponentiella regressionsöverlevnadsmodellen förutsätter till exempel att farofunktionen är konstant., Andra fördelningar förutsätter att faran ökar över tiden, minskar över tiden eller ökar initialt och sedan minskar. Exempel 5 kommer att illustrera en uppskattning av en Cox proportionell riskregressionsmodell och diskutera tolkningen av regressionskoefficienterna.
exempel:
en analys utförs för att undersöka skillnader i allorsaksdödlighet mellan män och kvinnor som deltar i Framingham Heart Study justera för ålder. Totalt 5 180 deltagare i åldern 45 år och äldre följs fram till dödsfallet eller upp till 10 år, beroende på vilket som inträffar först., Fyrtiosex procent av provet är manliga, medelåldern för provet är 56,8 år (standardavvikelse = 8,0 år) och åldrarna varierar från 45 till 82 år i början av studien. Det finns totalt 402 dödsfall som observerats bland 5,180 deltagare. Beskrivande statistik visas nedan om deltagarnas ålder och kön i början av studien klassificerad av om de dör eller inte dör under uppföljningsperioden.,
|
Die (n=402) |
Do Not Die (n=4778) |
|
---|---|---|---|
Mean (SD) Age, years |
65.6 (8.7) |
56.1 (7.,5) |
|
N (%) hane |
221 (55%) |
2145 (45%) |
Vi uppskattar nu en Cox proportionell risk regressionsmodell och relaterar en indikator på manlig kön och ålder, i år, till döds. Parameterskattningarna genereras i SAS med hjälp av SAS Cox proportional hazards regression procedure12 och visas nedan tillsammans med deras p-värden.,
Risk Factor |
Parameter Estimate |
P-Value |
---|---|---|
Age, years |
0.11149 |
0.0001 |
Male Sex |
0.,67958 |
0,0001 |
Observera att det finns ett positivt samband mellan ålder och allorsaksdödlighet och mellan manlig kön och allorsakdödlighet (dvs det finns ökad risk för död för äldre deltagare och för män).
igen representerar parameterskattningarna ökningen av den förväntade loggen för den relativa risken för varje enhetsökning i prediktorn och håller andra prediktorer konstanta. Det finns en 0.,11149 enhetsökning i den förväntade loggen av den relativa faran för varje ett års ökning av ålder, håller könskonstant och en 0.67958 enhetsökning i förväntad logg av den relativa faran för män jämfört med kvinnor, håller ålderskonstant.
för tolkbarhet beräknar vi riskkvoterna genom att exponera parameterskattningarna. För ålder, exp (0.11149) = 1.118. Det finns en 11,8% ökning av den förväntade faran i förhållande till en ettårig ökning av ålder (eller den förväntade faran är 1.12 gånger högre hos en person som är ett år äldre än en annan), håller kön konstant. På samma sätt exp (0, 67958) = 1.,973. Den förväntade faran är 1.973 gånger högre hos män jämfört med kvinnor, som håller ålderskonstant.
Antag att vi överväger ytterligare riskfaktorer för allmortalitet och uppskattar en Cox proportionell riskregressionsmodell som relaterar till en utökad uppsättning riskfaktorer till döds. Parameterskattningarna genereras igen i SAS med hjälp av SAS Cox proportional hazards regression procedure och visas nedan tillsammans med deras p-värden.12 ingår också nedan är riskkvoterna tillsammans med deras 95% konfidensintervall.,
alla parameteruppskattningar beräknas med hänsyn till de andra prediktörerna. Efter att ha redovisat ålder, kön, blodtryck och rökningsstatus finns det inga statistiskt signifikanta föreningar mellan total serumkolesterol och allorsakdödlighet eller mellan diabetes och allorsakdödlighet. Detta är inte att säga att dessa riskfaktorer inte är förknippade med all-orsak dödlighet; deras brist på betydelse är sannolikt på grund av förbryllande (samband mellan de riskfaktorer som beaktas). Observera att för de statistiskt signifikanta riskfaktorerna (dvs.,, ålder, kön, systoliskt blodtryck och nuvarande rökstatus), att 95% konfidensintervall för riskkvoterna inte inkluderar 1 (nollvärdet). Däremot inkluderar 95% konfidensintervall för de icke-signifikanta riskfaktorerna (totalt serumkolesterol och diabetes) null-värdet.
exempel:
en prospektiv kohortstudie körs för att bedöma sambandet mellan body mass index och time to incident cardiovascular disease (CVD). Vid baslinjen mäts deltagarnas body mass index tillsammans med andra kända kliniska riskfaktorer för hjärt-kärlsjukdom (t. ex.,, ålder, kön, blodtryck). Deltagarna följs upp i upp till 10 år för utveckling av CVD. I studien av N=3 937 deltagare utvecklar 543 CVD under studieobservationsperioden. I en Cox proportional hazards regressionsanalys finner vi sambandet mellan BMI och tid till CVD statistiskt signifikant med en parameteruppskattning av 0.02312 (p=0.0175) i förhållande till en enhetsförändring i BMI.
om vi exponentierar parameteruppskattningen har vi ett riskförhållande på 1.023 med ett konfidensintervall på (1.004-1.043)., Eftersom vi modellerar BMI som en kontinuerlig prediktor är tolkningen av riskförhållandet för CVD i förhållande till en enhetsförändring i BMI (recall BMI mäts som förhållandet mellan vikt i kg och höjd i meter kvadrat). En en enhetsökning i BMI är förknippad med en 2, 3% ökning av den förväntade faran.
för att underlätta tolkningen, anta att vi skapar 3 viktkategorier som definieras av deltagarens BMI.
- Normal vikt definieras som BMI < 25,0,
- övervikt som BMI mellan 25,0 och 29,9, och
- överviktiga som BMI överstiger 29,9.,
i provet finns det 1,651 (42%) deltagare som uppfyller definitionen av normal vikt, 1,648 (42%) som uppfyller definitionen av övervikt och 638 (16%) som uppfyller definitionen av fetma. Antalet KARDIOVASKULÄRA händelser i alla 3 grupper visas nedan.,
Group |
Number of Participants |
Number (%) of CVD Events |
---|---|---|
Normal Weight |
1651 |
202 (12.,2%) |
Overweight |
1648 |
241 (14.6%) |
Obese |
638 |
100 (15.7%) |
The incidence of CVD is higher in participants classified as overweight and obese as compared to participants of normal weight.,
Vi använder nu Cox proportional hazards regressionsanalys för att maximera användningen av data om alla deltagare i studien. Följande tabell visar parameterskattningar, p-värden, riskförhållanden och 95% konfidensintervall för riskkvoterna när vi betraktar viktgrupperna ensamma (ojusterad modell), när vi justerar för ålder och kön och när vi justerar för ålder, kön och andra kända kliniska riskfaktorer för incident CVD.
de två senare modellerna är multivariabla modeller och utförs för att bedöma sambandet mellan vikt och incident CVD justering för confounders., Eftersom vi har tre viktgrupper behöver vi två dummyvariabler eller indikatorvariabler för att representera de tre grupperna. I modellerna inkluderar vi indikatorerna för övervikt och fetma och anser normal vikt referensgruppen.
* justerat för ålder, kön, systoliskt blodtryck, behandling för högt blodtryck, nuvarande rökstatus, totalt serumkolesterol.
i den ojusterade modellen finns det en ökad risk för CVD hos överviktiga deltagare jämfört med normal vikt och hos överviktiga jämfört med deltagare med normal vikt (riskförhållanden på 1.215 och 1.,310, respektive). Efter justering för ålder och kön finns det emellertid ingen statistiskt signifikant skillnad mellan överviktiga och normala viktdeltagare när det gäller CVD-risk (hazard ratio = 1.067, p=0.5038). Detsamma gäller i modellen som justerar för ålder, kön och de kliniska riskfaktorerna. Efter justering är dock skillnaden i CVD-risk mellan överviktiga och normalviktiga deltagare statistiskt signifikant, med ungefär en 30% ökning av risken för CVD bland överviktiga deltagare jämfört med deltagare med normal vikt.,
återgå till toppen / föregående sida / Nästa sida