Cox proportionele risico ‘ s regressieanalyse
Overlevingsanalysemethoden kunnen ook worden uitgebreid om meerdere risicofactoren gelijktijdig te beoordelen die vergelijkbaar zijn met meervoudige lineaire en meervoudige logistische regressieanalyse zoals beschreven in de modules waarin verstorende, Effectmodificatie, correlatie en multivariabele methoden worden besproken. Een van de meest populaire regressietechnieken voor survival analyse is Cox proportionele risico ‘ s regressie, die wordt gebruikt om verschillende risicofactoren of blootstellingen, gelijktijdig beschouwd, te relateren aan de overlevingstijd., In een Cox proportional hazards regression model, de maat van het effect is de hazard rate, dat is het risico van mislukking (dat wil zeggen, het risico of de waarschijnlijkheid van het lijden van de gebeurtenis van belang), gezien het feit dat de deelnemer heeft overleefd tot een bepaalde tijd. Een waarschijnlijkheid moet in het bereik 0 tot 1 liggen. Het gevaar vertegenwoordigt echter het verwachte aantal gebeurtenissen per tijdseenheid. Hierdoor kan het gevaar in een groep groter zijn dan 1. Als het gevaar bijvoorbeeld 0,2 is op tijdstip t en de tijdseenheden maanden zijn, dan worden gemiddeld 0,2 gebeurtenissen per risicogroep per maand verwacht., Een andere interpretatie is gebaseerd op de wederkerigheid van het gevaar. Bijvoorbeeld, 1/0. 2 = 5, wat de verwachte event-Vrije Tijd (5 maanden) per risicogroep is.
in de meeste situaties zijn we geïnteresseerd in het vergelijken van groepen met betrekking tot hun gevaren, en we gebruiken een hazard ratio, die analoog is aan een odds ratio in de setting van meerdere logistieke regressieanalyse. De hazard ratio kan worden geschat op basis van de gegevens die we organiseren om de log rank test uit te voeren., In het bijzonder is de hazard ratio de verhouding tussen het totale aantal waargenomen en verwachte gebeurtenissen in twee onafhankelijke vergelijkingsgroepen:
in sommige studies is het onderscheid tussen de blootgestelde of behandelde gebeurtenissen in vergelijking met de niet-blootgestelde of controlegroepen duidelijk. In andere studies is dat niet zo., In het laatste geval kan een van beide groepen in de teller voorkomen en de interpretatie van de gevarenverhouding is dan het gebeurtenisrisico in de groep in de teller in vergelijking met het gebeurtenisrisico in de groep in de noemer.
in Voorbeeld 3 worden twee actieve behandelingen vergeleken (chemotherapie vóór de operatie versus chemotherapie na de operatie). Het maakt dus niet uit welke in de teller van de hazard ratio staat., Aan de hand van de gegevens in Voorbeeld 3 wordt de hazard ratio geschat op:
het risico op overlijden is dus 4,870 keer hoger in de chemotherapy before surgery-groep in vergelijking met de chemotherapy after surgery-groep.
Voorbeeld 3 onderzocht de associatie van een enkele onafhankelijke variabele (chemotherapie voor of na een operatie) op overleving. Nochtans, is het vaak van belang om de associatie tussen verscheidene risicofactoren, gelijktijdig beschouwd, en overlevingstijd te beoordelen., Een van de meest populaire regressietechnieken voor overlevingsuitkomsten is Cox proportionele risico ‘ s regressieanalyse. Er zijn verschillende belangrijke aannames voor het juiste gebruik van het Cox proportional hazards regressiemodel, waaronder
- onafhankelijkheid van de overlevingstijden tussen verschillende individuen in de steekproef,
- een multiplicatieve relatie tussen de voorspellers en het gevaar (in tegenstelling tot een lineaire relatie zoals het geval was bij multiple linear regression analysis, hieronder nader besproken), en
- een constante hazard ratio in de tijd.,
Het Cox proportional hazards regressiemodel kan als volgt worden geschreven:
waarbij h(t) het verwachte gevaar is op tijdstip t, h0(t) het basisrisico is en het gevaar vertegenwoordigt wanneer alle van de voorspellers (of onafhankelijke variabelen) zijn X1, X2 , XP gelijk aan nul. Merk op dat het voorspelde gevaar (dat wil zeggen, h(t)), of de mate van lijden van de gebeurtenis van belang in het volgende ogenblik, het product van het basisrisico (h0(t)) en de exponentiële functie van de lineaire combinatie van de voorspellers is., De voorspellers hebben dus een multiplicatief of proportioneel effect op het voorspelde gevaar.
overweeg een eenvoudig model met één voorspeller, X1., De Cox proportionele gevaren model is:
Soms het model is anders uitgedrukt, met betrekking tot het relatieve gevaar, dit is de verhouding van het gevaar op het tijdstip t aan de baseline hazard, naar de risico factoren:
We kunnen de natuurlijke logaritme (ln) van elke kant van het Cox proportional gevaren regressie model, om de volgende die betrekking heeft op de log van de relatieve gevaar voor een lineaire functie van de voorspellers., Merk op dat de rechterkant van de vergelijking lijkt op de meer bekende lineaire combinatie van de voorspellers of risicofactoren (zoals te zien in het multiple linear regression model).
in de praktijk ligt de interesse in de associaties tussen elk van de risicofactoren of voorspellers (X1, X2,…, Xp) en de uitkomst. De associaties worden gekwantificeerd door de regressiecoëfficiënten coëfficiënten (b1, b2,…, bp)., De techniek voor het schatten van de regressiecoëfficiënten in een Cox proportional hazards regressiemodel valt buiten het bestek van deze tekst en wordt beschreven in Cox en Oakes.9 Hier richten we ons op interpretatie. De geschatte coëfficiënten in het Cox proportional hazards regression model, b1, bijvoorbeeld, vertegenwoordigen de verandering in de verwachte log van de hazard ratio ten opzichte van een verandering van één eenheid in X1, waarbij alle andere voorspellers constant worden gehouden.
De antilog van een geschatte regressiecoëfficiënt, exp (bi), geeft een hazard ratio. Als een voorspeller dichotoom is (bijv.,, X1 is een indicator van prevalente hart-en vaatziekten of mannelijk geslacht) dan exp (b1) is de hazard ratio die het risico van gebeurtenis voor deelnemers met x1=1 (bijvoorbeeld prevalente hart-en vaatziekten of mannelijk geslacht) vergelijkt met deelnemers met X1=0 (bijvoorbeeld vrij van hart-en vaatziekten of vrouwelijk geslacht).
als de hazard ratio voor een voorspeller dicht bij 1 ligt, heeft die voorspeller geen invloed op de overleving. Als de hazard ratio kleiner is dan 1, dan is de voorspeller Beschermend (d.w.z., als de hazard ratio groter is dan 1, dan wordt de voorspeller geassocieerd met een verhoogd risico (of verminderde overleving).
hypothesietests worden gebruikt om te beoordelen of er statistisch significante associaties zijn tussen voorspellers en tijd tot gebeurtenis. De volgende voorbeelden illustreren deze tests en hun interpretatie.
Het Cox proportional Hazard model wordt een semi-parametrisch model genoemd, omdat er geen aannames zijn over de vorm van de baseline hazard function. Er zijn echter andere veronderstellingen zoals hierboven vermeld (d.w.z.,, onafhankelijkheid, veranderingen in voorspellers produceren proportionele veranderingen in het gevaar ongeacht de tijd, en een lineaire associatie tussen de natuurlijke logaritme van het relatieve gevaar en de voorspellers). Er zijn andere regressiemodellen gebruikt in survival analyse die specifieke distributies aannemen voor de overlevingstijden, zoals de exponentiële, Weibull,Gompertz en log-normale distributies1, 8. De exponentiële regressie survival model, bijvoorbeeld, gaat ervan uit dat de hazard functie constant is., Andere verdelingen gaan ervan uit dat het gevaar in de loop van de tijd toeneemt, in de loop van de tijd afneemt, of in eerste instantie toeneemt en vervolgens afneemt. Voorbeeld 5 illustreert de schatting van een Cox proportional hazards regressiemodel en bespreekt de interpretatie van de regressiecoëfficiënten.
voorbeeld:
Er wordt een analyse uitgevoerd om verschillen in mortaliteit door alle oorzaken te onderzoeken tussen mannen en vrouwen die deelnamen aan de Framingham Heart Study, aangepast aan leeftijd. Een totaal van 5.180 deelnemers van 45 jaar en ouder worden gevolgd tot het tijdstip van overlijden of tot 10 jaar, afhankelijk van wat het eerst komt., Zesenveertig procent van de steekproef bestaat uit mannen, de gemiddelde leeftijd van de steekproef is 56,8 jaar (standaarddeviatie = 8,0 jaar) en de leeftijden variëren van 45 tot 82 jaar aan het begin van de studie. Er zijn in totaal 402 sterfgevallen waargenomen onder 5.180 deelnemers. Hieronder worden beschrijvende statistieken weergegeven over de leeftijd en het geslacht van de deelnemers aan het begin van de studie, ingedeeld naar het al dan niet overlijden van de deelnemers tijdens de follow-upperiode.,
|
Die (n=402) |
Do Not Die (n=4778) |
---|---|---|
Mean (SD) Age, years |
65.6 (8.7) |
56.1 (7.,5) |
N (%) Man |
221 (55%) |
2145 (45%) |
Wij nu inschatten van een Cox proportional gevaren regressie model en betreft een indicator van het mannelijke geslacht en de leeftijd in jaren, voor de tijd tot de dood. De parameterschattingen worden gegenereerd in SAS met behulp van de SAS Cox proportional hazards regression procedure12 en worden hieronder weergegeven samen met hun p-waarden.,
Risk Factor |
Parameter Estimate |
P-Value |
---|---|---|
Age, years |
0.11149 |
0.0001 |
Male Sex |
0.,67958 |
0,0001 |
merk op dat er een positief verband bestaat tussen leeftijd en mortaliteit door alle oorzaken en tussen mannelijk geslacht en mortaliteit door alle oorzaken (d.w.z. Er is een verhoogd risico op overlijden voor oudere deelnemers en voor mannen).
nogmaals, de parameterschattingen vertegenwoordigen de toename van de verwachte log van het relatieve gevaar voor elke eenheid toename van de voorspeller, waarbij andere voorspellers constant worden gehouden. Er is een 0.,11149 eenheid toename van de verwachte log van het relatieve gevaar voor elk jaar toename van de leeftijd, waarbij het geslacht constant is, en een 0,67958 eenheid toename van de verwachte log van het relatieve gevaar voor mannen in vergelijking met vrouwen, waarbij de leeftijd constant is.
voor interpreteerbaarheid berekenen we hazard ratio ‘ s door de parameterschattingen te exponentiëren. Voor leeftijd, exp (0,11149) = 1.118. Er is een stijging van 11,8% in het verwachte gevaar ten opzichte van een één jaar stijging van de leeftijd (of het verwachte gevaar is 1,12 keer hoger bij een persoon die een jaar ouder is dan een ander), waarbij het geslacht constant. Ook exp(0,67958) = 1.,973. Het verwachte gevaar is 1,973 keer hoger bij mannen in vergelijking met vrouwen, met een constante leeftijd.
stel dat we extra risicofactoren voor mortaliteit ongeacht de oorzaak overwegen en een Cox proportional hazards regressiemodel schatten dat een uitgebreide set risicofactoren relateert aan tijd tot overlijden. De parameterschattingen worden opnieuw gegenereerd in SAS met behulp van de SAS Cox proportional hazards regression procedure en worden hieronder weergegeven samen met hun p-waarden.Hieronder zijn ook de hazard ratio ‘ s en hun 95% betrouwbaarheidsintervallen opgenomen.,
alle parameterschattingen worden geschat rekening houdend met de andere voorspellers. Na rekening te hebben gehouden met leeftijd, geslacht, bloeddruk en rookstatus, zijn er geen statistisch significante verbanden tussen totaal serumcholesterol en mortaliteit ongeacht de oorzaak of tussen diabetes en mortaliteit ongeacht de oorzaak. Dit wil niet zeggen dat deze risicofactoren niet geassocieerd zijn met sterfte door alle oorzaken; hun gebrek aan significantie is waarschijnlijk te wijten aan verstorende (onderlinge verbanden tussen de onderzochte risicofactoren). Merk op dat Voor de statistisch significante risicofactoren (d.w.z.,, leeftijd, geslacht, systolische bloeddruk en huidige rookstatus), dat de 95% betrouwbaarheidsintervallen voor de hazard ratio ‘ s geen 1 bevatten (de nulwaarde). De 95% betrouwbaarheidsintervallen voor de niet-significante risicofactoren (totaal serumcholesterol en diabetes) omvatten daarentegen de nulwaarde.
voorbeeld:
een prospectief cohortonderzoek wordt uitgevoerd om het verband tussen body mass index en time to incident cardiovascular disease (CVD) te beoordelen. Bij baseline wordt de body mass index van deelnemers gemeten samen met andere bekende klinische risicofactoren voor hart-en vaatziekten (bijv., leeftijd, geslacht, bloeddruk). Deelnemers worden tot 10 jaar gevolgd voor de ontwikkeling van CVD. In de studie van n=3.937 deelnemers ontwikkelen 543 CVD tijdens de studie observatieperiode. In een Cox proportional hazards regression analysis vinden we de associatie tussen BMI en tijd tot CVD statistisch significant met een parameterschatting van 0,02312 (p=0,0175) ten opzichte van een verandering van één eenheid in BMI.
als we de parameterschatting exponentiëren, hebben we een hazard ratio van 1,023 met een betrouwbaarheidsinterval van (1,004-1,043)., Omdat we BMI modelleren als een continue voorspeller, is de interpretatie van de hazard ratio voor CVD relatief aan een verandering van één eenheid in BMI (recall BMI wordt gemeten als de verhouding van gewicht in kilogram tot hoogte in vierkante meters). Een stijging van de BMI met één eenheid gaat gepaard met een stijging van het verwachte risico met 2,3%.
om interpretatie te vergemakkelijken, stel dat we 3 gewichtscategorieën maken gedefinieerd door de BMI van de deelnemer.
- normaal gewicht wordt gedefinieerd als BMI < 25,0,
- overgewicht als BMI tussen 25,0 en 29,9, en
- obesitas als BMI hoger dan 29,9.,
in de steekproef zijn 1.651 (42%) deelnemers die voldoen aan de definitie van normaal gewicht, 1.648 (42%) die voldoen aan de definitie van overgewicht en 638 (16%) die voldoen aan de definitie van zwaarlijvig. Het aantal CVD-gebeurtenissen in elk van de 3 groepen wordt hieronder weergegeven.,
Group |
Number of Participants |
Number (%) of CVD Events |
---|---|---|
Normal Weight |
1651 |
202 (12.,2%) |
Overweight |
1648 |
241 (14.6%) |
Obese |
638 |
100 (15.7%) |
The incidence of CVD is higher in participants classified as overweight and obese as compared to participants of normal weight.,
we gebruiken nu Cox proportional hazards regression analysis om maximaal gebruik te maken van de gegevens over alle deelnemers aan de studie. De volgende tabel toont de parameterschattingen, p-waarden, hazard ratio ’s en 95% betrouwbaarheidsintervallen voor de hazard ratio’ s wanneer we alleen rekening houden met de gewichtsgroepen (niet-aangepast model), wanneer we ons aanpassen voor leeftijd en geslacht en wanneer we ons aanpassen voor leeftijd, geslacht en andere bekende klinische risicofactoren voor incidentele CVD.
de laatste twee modellen zijn multivariabele modellen en worden uitgevoerd om het verband tussen gewicht en invallende CVD-aanpassing voor confounders te beoordelen., Omdat we drie gewichtsgroepen hebben, hebben we twee dummy variabelen of indicatorvariabelen nodig om de drie groepen weer te geven. In de modellen nemen we de indicatoren voor overgewicht en obesitas en beschouwen normaal gewicht als de referentiegroep.
* aangepast voor leeftijd, geslacht, systolische bloeddruk, behandeling voor hypertensie, huidige rokerstatus, totaal serumcholesterol.
in het niet-aangepaste model is er een verhoogd risico op CVD bij deelnemers met overgewicht in vergelijking met normaal gewicht en bij deelnemers met obesitas in vergelijking met deelnemers met normaal gewicht (hazard ratio ‘ s van 1,215 en 1.,310, respectievelijk). Na correctie voor leeftijd en geslacht is er echter geen statistisch significant verschil tussen deelnemers aan overgewicht en deelnemers aan normaal gewicht in termen van CVD-risico (hazard ratio = 1,067, p=0,5038). Hetzelfde geldt voor het model dat zich aanpast aan leeftijd, geslacht en de klinische risicofactoren. Na correctie blijft het verschil in CVD-risico tussen deelnemers met obesitas en deelnemers met een normaal gewicht echter statistisch significant, met ongeveer 30% toename van het risico op CVD bij deelnemers met obesitas in vergelijking met deelnemers met een normaal gewicht.,
return to top | previous page / next page