Cox Proportional Hazards Regression Analysis
Survival Analysis methods can also be extended to assess Several risk factors simultaneously similar to multiple linear and multiple logistic regression analysis as described in the modules discussing Confounding, Effect Modification, Correlation, and Multivariable Methods. Una delle tecniche di regressione più diffuse per l’analisi della sopravvivenza è la regressione dei rischi proporzionali di Cox, che viene utilizzata per mettere in relazione diversi fattori di rischio o esposizioni, considerati simultaneamente, al tempo di sopravvivenza., In un modello di regressione proporzionale dei rischi Cox, la misura dell’effetto è il tasso di pericolo, che è il rischio di fallimento (cioè il rischio o la probabilità di subire l’evento di interesse), dato che il partecipante è sopravvissuto fino a un tempo specifico. Una probabilità deve trovarsi nell’intervallo da 0 a 1. Tuttavia, il pericolo rappresenta il numero previsto di eventi per un’unità di tempo. Di conseguenza, il pericolo in un gruppo può superare 1. Ad esempio, se il pericolo è 0,2 al tempo t e le unità di tempo sono mesi, in media sono previsti 0,2 eventi per persona a rischio al mese., Un’altra interpretazione si basa sul reciproco del pericolo. Ad esempio, 1/0.2 = 5, che è il tempo previsto senza eventi (5 mesi) per persona a rischio.
Nella maggior parte delle situazioni, siamo interessati a confrontare i gruppi rispetto ai loro pericoli e usiamo un hazard ratio, che è analogo a un odds ratio nell’impostazione dell’analisi di regressione logistica multipla. L’hazard ratio può essere stimato dai dati che organizziamo per condurre il log rank test., In particolare, l’hazard ratio è il rapporto tra il numero totale osservati attesi eventi indipendenti e gruppi di confronto:
In alcuni studi, la distinzione tra esposti e trattati rispetto ai non esposti o i gruppi di controllo sono chiare. In altri studi, non lo è., In quest’ultimo caso, entrambi i gruppi possono apparire nel numeratore e l’interpretazione dell’hazard ratio è quindi il rischio di evento nel gruppo nel numeratore rispetto al rischio di evento nel gruppo nel denominatore.
Nell’esempio 3 vengono confrontati due trattamenti attivi (chemioterapia prima dell’intervento chirurgico rispetto alla chemioterapia dopo l’intervento chirurgico). Di conseguenza, non importa quale appare nel numeratore dell’hazard ratio., Utilizzando i dati dell’Esempio 3, il rapporto di rischio è stimato come:
Così, il rischio di morte è 4.870 volte superiori a chemioterapia prima dell’intervento chirurgico di gruppo rispetto alla chemioterapia dopo l’intervento chirurgico di gruppo.
L’esempio 3 ha esaminato l’associazione di una singola variabile indipendente (chemioterapia prima o dopo l’intervento chirurgico) sulla sopravvivenza. Tuttavia, è spesso interessante valutare l’associazione tra diversi fattori di rischio, considerati contemporaneamente, e il tempo di sopravvivenza., Una delle tecniche di regressione più popolari per i risultati di sopravvivenza è l’analisi di regressione dei rischi proporzionali di Cox. Ci sono diverse ipotesi per l’uso appropriato dei rischi proporzionali di Cox di regressione del modello, inclusi
- l’indipendenza dei tempi di sopravvivenza tra distinti individui nel campione,
- moltiplicativo rapporto tra predittori e il pericolo (anziché lineare, come è stato il caso con analisi di regressione lineare multipla, discusso in dettaglio più avanti), e
- un costante rapporto di rischio nel corso del tempo.,
I rischi proporzionali di Cox modello di regressione può essere scritto come segue:
dove h(t) è previsto di pericolo, al tempo t, h0(t) è la linea di base di pericolo e rappresenta il pericolo quando tutti i predittori (o variabili indipendenti) X1, X2 , Xp sono pari a zero. Si noti che il pericolo previsto (cioè h(t)), o il tasso di sofferenza dell’evento di interesse nell’istante successivo, è il prodotto del pericolo di base (h0(t)) e della funzione esponenziale della combinazione lineare dei predittori., Pertanto, i predittori hanno un effetto moltiplicativo o proporzionale sul pericolo previsto.
Considera un modello semplice con un predittore, X1., Il rischio proporzionale di Cox del modello è:
a Volte il modello è espresso in modo diverso, riguardanti il rischio relativo, che è il rapporto del pericolo, al tempo t, per la previsione del pericolo, per i fattori di rischio:
Siamo in grado di prendere il logaritmo naturale (ln) di ogni lato dei rischi proporzionali di Cox modello di regressione, per produrre il seguente, che si riferisce al registro del rischio relativo per una funzione lineare delle variabili predittive., Si noti che il lato destro dell’equazione assomiglia alla combinazione lineare più familiare dei predittori o dei fattori di rischio (come visto nel modello di regressione lineare multipla).
In pratica, l’interesse risiede nelle associazioni tra ciascuno dei fattori di rischio o predittori (X1, X2, …, Xp) e il risultato. Le associazioni sono quantificate dai coefficienti di regressione coefficienti (b1, b2, …, bp)., La tecnica per stimare i coefficienti di regressione in un modello di regressione dei rischi proporzionali di Cox esula dall’ambito di applicazione di questo testo ed è descritta in Cox e Oakes.9 Qui ci concentriamo sull’interpretazione. I coefficienti stimati nel modello di regressione dei rischi proporzionali di Cox, b1, ad esempio, rappresentano la variazione nel registro atteso del rapporto di rischio rispetto a una variazione di un’unità in X1, mantenendo costanti tutti gli altri predittori.
L’antilog di un coefficiente di regressione stimato, exp(bi), produce un hazard ratio. Se un predittore è dicotomico (ad es., X1 è un indicatore della malattia cardiovascolare prevalente o del sesso maschile), quindi exp(b1) è l’hazard ratio che confronta il rischio di evento per i partecipanti con X1=1 (ad esempio, malattia cardiovascolare prevalente o sesso maschile) con i partecipanti con X1=0 (ad esempio, privo di malattia cardiovascolare o sesso femminile).
Se l’hazard ratio per un predittore è vicino a 1, tale predittore non influisce sulla sopravvivenza. Se l’hazard ratio è inferiore a 1, il predittore è protettivo (ad es.,, associato a una migliore sopravvivenza) e se l’hazard ratio è maggiore di 1, il predittore è associato ad un aumento del rischio (o ad una diminuzione della sopravvivenza).
I test di ipotesi vengono utilizzati per valutare se esistono associazioni statisticamente significative tra predittori e time to event. Gli esempi che seguono illustrano questi test e la loro interpretazione.
Il modello di rischi proporzionali di Cox è chiamato un modello semi-parametrico, perché non ci sono ipotesi sulla forma della funzione di pericolo di base. Ci sono tuttavia altre ipotesi come notato sopra (cioè,, indipendenza, cambiamenti nei predittori producono cambiamenti proporzionali nel pericolo indipendentemente dal tempo, e un’associazione lineare tra il logaritmo naturale del pericolo relativo e predittori). Esistono altri modelli di regressione utilizzati nell’analisi di sopravvivenza che assumono distribuzioni specifiche per i tempi di sopravvivenza come le distribuzioni esponenziale, Weibull, Gompertz e log-normale1,8. Il modello di sopravvivenza di regressione esponenziale, ad esempio, presuppone che la funzione di pericolo sia costante., Altre distribuzioni presuppongono che il pericolo stia aumentando nel tempo, diminuendo nel tempo o aumentando inizialmente e poi diminuendo. L’esempio 5 illustrerà la stima di un modello di regressione dei rischi proporzionali di Cox e discuterà l’interpretazione dei coefficienti di regressione.
Esempio:
Viene condotta un’analisi per indagare le differenze nella mortalità per tutte le cause tra uomini e donne che partecipano al Framingham Heart Study adattandosi all’età. Un totale di 5.180 partecipanti di età pari o superiore a 45 anni sono seguiti fino al momento della morte o fino a 10 anni, a seconda di quale viene prima., Il quarantasei percento del campione è di sesso maschile, l’età media del campione è di 56,8 anni (deviazione standard = 8,0 anni) e l’età varia da 45 a 82 anni all’inizio dello studio. Ci sono un totale di 402 decessi osservati tra i partecipanti 5,180. Di seguito sono riportate statistiche descrittive sull’età e sul sesso dei partecipanti all’inizio dello studio classificati in base al fatto che muoiano o non muoiano durante il periodo di follow-up.,
|
Die (n=402) |
Do Not Die (n=4778) |
---|---|---|
Mean (SD) Age, years |
65.6 (8.7) |
56.1 (7.,5) |
N (%) Maschio |
221 (55%) |
2145 (45%) |
oggi Possiamo stimare un rischio proporzionale di Cox di regressione del modello e riguardano un indicatore di sesso maschile e di età, negli anni, al momento del decesso. Le stime dei parametri sono generate in SAS utilizzando la procedura di regressione dei pericoli proporzionali SAS cox12 e sono mostrate di seguito insieme ai loro valori P.,
Risk Factor |
Parameter Estimate |
P-Value |
---|---|---|
Age, years |
0.11149 |
0.0001 |
Male Sex |
0.,67958 |
0.0001 |
Nota che c’è un’associazione positiva tra età e tutte le cause di mortalità e tra sesso maschile e di mortalità per tutte le cause (cioè, c’è un aumentato rischio di morte per i partecipanti più anziani e per gli uomini).
Ancora una volta, le stime dei parametri rappresentano l’aumento nel registro atteso del pericolo relativo per ogni aumento di un’unità nel predittore, mantenendo costanti gli altri predittori. C’è uno 0.,11149 aumento unitario nel registro atteso del rischio relativo per ogni aumento annuale dell’età, mantenendo costante il sesso, e un aumento unitario di 0,67958 nel registro atteso del pericolo relativo per gli uomini rispetto alle donne, mantenendo costante l’età.
Per l’interpretabilità, calcoliamo gli hazard ratio esponenziando le stime dei parametri. Per età, scad (0,11149) = 1,118. C’è un aumento dell ‘ 11,8% del rischio atteso rispetto ad un aumento di un anno dell’età (o il rischio atteso è 1,12 volte superiore in una persona che ha un anno più di un altro), mantenendo costante il sesso. Allo stesso modo, scad(0,67958) = 1.,973. Il rischio atteso è 1.973 volte superiore negli uomini rispetto alle donne, mantenendo costante l’età.
Supponiamo di considerare ulteriori fattori di rischio per la mortalità per tutte le cause e stimare un modello di regressione dei rischi proporzionali alla Cox che collega un insieme esteso di fattori di rischio al tempo di morte. Le stime dei parametri vengono nuovamente generate in SAS utilizzando la procedura di regressione dei pericoli proporzionali SAS Cox e sono mostrate di seguito insieme ai loro valori P.12 Di seguito sono riportati anche gli hazard ratio e i loro intervalli di confidenza del 95%.,
Tutte le stime dei parametri sono stimate tenendo conto degli altri predittori. Dopo aver contabilizzato l’età, il sesso, la pressione sanguigna e lo stato di fumo, non ci sono associazioni statisticamente significative tra colesterolo totale sierico e mortalità per tutte le cause o tra diabete e mortalità per tutte le cause. Questo non vuol dire che questi fattori di rischio non siano associati alla mortalità per tutte le cause; la loro mancanza di significato è probabilmente dovuta a confusione (interrelazioni tra i fattori di rischio considerati). Si noti che per i fattori di rischio statisticamente significativi (es.,, età, sesso, pressione sistolica e stato attuale di fumo), che gli intervalli di confidenza del 95% per gli hazard ratio non includono 1 (il valore nullo). Al contrario, gli intervalli di confidenza del 95% per i fattori di rischio non significativi (colesterolo totale sierico e diabete) includono il valore nullo.
Esempio:
Viene eseguito uno studio prospettico di coorte per valutare l’associazione tra indice di massa corporea e tempo di insorgenza di malattie cardiovascolari (CVD). Al basale, l’indice di massa corporea dei partecipanti viene misurato insieme ad altri fattori di rischio clinici noti per le malattie cardiovascolari (ad es.,, età, sesso, pressione sanguigna). I partecipanti sono seguiti per un massimo di 10 anni per lo sviluppo di CVD. Nello studio di n = 3.937 partecipanti, 543 sviluppano CVD durante il periodo di osservazione dello studio. In un’analisi di regressione dei rischi proporzionali di Cox, troviamo l’associazione tra BMI e time to CVD statisticamente significativa con una stima dei parametri di 0,02312 (p=0,0175) relativa a una variazione di un’unità nel BMI.
Se esponiamo la stima del parametro, abbiamo un hazard ratio di 1.023 con un intervallo di confidenza di (1.004-1.043)., Poiché modelliamo il BMI come un predittore continuo, l’interpretazione dell’hazard ratio per CVD è relativa a una variazione di un’unità nel BMI (il BMI di richiamo è misurato come il rapporto tra peso in chilogrammi e altezza in metri quadrati). Un aumento di un’unità di BMI è associato ad un aumento del 2,3% del rischio previsto.
Per facilitare l’interpretazione, supponiamo di creare 3 categorie di peso definite dal BMI del partecipante.
- Il peso normale è definito come BMI< 25.0,
- Sovrappeso come BMI compreso tra 25.0 e 29.9 e
- Obeso come BMI superiore a 29.9.,
Nel campione, ci sono 1.651 (42%) partecipanti che soddisfano la definizione di peso normale, 1.648 (42%) che soddisfano la definizione di peso eccessivo e 638 (16%) che soddisfano la definizione di obesi. I numeri di eventi CVD in ciascuno dei 3 gruppi sono mostrati di seguito.,
Group |
Number of Participants |
Number (%) of CVD Events |
---|---|---|
Normal Weight |
1651 |
202 (12.,2%) |
Overweight |
1648 |
241 (14.6%) |
Obese |
638 |
100 (15.7%) |
The incidence of CVD is higher in participants classified as overweight and obese as compared to participants of normal weight.,
Ora utilizziamo l’analisi di regressione dei rischi proporzionali di Cox per sfruttare al massimo i dati su tutti i partecipanti allo studio. La tabella seguente mostra le stime dei parametri, i valori p, i rapporti di pericolo e gli intervalli di confidenza del 95% per i rapporti di pericolo quando consideriamo solo i gruppi di peso (modello non corretto), quando regoliamo per età e sesso e quando regoliamo per età, sesso e altri fattori di rischio clinici noti per la CVD incidente.
Questi ultimi due modelli sono modelli multivariabili e vengono eseguiti per valutare l’associazione tra peso e incidente CVD regolando per confondenti., Poiché abbiamo tre gruppi di peso, abbiamo bisogno di due variabili fittizie o variabili indicatrici per rappresentare i tre gruppi. Nei modelli includiamo gli indicatori per sovrappeso e obesi e consideriamo il peso normale il gruppo di riferimento.
* Aggiustato per età, sesso, pressione arteriosa sistolica, trattamento per l’ipertensione, stato attuale di fumo, colesterolo totale sierico.
Nel modello non corretto, vi è un aumento del rischio di CVD nei partecipanti in sovrappeso rispetto al peso normale e negli obesi rispetto ai partecipanti in peso normale (hazard ratio di 1,215 e 1.,310, rispettivamente). Tuttavia, dopo l’aggiustamento per età e sesso, non vi è alcuna differenza statisticamente significativa tra i partecipanti sovrappeso e di peso normale in termini di rischio CVD (hazard ratio = 1.067, p=0.5038). Lo stesso vale per il modello che si adatta all’età, al sesso e ai fattori di rischio clinici. Tuttavia, dopo l’aggiustamento, la differenza nel rischio di CVD tra i partecipanti obesi e di peso normale rimane statisticamente significativa, con circa un aumento del 30% del rischio di CVD tra i partecipanti obesi rispetto ai partecipanti di peso normale.,
torna all’inizio / pagina precedente/pagina successiva