De Riscos Proporcionais de Cox Análise de Regressão
a Sobrevivência métodos de análise também pode ser estendida para avaliar vários fatores de risco, simultaneamente, semelhante ao linear múltipla e análise de regressão logística múltipla, conforme descrito nos módulos de discutir Confusão, Efeito de Modificação, Correlação e Multivariada Métodos. Uma das técnicas de regressão mais populares para a análise de sobrevivência é a regressão proporcional de riscos Cox, que é usada para relacionar vários fatores de risco ou exposições, considerados simultaneamente, ao tempo de sobrevivência., Em um modelo de regressão proporcional de riscos Cox, a medida de efeito é a taxa de perigo, que é o risco de falha (ou seja, o risco ou probabilidade de sofrer o evento de interesse), dado que o participante sobreviveu até um determinado momento. Uma probabilidade deve estar no intervalo de 0 a 1. No entanto, o perigo representa o número esperado de acontecimentos por unidade de tempo. Como resultado, o perigo em um grupo pode exceder 1. Por exemplo, se o perigo for 0,2 no tempo t e as unidades de tempo forem meses, em média, 0,2 eventos são esperados por pessoa em risco por mês., Outra interpretação é baseada na reciprocidade do perigo. Por exemplo, 1/0.2 = 5, que é o tempo livre de eventos esperado (5 meses) por pessoa em risco.
na maioria das situações, estamos interessados em COMPARAR grupos com relação aos seus perigos, e usamos uma razão de perigo, que é análoga a uma razão de probabilidades na definição de análise de regressão logística múltipla. A taxa de risco pode ser estimada a partir dos dados que organizamos para realizar o teste log rank., Especificamente, o hazard ratio é a relação entre o número total de observado para eventos esperados em duas independente grupos de comparação:
Em alguns estudos, a distinção entre os expostos ou tratados em comparação aos não expostos ou grupos de controle são claras. Em outros estudos, não é., Neste último caso, o grupo pode aparecer no numerador e a interpretação dos hazard ratio é, então, o risco de evento no grupo em que o numerador em comparação com o risco de evento no grupo em que o denominador.no exemplo 3 estão a ser comparados dois tratamentos activos (quimioterapia antes da cirurgia versus quimioterapia após cirurgia). Consequentemente, não importa o que aparece no numerador da razão de perigo., Utilizando os dados do Exemplo 3, o hazard ratio é estimado como:
Assim, o risco de morte é 4.870 vezes maior no quimioterapia antes da cirurgia grupo comparado com a quimioterapia após a cirurgia de grupo.o exemplo 3 examinou a associação de uma única variável independente (quimioterapia antes ou depois da cirurgia) na sobrevivência. No entanto, é frequentemente de interesse avaliar a associação entre vários factores de risco, considerados simultaneamente, e o tempo de sobrevivência., Uma das técnicas de regressão mais populares para resultados de sobrevivência é a análise de regressão de riscos proporcional Cox. Há várias premissas importantes para o uso adequado dos riscos proporcionais de Cox modelo de regressão, incluindo
- a independência da sobrevivência vezes entre indivíduos distintos no exemplo,
- uma relação multiplicativa entre os indicadores e o perigo (ao contrário de um linear, como foi o caso com análise de regressão linear múltipla, discutido em mais detalhes abaixo), e
- um perigo constante relação com o tempo.,
Os riscos proporcionais de Cox modelo de regressão pode ser escrita da seguinte forma:
onde h(t) é a expectativa de perigo no tempo t, h0(t) é a linha de base de perigo e representa o perigo quando todos os indicadores (ou variáveis independentes) X1, X2 , Xp são iguais a zero. Note – se que o perigo previsto (ou seja, h(t)), ou a taxa de sofrer o evento de interesse no instante seguinte, é o produto do perigo de base (h0(t)) e a função exponencial da combinação linear dos predictores., Assim, os predictores têm um efeito multiplicativo ou proporcional sobre o perigo previsto.
considere um modelo simples com um predictor, X1., O modelo de riscos proporcionais de Cox é:
às Vezes, o modelo é expresso de forma diferente, relacionados com relativo perigo, que é a razão entre o perigo no tempo t para a linha de base de perigo, aos fatores de risco:
podemos tomar o logaritmo natural (ln) de cada lado do risco proporcional de Cox modelo de regressão, para produzir o seguinte, que relaciona-se com o registo de relativo perigo para uma função linear dos preditores., Observe que o lado direito da equação se parece com a combinação linear mais familiar dos predictores ou fatores de risco (como visto no modelo de regressão linear múltipla).
Na prática, o interesse reside na associação entre cada um dos fatores de risco preditores (X1, X2, …, Xp) e o resultado. As associações são quantificadas pelos coeficientes de regressão (b1, b2,…, bp)., A técnica para estimar os coeficientes de regressão em um modelo de regressão de riscos proporcionais Cox está além do escopo deste texto e é descrita em Cox e Oakes.9 aqui nos concentramos na interpretação. Os coeficientes estimados no modelo de regressão proporcional de riscos Cox, b1, por exemplo, representam a alteração no logaritmo esperado da razão de perigo relativa a uma alteração de uma unidade em X1, mantendo todos os outros predictores constantes.
o anti-log de um coeficiente de regressão estimado, exp (bi), produz uma razão de perigo. Se um predictor é dicotômico (ex.,, X1 é um indicador de doença cardiovascular prevalente ou sexo masculino), então exp (B1) é a relação de risco comparando o risco de evento para participantes com X1=1 (por exemplo, doença cardiovascular prevalente ou sexo masculino) para participantes com X1=0 (por exemplo, livre de doença cardiovascular ou sexo feminino).se a razão de perigo para um preditor for próxima de 1, então esse preditor não afecta a sobrevivência. Se a razão de perigo for inferior a 1, Então o predictor é protetor (i.e.,, associada a uma melhoria da sobrevivência) e se a taxa de risco for superior a 1, Então o predictor está associado a um risco aumentado (ou a uma diminuição da sobrevivência).os testes de hipótese são usados para avaliar se existem associações estatisticamente significativas entre preditores e tempo para o evento. Os exemplos que se seguem ilustram estes testes e a sua interpretação.
O modelo Cox proportional hazards é chamado de modelo semi-paramétrico, porque não há suposições sobre a forma da função de risco de linha de base. Existem, no entanto, outros pressupostos como mencionado acima (i.e.,, independence, changes in predictors produce proportional changes in the hazard regardless of time, and a linear association between the natural logarithm of the relative hazard and the predictors). Existem outros modelos de regressão usados na análise de sobrevivência que assumem distribuições específicas para os tempos de sobrevivência, tais como as distribuições exponencial, Weibull,Gompertz e log-normal1, 8. O modelo de sobrevivência de regressão exponencial, por exemplo, assume que a função de perigo é constante., Outras distribuições assumem que o perigo está aumentando ao longo do tempo, diminuindo ao longo do tempo, ou aumentando inicialmente e, em seguida, diminuindo. O exemplo 5 ilustrará a estimativa de um modelo de regressão proporcional de riscos Cox e discutirá a interpretação dos coeficientes de regressão.exemplo: é realizada uma análise para investigar as diferenças na mortalidade por todas as causas entre homens e mulheres que participam no estudo de Framingham Heart, ajustando-se para a idade. Um total de 5.180 participantes com idade igual ou superior a 45 anos são seguidos até a hora da morte ou até 10 anos, consoante o que ocorrer primeiro., Quarenta e seis por cento da amostra são do sexo masculino, a idade média da amostra é de 56,8 anos (desvio padrão = 8,0 anos) e as idades variam de 45 a 82 anos no início do estudo. Há um total de 402 mortes observadas entre 5180 participantes. As estatísticas descritivas são apresentadas abaixo sobre a idade e o sexo dos participantes no início do estudo, classificados se morrem ou não durante o período de acompanhamento.,
|
Die (n=402) |
Do Not Die (n=4778) |
---|---|---|
Mean (SD) Age, years |
65.6 (8.7) |
56.1 (7.,5) |
N (%) Masculino |
221 (55%) |
2145 (45%) |
Temos agora uma estimativa de riscos proporcionais de Cox modelo de regressão e relacionam-se de um indicador do sexo masculino e a idade, em anos, para o tempo até a morte. As estimativas dos parâmetros são geradas em SAS utilizando o procedimento de regressão proporcional dos perigos SAS Cox12 e são apresentadas a seguir juntamente com os seus valores-p.,
Risk Factor |
Parameter Estimate |
P-Value |
---|---|---|
Age, years |
0.11149 |
0.0001 |
Male Sex |
0.,67958 |
0.0001 |
Observe que há uma associação positiva entre a idade e a mortalidade por todas as causas, e entre o sexo masculino e mortalidade por todas as causas (por exemplo, há um aumento de risco de morte para os participantes mais velhos e para os homens).mais uma vez, as estimativas dos parâmetros representam o aumento do logaritmo esperado do perigo relativo para cada aumento de uma unidade no predictor, mantendo constantes outros predictores. Há um 0.,11149 aumento unitário no log esperado do perigo relativo para cada aumento de idade de um ano, mantendo constante do sexo, e um aumento de 0,67958 unidades no log esperado do perigo relativo para os homens em comparação com as mulheres, mantendo constante da idade.
para interpretação, calculamos as razões de perigo exponenciando as estimativas dos parâmetros. Para a idade, exp(0.11149) = 1.118. Há um aumento de 11,8% no risco esperado em relação a um aumento de um ano na idade (ou o risco esperado é 1,12 vezes maior em uma pessoa que é um ano mais velho do que outro), mantendo constante do sexo. Similarmente, exp(0,67958) = 1.,973. O risco esperado é de 1, 973 vezes mais elevado nos homens do que nas mulheres, mantendo constante a idade.suponha que consideremos factores de risco adicionais para a mortalidade por todas as causas e estimemos um modelo de regressão de riscos proporcional à Cox que relacione um conjunto alargado de factores de risco com o tempo até à morte. As estimativas dos parâmetros são novamente geradas em SAS utilizando o procedimento de regressão proporcional dos perigos SAS Cox e são mostradas a seguir juntamente com os seus valores-p.12 também incluídos abaixo estão as razões de perigo, juntamente com os seus intervalos de confiança de 95%.,todas as estimativas dos parâmetros são estimadas tendo em conta os outros indicadores. Depois de contabilizar a idade, o Sexo, a pressão arterial e o estado do tabagismo, não existem associações estatisticamente significativas entre o colesterol sérico total e a mortalidade por todas as causas ou entre a diabetes e a mortalidade por todas as causas. Isto não quer dizer que estes factores de risco não estejam associados à mortalidade por todas as causas; a sua falta de significado deve-se provavelmente à confusão (inter-relações entre os factores de risco considerados). Note que para os fatores de risco estatisticamente significantes (i.e.,, idade, sexo, pressão arterial sistólica e estado actual de tabagismo), que os intervalos de confiança de 95% para as taxas de risco não incluem 1 (o valor nulo). Em contraste, os intervalos de confiança de 95% para os factores de risco não significativos (colesterol sérico total e diabetes) incluem o valor nulo.
exemplo:
um estudo prospectivo de coorte é executado para avaliar a associação entre o índice de massa corporal e o tempo de ocorrência de doença cardiovascular (DCV). No início, o índice de massa corporal dos participantes é medido juntamente com outros factores de risco clínico conhecidos para a doença cardiovascular (p. ex.,, idade, sexo, pressão arterial). Os participantes são acompanhados por até 10 anos para o desenvolvimento de CVD. No estudo de n=3. 937 participantes, 543 desenvolvem DCV durante o período de observação do estudo. Em uma análise de regressão de perigos proporcional de Cox, encontramos a associação entre o IMC e o tempo a CVD estatisticamente significante com uma estimativa de parâmetro de 0.02312 (p=0.0175) em relação a uma mudança de uma unidade no IMC.
Se exponenciarmos a estimativa do parâmetro, temos uma taxa de risco de 1.023 com um intervalo de confiança de (1.004-1.043)., Como nós modelamos BMI como um predictor contínuo, a interpretação da razão de perigo para CVD é relativa a uma mudança de uma unidade no BMI (a memória BMI é medida como a razão de peso em quilogramas para a altura em metros quadrados). Um aumento de uma unidade no IMC está associado a um aumento de 2,3% no risco esperado.
para facilitar a interpretação, suponha que criamos 3 categorias de peso definidas pelo Participante ” s BMI.
- peso Normal é definido como IMC < 25.0,
- o excesso de peso, IMC entre 25.0 e 29.9, e
- Obesidade como IMC superior a 29.9.,
na amostra, há 1.651 (42%) participantes que cumprem a definição de peso normal, 1.648 (42%) que cumprem a definição de peso superior, e 638 (16%) que cumprem a definição de obeso. O número de eventos CVD em cada um dos 3 grupos é mostrado abaixo.,
Group |
Number of Participants |
Number (%) of CVD Events |
---|---|---|
Normal Weight |
1651 |
202 (12.,2%) |
Overweight |
1648 |
241 (14.6%) |
Obese |
638 |
100 (15.7%) |
The incidence of CVD is higher in participants classified as overweight and obese as compared to participants of normal weight.,
agora usamos a análise de regressão de riscos proporcional Cox para fazer o máximo uso dos dados sobre todos os participantes no estudo. A tabela seguinte apresenta as estimativas dos parâmetros, valores p, rácios de perigo e intervalos de confiança de 95% para as razões de risco quando consideramos os grupos de peso isoladamente (modelo não ajustado), quando nos ajustamos para a idade e o sexo e quando nos ajustamos para a idade, o sexo e outros fatores de risco clínico conhecidos para o CVD incidente.
os dois últimos modelos são modelos multivariáveis e são realizados para avaliar a associação entre o peso e incidente CVD ajuste para confluentes., Como temos três grupos de peso, precisamos de duas variáveis fictícias ou variáveis indicadoras para representar os três grupos. Nos modelos incluímos os indicadores de excesso de peso e obesidade e consideramos o peso normal o grupo de referência.
* ajustado para a idade, sexo, pressão arterial sistólica, tratamento para hipertensão, estado actual de tabagismo, colesterol sérico total.
no modelo não ajustado, existe um risco aumentado de DCV em participantes com excesso de peso em comparação com o peso normal e em obesos em comparação com os participantes com peso normal (rácios de risco de 1.215 e 1.,310, respectivamente). No entanto, após ajuste para idade e sexo, não há diferença estatisticamente significativa entre os participantes com excesso de peso e peso normal em termos de risco de DCV (taxa de risco = 1, 067, p=0, 5038). O mesmo é verdade no modelo de ajuste para a idade, sexo e os fatores de risco clínico. No entanto, após o ajuste, a diferença no risco de CVD entre os participantes obesos e com peso normal permanece estatisticamente significativa, com aproximadamente um aumento de 30% no risco de CVD entre os participantes obesos em comparação com os participantes com peso normal.,
return to top / previous page / next page