Cox比例ハザード回帰分析
生存分析法は、交絡、効果修正、相関、および多変数法について議論するモジュールで説明されているように、複数の線形およ 生存分析のための最も一般的な回帰手法の一つは、Cox比例ハザード回帰であり、同時に考慮されるいくつかの危険因子または曝露を生存時間に関連付けるために使用される。, Cox比例ハザード回帰モデルでは、効果の尺度は、参加者が特定の時間まで生存していることを考えると、障害のリスク(すなわち、関心のあるイベントに苦しんでいるリスクまたは確率)であるハザード率である。 確率は0から1の範囲でなければなりません。 ただし、ハザードは、ある単位時間あたりの予想されるイベント数を表します。 その結果、グループ内のハザードは1を超える可能性があります。 たとえば、時間tでハザードが0.2で、時間単位が月の場合、平均して0.2イベントが月ごとに危険にさらされていると予想されます。, もう一つの解釈は、ハザードの逆数に基づいています。 たとえば、1/0.2=5は、危険にさらされている人あたりの予想されるイベントフリータイム(5ヶ月)です。
ほとんどの状況では、グループのハザードに関して比較することに興味があり、多重ロジスティック回帰分析の設定ではオッズ比に類似したハザード比 ハザード比は、ログランクテストを実施するために整理したデータから推定できます。, 具体的には、ハザード比は、二つの独立した比較群における観測された予想される事象の総数の比である:
いくつかの研究では、非露光群または対照群と比較して露出または処理されたものの区別は明らかである。 他の研究では、そうではありません。, 後者の場合、いずれかのグループが分子に現れることができ、ハザード比の解釈は、分母のグループのイベントのリスクと比較して分子のグループのイベントのリスクになります。
実施例3では、二つの有効な治療法が比較されている(手術前の化学療法と手術後の化学療法)。 したがって、どちらがハザード比の分子に現れるかは問題ではありません。, 例3のデータを使用して、ハザード比は次のように推定されます。
したがって、死亡リスクは手術後の化学療法グループと比較して、手術前の化学療法群で4.870倍高くなります。
実施例3は、生存に対する単一の独立変数(手術前または手術後の化学療法)の関連を調べた。 しかし、同時に考慮されるいくつかの危険因子と生存期間との関連を評価することはしばしば興味深い。, 生存成果のための最も一般的な回帰手法の一つは、Cox比例ハザード回帰分析です。 Cox比例ハザード回帰モデルを適切に使用するためには、
- サンプル内の異なる個体間の生存時間の独立性、
- 予測子とハザード間の乗法関係(以下で詳しく説明する重線形回帰分析の場合のような線形のものとは対照的)、および
- 時間の経過に伴う一定のハザード比を含むいくつかの重要な仮定がある。,
Cox比例ハザード回帰モデルは、次のように書くことができます。
ここで、h(t)は時間tにおける予想ハザード、h0(t)はベースラインハザードであり、すべての予測子(または独立変数)X1,x2,xpはゼロに等しい。 予測されたハザード(すなわち、h(t))、または次の瞬間に関心のあるイベントに罹患する割合は、ベースラインハザード(h0(t))と予測子の線形結合の指数関数の積であることに注意してください。, したがって、予測変数は、予測されたハザードに対して乗法的または比例的な効果を有する。
一つの予測子X1を持つ単純なモデルを考えてみましょう。, Cox比例ハザードモデルは次のとおりです。
モデルは、時間tにおけるハザードとベースラインハザードの比である相対ハザードをリスク要因に関連付けることで、異なる表現がされることがあります。
cox比例ハザード回帰モデルの各辺の自然対数(ln)を取り、相対ハザードの対数を予測子の線形関数に関連付ける以下のものを生成できます。, 方程式の右側は、予測子または危険因子のより身近な線形結合のように見えることに注意してください(重線形回帰モデルに見られるように)。
実際には、関心は各リスク要因または予測因子(X1、X2、。..、Xp)とその結果。 関連付けは、回帰係数coefficients(b1,b2,…、bp)。, Cox比例ハザード回帰モデルの回帰係数を推定する手法は、このテキストの範囲を超えており、CoxおよびOakesで説明されています。9ここでは、解釈に焦点を当てます。 たとえば、Cox比例ハザード回帰モデルb1の推定係数は、X1のある単位変化に対するハザード比の予想対数の変化を表し、他のすべての予測子を一定
推定回帰係数exp(bi)のアンチログは、ハザード比を生成します。 予測子が二分である場合(例えば,、X1は流行する心cardiovascular環器疾患または男性の性の表示器です)そしてexp(b1)はX1=1(例えば、流行する心cardiovascular環器疾患または男性の性)の参加者にX1=0(例えば、心cardiovascular環器疾患または女性の性のない)の参加者のためのでき事の危険を比較する危険率です。
予測子のハザード比が1に近い場合、その予測子は生存に影響しません。 ハザード比が1より小さい場合、予測子は保護的です(すなわち, ハザード比が1より大きい場合、予測因子はリスクの増加(または生存率の低下)と関連しています。
仮説の検定は、予測変数と事象までの時間との間に統計的に有意な関連があるかどうかを評価するために使用されます。 以下の例は、これらのテストとその解釈を示しています。
Cox比例ハザードモデルは、ベースラインハザード関数の形状についての仮定がないため、セミパラメトリックモデルと呼ばれます。 しかし、上記のような他の仮定があります(すなわち,,独立性,予測子の変化は、時間に関係なくハザードの比例した変化を生み出し、相対ハザードの自然対数と予測子との間の線形関連)。 生存分析で使用される他の回帰モデルには、指数分布、ワイブル分布、ゴンペルツ分布、対数正規分布1,8など、生存時間の特定の分布を仮定します。 たとえば、指数回帰生存モデルでは、ハザード関数が一定であると仮定します。, 他の分布では、ハザードは時間とともに増加し、時間とともに減少するか、最初に増加してから減少すると仮定しています。 例5では、Cox比例ハザード回帰モデルの推定を示し、回帰係数の解釈について説明します。
例:
フレーミンガム心臓研究に参加している男性と女性の間の全原因死亡率の違いを年齢に合わせて調べるための分析が行われる。 合計5,180人の参加者が45歳以上で死亡するまで、または10歳までのいずれか早い方に従います。, サンプルの四十六パーセントは男性であり、サンプルの平均年齢は56.8歳(標準偏差=8.0歳)であり、年齢は研究開始時に45歳から82歳の範囲である。 402の参加者の間で観察された死亡者の合計があります5,180. 記述統計は、フォローアップ期間中に死亡するか死亡しないかによって分類された研究開始時の参加者の年齢および性別について以下に示す。,
|
Die (n=402) |
Do Not Die (n=4778) |
---|---|---|
Mean (SD) Age, years |
65.6 (8.7) |
56.1 (7.,5) |
N(%)男性 |
221(55%) |
2145(45%) |
コックス比例ハザード回帰モデルを推定し、男性の性別と年齢の指標を年単位で死亡までの時間に関連付けます。 パラメータ推定値は、SAS Cox比例ハザード回帰手順12を使用してSASで生成され、それらのp値とともに以下に示されています。,
Risk Factor |
Parameter Estimate |
P-Value |
---|---|---|
Age, years |
0.11149 |
0.0001 |
Male Sex |
0.,67958 |
0.0001 |
年齢と全原因死亡率の間、および男性の性別と全原因死亡率の間には正の関連があることに注意してください(すなわち、高齢参加者および男性の死亡リスク
ここでも、パラメータ推定値は、予測子の各単位増加に対する相対ハザードの予想対数の増加を表し、他の予測子を一定に保ちます。 0があります。,各年の相対ハザードの予想対数の11149単位増加年齢の増加、性別の定数を保持し、女性と比較して男性の相対ハザードの予想対数の0.67958単位増加、年齢
解釈可能性のために、パラメータ推定値を累乗することによってハザード比を計算します。 年齢の場合、exp(0.11149)=1.118です。 年齢の一年の増加に対して予想されるハザードの11.8%の増加があり(または予想されるハザードは1.12倍である)、性別は一定である。 同様に、exp(0.67958)=1です。,973. 予想されるハザードは、年齢を一定に保ち、女性に比べて男性で1.973倍高いです。
すべての原因死亡率に対する追加の危険因子を考慮し、拡大された危険因子のセットを死亡までの時間に関連付けるCox比例ハザード回帰モデルを推定するとします。 パラメータ推定値は、SAS Cox比例ハザード回帰手順を使用してSASで再び生成され、それらのp値とともに以下に示されています。また、以下に含まれる12は、95%信頼区間とともにハザード比です。,
すべてのパラメータ推定値は、他の予測子を考慮して推定されます。 年齢、性別、血圧および喫煙状態を考慮した後、総血清コレステロールと全原因死亡率、または糖尿病と全原因死亡率の間に統計的に有意な関連はない。 これは、これらの危険因子が全原因死亡率と関連していないと言うことではなく、それらの有意性の欠如は交絡(考慮される危険因子の間の相互関係)によるものである可能性が高い。 統計的に有意なリスク要因(すなわち,、年齢、性別、収縮期血圧および現在の喫煙状態)、ハザード比の95%信頼区間には1(ヌル値)が含まれていないこと。 対照的に、有意でない危険因子(総血清コレステロールおよび糖尿病)に対する95%信頼区間には、null値が含まれます。
例:
プロスペクティブコホート研究を実施して、ボディマス指数と発生までの時間(CVD)との関連を評価する。 ベースラインでは、参加者の体格指数は、心血管疾患の他の既知の臨床的危険因子(例えば、)とともに測定される。,、年齢、性別、血圧)。 参加者はCVDの開発のために最大10年間追跡されます。 N=3,937人の参加者の研究では、543人が研究観測期間中にCVDを発症する。 Cox比例ハザード回帰分析では、BMIとCVDまでの時間との関連は、BMIの一つの単位変化に対して0.02312(p=0.0175)のパラメータ推定値と統計的に有意であることが
パラメータ推定値を累乗すると、ハザード比は1.023、信頼区間は(1.004-1.043)です。, BMIを連続予測因子としてモデル化するため、CVDのハザード比の解釈は、BMIの一つの単位変化に対して相対的です(リコールBMIは、体重キログラムと身長メートルの二乗の比として測定されます)。 BMIの一単位の増加は、予想されるハザードの2.3%の増加と関連している。
解釈を容易にするために、参加者のBMIによって定義された体重の3つのカテゴリを作成するとします。
- 通常の体重はBMI<25.0、
- 25.0と29.9の間のBMIとして太りすぎ、
- 29.9を超えるBMIとして肥満として定義されます。,
サンプルでは、正常体重の定義を満たす1,651人(42%)の参加者、体重超過の定義を満たす1,648人(42%)、肥満の定義を満たす638人(16%)がいます。 3つのグループのそれぞれのCVDイベントの数を以下に示します。,
Group |
Number of Participants |
Number (%) of CVD Events |
---|---|---|
Normal Weight |
1651 |
202 (12.,2%) |
Overweight |
1648 |
241 (14.6%) |
Obese |
638 |
100 (15.7%) |
The incidence of CVD is higher in participants classified as overweight and obese as compared to participants of normal weight.,
ここでは、Cox比例ハザード回帰分析を使用して、研究のすべての参加者のデータを最大限に活用します。 次の表は、重量群のみを考慮した場合(未調整モデル)、年齢および性別を調整した場合、およびインシデントCVDの年齢、性別およびその他の既知の臨床
後者の二つのモデルは多変数モデルであり、交絡因子に対する重量と入射CVD調整との関連を評価するために行われる。, 三つの重み群があるので、三つのグループを表すために二つのダミー変数または指標変数が必要です。 モデルでは、太りすぎおよび肥満の指標を含め、正常体重を基準群とみなします。
*年齢、性別、収縮期血圧、高血圧の治療、現在の喫煙状況、総血清コレステロールのために調整されました。
未調整モデルでは、過体重参加者では正常体重参加者と比較してCVDのリスクが高く、肥満では正常体重参加者と比較してCVDのリスクが高い(ハザード比1.215および1。,310、それぞれ)。 しかしながら、年齢および性別の調整後、CVDリスクに関して太りすぎと正常体重の参加者の間に統計的に有意な差はない(ハザード比=1.067、p=0.5038)。 同じことは、年齢、性別、および臨床的危険因子を調整するモデルにも当てはまります。 しかし、調整後、肥満体重参加者と正常体重参加者とのCVDリスクの差は統計的に有意であり、正常体重参加者と比較して肥満参加者のCVDリスクが約30%増加する。,
トップに戻る|前のページ|次のページ