混合治愈模型

标准的混合治愈模型（mixture cure model）估计患者在时间 $t$ 的总生存率（OS） $S_{o} (t + a)$ ，其中 $a$ 表示患者队列年龄的均值。混合治愈模型假设总生存率的结果由两个亚组人群导致：治愈的患者（治愈比例为 $π$ ）和未治愈的患者（ $1 - π$ ）。值得注意的是，我们无法确认一个特定患者是属于治愈组或者未治愈组，我们只能得到治愈或未治愈患者占总人群的比例。

在治愈的患者中，癌症不再对生存率产生负面影响，其生存率应该和一般人群的生存率相同。治愈患者的背景生存率（background survival）表示为 $S_{b} (t + a)$ 。

在未治愈的患者中，癌症会对生存率产生负面影响，其生存率会比一般人群的生存率低。未治愈患者的生存率表示为 $S_{u} (t)$ ，该生存率取决于基线特征，如年龄、性别等，并可通过标准参数模型（standard parametric survival model）或灵活参数模型（flexible parametric survival model）估计得到。

在混合治愈模型中，总生存率等于背景生存率乘以癌症特异生存率。

$S_{o} (t + a) = S_{b} (t + a) \times (π + (1 - π) S_{u} (t))$

混合治愈模型也可以用风险函数（hazard function）表示。类似的，总风险函数 $h_{o} (t)$ 也有两部分组成：治愈患者的背景风险函数 $h_{b} (t + a)$ 和未治愈患者中癌症导致的高风险。

$h_{o} (t) = h_{b} (t + a) + \frac{(1 - π) \times f_{u} (t)}{π + (1 - π) \times S_{u} (t)}$

其中， $f_{u} (t)$ 是 $S_{u} (t)$ 的的概率密度函数（probability density function，PDF）。每一种分布的生存和风险函数（如Weibull或Gompertz分布）都有其特定的参数，详见Github仓库的“funs_hazard.R” and “funs_long_term_survival.R”。

当时用风险函数表示模型更容易计算log似然（likelihood， $L$ )，进而来使用最大似然法来估计模型参数。

$l o g L = \sum_{i = 1}^{N} d_{i} \times l o g h_{o} (t_{i}) + \sum_{i = 1}^{N} l o g S_{o} (t_{i})$

最近更新于 Apr 18, 2023