这是一个非常流行病学方法学中的经典问题。

简短的回答是:队列研究通常不适合研究罕见的暴露。
下面我将详细解释为什么,并介绍在这种情况下更合适的研究设计。
为什么队列研究不适合罕见暴露?
队列研究的基本逻辑是:根据暴露状态将研究对象分为暴露组和非暴露组,然后前瞻性地追踪一段时间,比较两组之间结局(如疾病)的发生率。
这个设计在处理罕见暴露时会遇到几个致命的困难:

样本量巨大,研究成本高昂
这是最核心的问题,为了确保研究有足够的统计学效力(即能够真实地暴露出暴露与结局之间的关联),暴露组需要有足够数量的研究对象。
- 举例说明:假设我们要研究“长期接触某种罕见化学物质(暴露)”与“某种癌症(结局)”的关联,根据文献,这种暴露在人群中的 prevalence(患病率)可能只有 0.1%,如果我们想要一个 10,000 人的研究队列,那么我们需要筛选 1,000,000 人才能找到 100 个暴露者(10,000 / 0.1% = 1,000,000)。
- 后果:如此巨大的样本量意味着研究需要投入巨额的资金、大量的人力物力进行招募、基线数据收集和长期随访,这在现实中往往是不可行的。
研究效率低下
队列研究,尤其是前瞻性队列研究,需要等待结局事件的发生,如果暴露组人数很少,那么在研究期间,暴露组中发生结局的人数也会非常少。
- 举例说明:如果暴露组只有 100 人,而该癌症的年发病率是 1/1000,那么在一年内,我们可能连 1 个病例都观察不到,这使得计算相对危险度等效应指标变得非常困难,结果极不稳定,可信度低。
研究时间过长
为了获得足够的结局事件,研究者可能需要一个非常长的随访期,这会导致:
- 失访率增高:研究对象在长达十年、二十年甚至更长时间的研究中,可能会失去联系,导致数据缺失。
- 历史变迁影响:在漫长的随访期内,诊断技术、治疗方案、环境因素、人们的生活方式等都可能发生巨大变化,这些混杂因素会变得极难控制。
研究罕见暴露应该用什么研究设计?
当暴露罕见时,病例对照研究 是首选的、更高效的研究设计。

病例对照研究如何解决这个问题?
病例对照研究的逻辑是“由果及因”,它不是从暴露开始,而是从结局开始。
- 确定研究人群:在一个明确的人群中(如一个城市、一个医院),找到所有已经发生了我们所研究疾病(结局)的人,这组人称为“病例组”。
- 选择对照:从同一个人群中,随机选择一组没有发生该疾病的人,这组人称为“对照组”,对照组在除了疾病状态外,其他方面应尽可能与病例组具有可比性。
- 回顾性调查暴露史:通过查阅病历、问卷访谈等方式,回顾性地收集病例组和对照组在过去的暴露史信息。
- 比较分析:比较两组中暴露史的比例,从而判断暴露与疾病之间的关联。
为什么病例对照研究适合罕见暴露?
- 高效且经济:研究者不需要去寻找大量的暴露者,相反,他们可以集中资源去寻找已发生的病例,即使暴露在人群中很罕见,只要病例组中能找到几个有暴露史的人,就可以进行分析。
- 样本量小:只需要确定一定数量的病例和对照即可,不需要庞大的队列,要研究上述罕见暴露与癌症的关联,我们只需要找到 200 个癌症患者(病例组)和 400 个健康人(对照组),然后回顾他们过去的暴露情况即可,这比招募 100 万人现实得多。
- 时间短:由于不需要等待新病例的发生,研究可以在相对较短的时间内完成。
总结与对比
| 特征 | 队列研究 | 病例对照研究 |
|---|---|---|
| 研究逻辑 | 由因及果 (前瞻性) | 由果及因 (回顾性) |
| 分组依据 | 是否暴露 | 是否患病 |
| 样本选择 | 暴露组 vs. 非暴露组 | 病例组 vs. 对照组 |
| 适合暴露 | 常见暴露 | 罕见暴露 |
| 适合结局 | 罕见疾病 | 常见或罕见疾病 |
| 时间顺序 | 清晰,能确立因果时序 | 不清晰,可能产生回忆偏倚 |
| 研究效率 | 低,耗时耗力 | 高,快速经济 |
| 计算指标 | 发病率、相对危险度 | 比值比、优势比 |
队列研究是研究常见暴露与疾病之间因果关系的“金标准”,因为它能直接计算发病率,并且时间顺序清晰,当暴露因素本身在人群中非常罕见时,由于其巨大的样本量需求和低效率,队列研究变得不切实际,在这种情况下,病例对照研究是更理想、更高效的选择。
