锹形虫

V1

2023/04/02阅读:20主题:嫩青

【Argue】2S Mendelian Randomization - 1

【Argue】2S Mendelian Randomization - 1

两样本孟德尔随机化(Two Sample Mendelian Randomization, 2SMR),杠壹。在早期良好 QC 下的 GWAS 之后,想要获得 2SMR 的结果就十分简单了,只需要根据指南上的要求将数据格式调整好,然后喂给它,它就会吐出我们想要的结果了。可是,如果专业课老师所说,我们不要求大家掌握繁杂的计算和推理过程,我们只要求学会使用和解读结果那么,如何解读 2SMR 的结果呢?[1]

1. 一点基础知识

考虑到目前为止的线性分析除了拓展到了多因素之外,与本科甚至高中的线性回归理解方式差异并不大,因此我们在解读 2SMR 结果之前,先简单学习一下它的理论基础,这也是为后续的结果解读做好铺垫。由于详尽叙述篇幅较长,因此我尽量使用简单的语言描述以期缩短浏览全文的时间。

1) MR 的理论基础

如上,与暴露 X 稳定关联的基因位点 j 在考虑 X 与 Y 之间的混杂因素 U 和随机误差 之后其与 X 的关系如式 1 所示,位点 j 的效应大小为 GammaJ。同样的,在考虑 X 与 Y 之间的混杂因素 U 和随机误差 之后结局 Y 公式假定其与 X 的关系为前述与 X 对 Y 的因果效应 BetaX 和位点 j 对 结局 Y 的直接效应大小 AlphaJ 与其效应量(Dosage)的加和表示,如式 2 。 它们之间的关系如图 1。

图 1

2) Wald method 理论

如上式,Wald 检验中将式 1 中的位点 j 对 Y 的直接效应以及其通过 X 产生的因果效应合并为 GAMMA_J,然后将所有误差合并到 , 这里的理解其实并不难,考虑到这些公式都是继续线性回归,因此将式 1 中的位点 j 对 X 的效应与 X 对 Y 的因果效应联合考虑在乘以位点的 Dosage 即是式 1 和因果效应 Beta 的估计,然后再考虑位点 j 本身对结局 Y 的直接效应,即形成上式中第二个等号。此外这个过程中由于 U 和 随机误差均认为是一致的,因此可以直接被合并到一个误差项中,也就是 。而这个理论即是一般的 MR 检验中的多个假设的理论基础,但在那之前,我们先了解一下在进行 MR 分析之前的一些条件(注意这更像是对于位点的质量控制,而不是工具变量的假设,但我会将它们放在 2 中一同阐述)。

2. 一些条件

1) 位点的质控

在良好 QC 下的 GWAS 之后(参考标准 GWAS 及 QC 的过程,step by step[2]),MR 对纳入位点仍存在几点要求如下:

  1. 纳入位点应该与暴露之间存在稳健的关联关系,这可以考虑 P 值以及使用曼哈顿图或者区域图进行筛选;
  2. 位点应该互不相关,这可以采用 LD clumping 完成,即考虑位点之间的 LD 关系;
  3. 位点应该满足哈代平衡,一般考虑计算关联时设定 HWE 阈值。

这些要求是所有首次纳入分析位点都应该满足的,也是 MR 的一些前期工作。

2) 工具变量的假设

工具变量假设是在一般(或称为传统的) MR 分析中的,主要包括三点。简单来说,如果您了解一些 IVW 方法及结果解读,那么就应该知道它是建立在所有位点均满足工具变量假设的前提下的。

  1. 纳入位点应该与 X 和 Y 之间的混杂因素 U 相互独立;
  2. 位点应该与暴露 X 稳定关联;
  3. 位点应该独立于 X 对于 Y 的因果效应以及 U 对于 Y 的效应(即式 2 中 Alpha = 0)

3) InSIDE

InSIDE:Instrument Strength Independent of Direct Effect,即工具变量对于 X 的效应应该独立于其对于结局 Y 的直接效应,亦可以表述为位点 J 即使存在直接效应,那这种效应也不应该影响到 X 对 Y 的因果效应过程中,即不应该影响 U。这意味着 2) 中的工具变量假设第三点将被弱化,而这是一种更稳健的 MR 检验方法(MR-Egger Test)的理论基础

3. IVW 与 MR-Egger Test

关于这两种最常用的 MR 结果评价方法,其具体解释将会放到下一次的文章中,本篇主要阐述其理论基础,对于 IVW(inverse-variance weighted,逆方差加权) 方法有,

由于线性回归系数(效应)估计我们是可以不考虑误差项(截距)的,且 IVW 法本身强制合并的回归直线截距为 0,因此式 4 即是对因果效应的直接估计,不同于前述单个位点的效应估计,IVW 法在多个位点的情况下,利用逆方差加权的方法对它们的因果效应进行综合评价,最后获得总体的因果效应估计。此处的逆方差即是每个位点的标准误的平方的倒数(所谓“惩罚就是除法"),可以看作是对每个位点在考虑了其样本量(标准误为抽样误差的估计,受样本量影响)之后的对于其效应的修正。

MR-Egger Test 与 IVW 的方法几乎完全一致,不同的是其计算过程考虑了误差项,也就是截距,因此基于 MR-Egger Test 方法估计的回归直线并不强制经过原点,它与 IVW 方法各有优劣,而这些内容我们将在下一次的文章中进行讨论。

好了,这就是本次关于 2SMR 的全部内容了,虽然标题是 2SMR,但实际上是对 MR 方法数学理论的整体描述。而关于 MR 的设计基础和为何其能够实现因果效应推断的原理我便直接略过了(因为那些内容发布较多且不会产生理解困难)。后续我将续写关于结果解读和分析实现的相关内容。

全文完,感谢浏览。

参考资料

[1]

Mendelian randomization with invalid instruments: effect estimation and bias detection through Egger regression: Int_J_Epidemiol._2015;44(2):512-525.

[2]

Tutorial: a guide to performing polygenic risk score analyses: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7612115/

分类:

其他

标签:

医学

作者介绍

锹形虫
V1