孟德尔随机化之MendelianRandomization包（第三讲）

生信与临床

发布于 2022-08-21 17:31:24

1.6K0

发布于 2022-08-21 17:31:24

在前两期推送中，我和大家分别介绍了“MendelianRandomization”的IVW和median-based方法，并详细介绍了这两种方法的参数以及使用建议。在这一期的内容中，我将和大家一起学一下“MendelianRandomization”包的MR-Egger法和Maximum likelihood法，后者我们通常译作极大似然估计法。

第一部分：MR-Egger方法

library(MendelianRandomization) #加载R包
MRInputObject <- mr_input(bx = ldlc,bxse= ldlcse,by = chdlodds,byse = chdloddsse) #指定输入文件
EggerObject1 <-mr_egger(MRInputObject,robust = FALSE,penalized = FALSE,correl =FALSE,distribution = "normal",alpha = 0.05)

在mr_egger()函数中，所有的参数都和IVW方法中的类似，这里就不赘述了，忘记的小伙伴请看“MendelianRandomization”包的第一讲内容孟德尔随机化之MendelianRandomization包（第一讲）。

EggerObject1 #查看结果

从上述结果，我们可以看出，MR的效应估计值是3.253，并且具有统计学显著性，另外由于截距项和0无显著差异，可以认为MR-Egger的结果不存在水平多效性。这里需要注意I^2_GX这一项，它是一个0到1之间的数，其值越大，说明MR估计的结果越准确，弱工具变量的偏倚就会越小【1】。

考虑到上述结果有很强的异质性，因此我们考虑采用稳健回归，并对异常的SNP（outlier）进行“惩罚”：

EggerObject2 <-mr_egger(MRInputObject,robust = TRUE,penalized = TRUE,correl =FALSE,distribution = "normal",alpha = 0.05) 
EggerObject2 #查看结果

可以看出，使用稳健回归后，MR估计值的误差变小了，但显著性并未改变。这也充分说明，LDL的升高可以增加CHD的发病风险。

第二部分：Maximum likelihood方法（极大似然估计法）

总的来看，极大似然估计法和IVW法并没有本质上的区别，因此在实际的文献中，大家通常都在使用IVW法，很少去报道极大似然估计法的结果。不过，相对于IVW方法，极大似然估计法也有着自身的两点优势：（1）它充分考虑了SNP-exposure关联的不确定性，这一点在IVW的简单加权中是被忽略的；（2）它考虑了双样本MR研究中样本重叠的情况，主要是通过参数psi来控制，在样本完全不重叠的情况下（传统的独立双样本MR研究），psi为0；如果样本完全重叠的话，psi等于观察性研究中暴露和结局的相关性（相关系数）【2】。

MaxLikObject1 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi =0,distribution = "normal",alpha = 0.05)

在mr_maxlik()函数中，它的参数和IVW的类似，这里就不赘述了。

MaxLikObject1 # 查看结果

MaxLikObject2 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi = 0.3,distribution= "normal",alpha = 0.05)
MaxLikObject2 # 查看结果

MaxLikObject3 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi = 0.6,distribution= "normal",alpha = 0.05)
MaxLikObject3 # 查看结果

MaxLikObject4 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi = 0.9,distribution= "normal",alpha = 0.05)
MaxLikObject4 # 查看结果

在4次极大似然估计中，米老鼠逐渐增加psi的值，我们不难发现，随着psi的增加，MR估计值的误差也在不断增加，其实也说明在样本重叠的情况下，如果exposure和outcome有较强的关联的话，所带来的误差就会比较大，因此我们提倡尽量避免样本的重叠，如果重叠了的话，建议可以使用这个极大似然估计法计算样本完全重叠的情况下的MR估计值，如果仍然显著的话，说明结果还算可靠（这个方法不提倡）。

关于使用“MendelianRandomization”包进行MR-Egger分析和Maximum Likelihood分析的内容就讲到这里，大家要注意：(1) MR-Egger有助于辅助判断水平多效性和弱工具变量偏倚；（2）Maximum Likelihood有助于判断样本重叠带来的偏倚。咱们下期见！

参考文献：

【1】I-squared statistic: Jack Bowden and others. Assessing the suitabilityof summary data for Mendelian randomization analyses using MR-Egger regression:The role of the I2 statistic. Int J Epidemiol 2016

【2】Stephen Burgess, Adam S Butterworth, Simon G Thompson. Mendelianrandomization analysis with multiple genetic variants using summarized data.Genetic Epidemiology 2013; 37:658-665. doi: 10.1002/gepi.21758.

本文参与腾讯云自媒体分享计划，分享自微信公众号。

原始发表：2021-06-03，如有侵权请联系 cloudcommunity@tencent.com 删除

data

using

本文分享自生信与临床微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体分享计划，欢迎热爱写作的你一起参与！

data

using

登录后参与评论

0 条评论

热度

孟德尔随机化之MendelianRandomization包（第三讲）

孟德尔随机化之MendelianRandomization包（第三讲）

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐