找回密码
 立即注册

QQ登录

只需一步,快速开始

The effects of reference panel perturbations on the accuracy of genotype impu...

作者:diyicizhuce | 时间:2023-8-13 22:20:44 | 阅读:480| 显示全部楼层
基于参考的基因型插补是一种标准技术,在涉及基因组数据的大规模研究中越来越流行。基因型插补过程中涉及的两个关键要素是(1)目标个体被插补到的单倍型参考面板,以及(2)用于推断目标个体中缺失基因型的插补算法。插补文献历来主要关注(2),一项典型的比较研究调查了在保持参考面板不变的情况下各种插补算法的相对性能。然而,参考小组本身(1)对整体插补性能的作用,即使不是更重要,也与许多高性能算法中的选择同等重要。尽管参考面板的质量应该在插补的准确性中发挥作用是直观的,但尚不清楚面板创建过程中的常见错误(如基因分型和相位误差)在多大程度上导致插补性能不理想。在这项研究中,我们研究了将三种不同的扰动模式应用于人类遗传学中广泛使用的单倍型参考面板对由此产生的插补准确性的影响。具体而言,我们通过(1)随机引入相位误差,(2)随机引入基因型误差,以及(3)从面板中随机修剪变异(所有变异都在不同程度上)来干扰参考面板。然后,我们将一组不同测序覆盖率(0.5x、1.0x和2.0x)的不同个体估算到这些不同的扰动面板中,并使用整个队列以及祖先分层子集的r2度量来评估估算准确性。我们观察到,相位和基因型扰动都会显著影响插补准确性,尤其是在等位基因频率非常低的情况下,而修剪变异的影响要小得多。然后,我们根据经验验证了我们的模拟可以可靠地预测现实世界数据集中潜在过滤技术的影响。在单倍型参考面板的背景下,这些结果表明,阶段和基因分型的准确性远比用于插补的参考面板的密度更重要。

https://doi.org/10.1101/2023.08.10.552684
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册