广医在线讯 遗传变异与人类健康的关联性是全球最重要的科学前沿问题之一。我校神经科学研究所廖卫平教授研究团队继去年在Genetics in Medicine(IF=9.9)提出癫痫相关基因突变的致病性评估方法,近日又在Briefings in Bioinformatics(IF=9.1)发表题为“Optimization of in silico tools for predicting genetic variants:individualizing for genes with molecular sub-regional stratification”的文章,首次提出并证实个体化策略对于遗传变异软件预测模型的重要性。该论文第一作者为汤斌博士,廖卫平教授和苏涛副研究员为文章的共同通讯作者。
利用生物信息学的技术预测遗传变异的影响是研究遗传变异与人类健康关联性的重要手段。迄今为止,已经开发了许多预测软件,随着机器学习技术的引入,预测性能逐步提高。然而,目前的生物信息学软件预测模型往往基于全基因组变异的混合训练。分子或分子亚区之间在功能、结构和变异敏感性等方面都是独特的,有必要对特定基因变异的预测进行个体化优化。在这项研究中,与癫痫领域相关的3个基因(SCN1A,SCN2A,KCNQ2)被用于探索个性化策略的效能和优化途径。通过交叉验证和无偏评估,结果发现基于分子亚区的数据集分类和再训练得到的预测模型,其准确率远高于传统软件,甚至比新近开发的全新算法(如CADD,Eigen和M-CAP)更准确。这些证据提示了分子亚区的不同致病性特点,以及预测软件进行个体化模型再训练的必要性。可以预见,这种优化策略与先进算法相结合将为当前的基因突变的生物信息学预测软件的开发带来更加广阔的开发前景。