新算法可识别与疾病相关基因

2020-12-02 14:09:33

俄罗斯圣光机大学(ITMO)生物信息学研究人员开发了一种算法,可帮助评估基因对人体过程(包括疾病发展)的影响。这项研究发表在《BMC生物信息学》上。

脱发、肥胖或视力低下可能与特定基因有关,识别出相关基因组,有利于研究和治疗。此外,为确定基因和病情之间是否存在联系,了解基因之间的相互作用也非常重要。

ITMO助理教授爱列克谢·谢尔盖西切夫解释说:“总的来说,每个人有超过2万个基因。通过将患者病情相关基因与健康人的基因进行比较,我们可以看到二者之间活性和表现形式的差异。基于此信息,可以创建一个共同的图示,显示所有基因之间的相互联系,并且每个基因都被分配一个权重因子。通常,科学家们只继续研究最活跃的基因,对其进行特殊的子图绘制,但是将这些基因从‘普通背景’中分离出来,就失去了评估每个基因与其他基因的关联性进而进行诊断的机会。”

在新研究中,研究人员不仅专注于权重因子最高的那个基因系统,还提出了一种新方法,可利用整个基因组上的数据生成数十万个子图。该算法基于马尔可夫链蒙特卡罗方法,可计算每个样本与所讨论病情之间的联系概率,并就每个基因之间的相互作用分析样本的组成。

研究人员从一组基因中删除一个基因,如果活跃基因的数量增加,则表示正确并保存结果。否则就重新开始。通过一系列步骤,权重因子开始快速增长。这样一来,该算法就可以生成大量图形。

有了这样一个样本组,研究人员就可发现比其他基因更频繁出现的基因。如果一个基因出现在90%的此类子图中,那么就可90%地确定该基因与相关疾病的关系。

该项目研究人员指出,这一算法未来可表示为带有滑动条的程序,允许用户出于各种目的以各种置信度生成结果。例如,置信度水平越低,显示的基因就越多,反之亦然。如果仅需要确定信任的基因,可以将置信度水平设置为约99%。