32

本篇推文引自:DPDDI: a deep predictor for drug-drug interactions

1. 摘要

在本工作中,我们提出了一种新的方法(即DPDDI),利用图卷积网络(GCN)和深度神经网络(DNN)模型作为预测器,从DDI网络中提取药物的网络结构特征,从而预测DDIs。GCN通过获取DDI网络中药物的拓扑关系来学习药物的低维特征表示。DNN预测器将任意两种药物的潜在特征向量串联起来作为对应药物对的特征向量,训练一个DNN,用于预测潜在的药物-药物相互作用。实验结果表明,该方法的性能优于其他四种先进的DDI方法

提出了一种有效而稳健的DPDDI方法,利用DDI网络信息,在不考虑药物性质(即药物的化学和生物性质)的情况下预测潜在的DDIs。该方法在其他ddi相关的场景中也应该有用,比如检测意外的副作用,以及指导药物联合使用。

2. 背景

利用药物-药物相互作用(DDIs)产生的协同效应,多药联合治疗复杂疾病是目前的流行趋势。然而,意外的DDI也可能引发副作用、不良反应,甚至严重的毒性反应,使患者处于危险之中。随着对多药治疗的需求日益增加,对DDIs的识别也越来越迫切。然而,无论在体内还是在体外,在大量的药物对中检测DDIs都是昂贵和费时的。为了协助筛选DDIs,计算方法已经发展,以推断候选药物-药物相互作用。

通常,基于机器学习的方法包括特征提取器和监督预测器。特征提取器根据药物特性,如化学结构、靶标、解剖治疗性化学分类(ATC)、副作用、药物和/或临床观察等,以特征向量的形式表示药物。监督预测通常是由分类算法实现:逻辑回归,决策树,朴素贝叶斯等。通常,预测器首先使用特征向量训练一个模型,然后使用经过良好训练的模型推导出潜在的DDI。大多数方法使用单一预测器,也有一些方法集成多个预测器。

图卷积网络(GCN)作为一种最流行的图嵌入方法,在药物的某些特性不可测的情况下,提供了一种很有前途的预测DDIs的方法。GCN可以保持网络节点(如药物)之间的结构关系,从而可以作为构建各种下游任务的机器学习模型的特征,如链接预测。近年来,GCN已被应用于药物开发和发现领域,如预测分子活性、预测药物副作用、预测药物靶点相互作用等。

在本工作中,我们引入了一种药物-药物相互作用的深度预测器DPDDI,它使用图卷积网络(GCN)来学习DDI网络中每种药物的低维特征表示,并使用深度神经网络(DNN)来训练模型。GCN在图嵌入空间中描述药物,用于捕获其与邻近药物的拓扑关系。实验结果表明,DPDDI方法在DDI预测方面优于现有的其他方法。

3. 讨论

DDI预测的一个关键因素是考虑的特征。我们将GCN衍生的DDI网络结构特征与其他三种化学结构和生物学特征进行了比较。结果表明GCN衍生的DDI网络结构特征在AUPR、召回率、精确度和F1分数方面实现了20%以上的改进。这些结果表明,基于GCN的DDI网络结构特征包含了更多的DDI鉴别信息,并且能够有效地学习DDI网络中每种药物的低维特征表示,即低维表示保留了DDI网络中丰富的结构信息。

如何将一对药物的最佳预测因子组合成另一个药物特征向量。我们采用了两个内积向量和两个集合的特征向量。表3的结果表明,串联运算符的性能最好,而内积运算符的性能最差。因此,我们在DPDDI中采用了级联运算符。

DPDDI的优越性能可归因于以下几个方面:i)设计了一个GCN模型来学习药物的低维特征表示,并捕获DDI网络的结构信息。ii)构建DNN模型作为判断两种药物之间是否存在相互作用的预测因子。DNN模型通过将药物对从高维空间映射到低维空间,可以学习药物对之间的非线性关系。

4. 结论

针对DDIs的初步筛选,本文提出了一种新的DDIs网络预测方法(DPDDI)。DPDDI由基于图卷积网络(GCN)的特征提取器和基于深度神经网络(DNN)的预测器组成。前者是在一个图嵌入空间中对药物进行特征描述,其中每个药物被表示为一个低维潜在特征向量,用于捕捉与其邻域药物的拓扑关系。后者将任意两种药物的潜在特征向量串联成一个特征向量,以表示相应的药物对,用于训练预测潜在相互作用的DNN。DPDDI的指定实验结果表明:i)级联特征聚合算子优于其他两种特征聚集算子,即内积和和算子;ii)GCN衍生的潜在特征大大优于由药物的化学、生物或解剖性质导出的其他特征;iii)DPDDI对不同规模的药物数量、DDI数量和网络稀疏性的数据集具有鲁棒性;iv)DPDDI的性能显著优于四种最先进的方法;v)在案例研究中,在前20个未观察到的候选药物中发现了13个经验证的DDI,显示了DPDDI预测新DDI的能力。综上所述,所提出的DPDDI是一种预测DDIs的有效方法,对于其他与DDI相关的情况,如意外副作用的检测和药物联合用药的指导,都有一定的参考价值。

5. 方法

5.1数据集

我们从drugbank4.0[32]中提取了已批准的小分子药物及其相互作用关系,构建了包含1562种药物和180576种注释药物相互作用的DB1数据集。为了与其他最先进的方法进行比较,我们采用了一个较小的数据集(名为DB2)来评估DPDDI的性能。DB2包含548种药物和48584种带注释的药物-药物相互作用。此外,我们还从DrugBank 5.0[33]收集了一个新的更大的数据集,以构建用于评估DPDDI稳健性的DB3数据集,包括1934种药物和230887种带注释的药物-药物相互作用。在DB1、DB2和DB3中,用已知的药物-药物相互作用对作为阳性样本来构建阳性集,而其他未标记的药物对被视为阴性样本,我们使用随机抽样策略来构建阴性集。从交互的角度来看,这三个数据集可以看作是DDI网络。那个表7总结了网络特性。

5.2 模型

该论文的模型如图2所示,简单来说,主要分为三步,第一步:使用GCN提取每个药物的特征。第二步:将每两个药物的特征串联起来,表示每两个药物的相互作用,并作为DNN的输入。第三步:将第二步的特征输入DNN,预测药物药物相互作用。模型细节参见论文:DPDDI: a deep predictor for drug-drug interactions。

在这里插入图片描述