35
本篇推文引自:Structure-Based Drug-Drug Interaction Detection via Expressive Graph Convolutional Networks and Deep Sets
1. 摘要
在这项工作中,我们提出了一种利用图卷积网络和深集(deep sets),基于分子结构的药物药物相互作用检测方法。与传统的GCN相比,我们提出了一个更具鉴别性的卷积层,在不丧失捕获复杂相互作用的能力的情况下实现置换不变预测(置换不变预测应该指的是,药物A与药物B的相互作用和药物B与药物A的相互作用,预测结果是一致的)。
2. 介绍
药物-药物相互作用(DDI)可分为协同作用和拮抗作用。有研究报道,30%的药物不良反应是由DDI引起的,其中一些导致了不可逆转的严重后果。因此,DDI的识别对于治疗效果和患者安全至关重要。计算方法已经被提出来检测DDI,包括最近应用深度学习和图卷积网络(GCNs)。然而,现有的大多数GCNs的设计不能完全捕捉分子结构,相互作用预测往往沦为简单的相似性度量,导致预测性能不理想。在本文中,我们提出了一个基于GCN的框架,用于从分子结构中识别特定类型的DDI。提出的框架包括一个具有更有表现力的GCN层的编码器和一个解码器,该解码器捕获更复杂的交互,同时保持输入的排列不变性。我们将在一个真实的数据集中评估我们的方法,并演示对每个模块以及整个框架的改进。
3. 方法
提出的框架如图1所示:
图卷积编码器。图卷积层通过聚集邻域原子特征来编码分子结构。GCN的表达能力指的是它将两个不同的邻域结构映射到不同位置的能力。为了获得最大的表达能力,我们在GCN 的第1层采用了MLPs而不是1LP (single layer perceptron),求和池化层用作聚合函数。药物的最终表示是通过对所有原子表示求和得到的。
Deep sets decoder.两种药物之间的相互作用应该是对称的,即无论两种药物的排列如何,所提出的模型应该输出相同的结果。这种对称设计可以潜在地减少模型的复杂性,但也存在无法捕获复杂相互作用的风险。因此,除了使用传统的点积,我们考虑通过深集(Deep sets)来建模这种交互作用。提出的解码器有两种变体。不变解码器将集合中对象的表示相加,然后应用非线性变换。一种等变解码器通过具有设计权重的神经网络层对交互进行建模,并可以多次堆叠以增加深度,如图2所示。通过最小化交叉熵损失来优化整个模型。
4. 实验
整个框架由一个GCN编码器和一个交互解码器组成。为了评估每个模块及其组合所带来的潜在效益,我们考虑了以下几个场景:1)固定解码器,评估所提出的编码器;2)固定编码器,评估所提解码器;3)评估整个框架。我们使用DDI数据集(Zitnik, Agrawal, and Leskovec 2018)进行实验,该数据集包含63,473种独特药物对引起的1317种独特不良反应。 结果通过对不同任务的收敛性和训练精度的比较,比较了提出的GCN层和传统的GCN层的识别能力。结果如图3所示,表明与其他GCN变体相比,提出的GCN具有更大的辨别能力。对于相同的GCN编码器,不同解码器的性能如图4所示。整个框架和基线的泛化性能见表1。总的来说,与深集解码器相结合的GCN编码器在所有任务的所有竞争方法中产生最好的性能。