工程科学系博士生在国际顶级会议KDD 2026发表创新研究成果:提出全球首个分子毒性修复基准ToxiMol

2026/06/10

近日,澳科大创新工程学院工程科学系智能科学与系统博士课程三年级博士生林飞作为第一作者,在国际顶级学术会议 ACM SIGKDD Conference on Knowledge Discovery and Data Mining(KDD 2026)发表题为《Breaking Bad Molecules: Are MLLMs Ready for Structure-Level Molecular Detoxification?》的研究论文。该论文在众多投稿中脱颖而出,获录用为 Oral发表(Oral录用仅为该会所有录用论文中的前20%)。论文由澳科大联合上海交通大学、中国科学院自动化研究所、中国科学院过程工程研究所生物药制备与递送全国重点实验室、上海人工智慧实验室及宁波大学共同完成,其通讯作者为澳科大创新工程学院工程科学系王飞跃教授。

林飞博士生

KDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining)是数据挖掘、人工智慧与数据科学领域最具影响力的国际顶级学术会议之一,被中国计算机学会(CCF)推荐为A类国际学术会议。 根据 Google Scholar Metrics 统计,KDD 长期位居数据挖掘与知识发现领域国际顶尖会议行列,在全球人工智慧与数据科学研究领域具有广泛影响力。本次论文获录用于 KDD 2026 AI for Sciences Track Oral,仅占录用论文中的少数比例,体现了该研究成果的创新性与学术价值。 此次成果也是澳科大作为第一单位在 KDD 会议上发表的首篇研究成果,彰显了澳科大在人工智慧与生命科学交叉领域(AI for Science)的卓越研究实力与创新能力 。

在新药研发的早期阶段,大量候选分子会因吸收、分布、代谢、排泄与毒性(ADMET)属性不佳而被淘汰,其中毒性问题是导致临床前阶段失败的重要原因 。传统的毒性规避通常依赖资深药物化学专家进行反复试验,过程复杂、成本较高,难以实现规模化自动探索 。近年来,通用多模态大模型(MLLMs)在跨模态感知和复杂推理方面展现出强大能力 。然而,通用 MLLM 是否真正具备「识别毒性机制并优化分子结构」的能力,过去仍缺乏系统的验证 。

针对这一核心难题,研究团队提出了全球首个专为评估通用 MLLMs 分子毒性修复能力而设计的基准任务——ToxiMol。该基准覆盖 11 个毒性修复主任务,涵盖 LD50、DILI、AMES 等典型毒性端点,共构建了 660 个具有高结构复杂度与机制异质性的真实有毒分子样本。为实现对修复结果的严格评估,该研究进一步设计了多维度评估框架 ToxiEval。该框架采用了「全约束通过」的严格策略:候选分子必须同时满足结构有效性、安全评分、成药性(QED)、合成可行性(SAS)等多重约束,才会被判定为毒性修复成功。通过 ToxiMol 与 ToxiEval 的结合,此项成果首次构建起面向结构级分子毒性修复任务的标准化评测体系,为后续相关领域的探索提供了重要的基础设施。

ToxiMol 分子毒性修复任务与 ToxiEval 多准则评估链

此次研究成果的发表,展现了澳科大在人工智慧与交叉科学研究领域的持续创新能力,以及在 AI for Science 前沿方向上的国际竞争力。 未来,澳科大将继续支援前沿科学研究,推动人工智慧与生命科学、医药健康等领域的深度融合,为全球科技创新与智慧社会发展贡献更多力量。

论文链接

(https://arxiv.org/abs/2506.10912)

GitHub 项目主页:https://github.com/HydroSophy/ToxiMol

数据集:https://huggingface.co/datasets/HydroSophyTech/ToxiMol-benchmark