工程科學系博士生在國際頂級會議KDD 2026發表創新研究成果:提出全球首個分子毒性修復基準ToxiMol

2026/06/10

近日,澳科大創新工程學院工程科學系智能科學與系統博士課程三年級博士生林飛作為第一作者,在國際頂級學術會議 ACM SIGKDD Conference on Knowledge Discovery and Data Mining(KDD 2026)發表題為《Breaking Bad Molecules: Are MLLMs Ready for Structure-Level Molecular Detoxification?》的研究論文。該論文在眾多投稿中脫穎而出,獲錄用為 Oral發表(Oral錄用僅為該會所有錄用論文中的前20%)。論文由澳科大聯合上海交通大學、中國科學院自動化研究所、中國科學院過程工程研究所生物藥製備與遞送全國重點實驗室、上海人工智慧實驗室及寧波大學共同完成,其通訊作者為澳科大創新工程學院工程科學系王飛躍教授。

林飛博士生

KDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining)是數據挖掘、人工智慧與數據科學領域最具影響力的國際頂級學術會議之一,被中國計算機學會(CCF)推薦為A類國際學術會議。 根據 Google Scholar Metrics 統計,KDD 長期位居數據挖掘與知識發現領域國際頂尖會議行列,在全球人工智慧與數據科學研究領域具有廣泛影響力。本次論文獲錄用於 KDD 2026 AI for Sciences Track Oral,僅占錄用論文中的少數比例,體現了該研究成果的創新性與學術價值。 此次成果也是澳科大作為第一單位在 KDD 會議上發表的首篇研究成果,彰顯了澳科大在人工智慧與生命科學交叉領域(AI for Science)的卓越研究實力與創新能力 。

在新藥研發的早期階段,大量候選分子會因吸收、分佈、代謝、排泄與毒性(ADMET)屬性不佳而被淘汰,其中毒性問題是導致臨床前階段失敗的重要原因 。傳統的毒性規避通常依賴資深藥物化學專家進行反覆試驗,過程複雜、成本較高,難以實現規模化自動探索 。近年來,通用多模態大模型(MLLMs)在跨模態感知和複雜推理方面展現出強大能力 。然而,通用 MLLM 是否真正具備「識別毒性機制並優化分子結構」的能力,過去仍缺乏系統的驗證 。

針對這一核心難題,研究團隊提出了全球首個專為評估通用 MLLMs 分子毒性修復能力而設計的基準任務——ToxiMol。該基準覆蓋 11 個毒性修復主任務,涵蓋 LD50、DILI、AMES 等典型毒性端點,共構建了 660 個具有高結構複雜度與機制異質性的真實有毒分子樣本。為實現對修復結果的嚴格評估,該研究進一步設計了多維度評估框架 ToxiEval。該框架採用了「全約束通過」的嚴格策略:候選分子必須同時滿足結構有效性、安全評分、成藥性(QED)、合成可行性(SAS)等多重約束,才會被判定為毒性修復成功。通過 ToxiMol 與 ToxiEval 的結合,此項成果首次構建起面向結構級分子毒性修復任務的標準化評測體系,為後續相關領域的探索提供了重要的基礎設施。

ToxiMol 分子毒性修復任務與 ToxiEval 多準則評估鏈

此次研究成果的發表,展現了澳科大在人工智慧與交叉科學研究領域的持續創新能力,以及在 AI for Science 前沿方向上的國際競爭力。 未來,澳科大將繼續支援前沿科學研究,推動人工智慧與生命科學、醫藥健康等領域的深度融合,為全球科技創新與智慧社會發展貢獻更多力量。

論文鏈接

(https://arxiv.org/abs/2506.10912)

GitHub 項目主頁:https://github.com/HydroSophy/ToxiMol

數據集:https://huggingface.co/datasets/HydroSophyTech/ToxiMol-benchmark