
從零開始設計分子是化學領域最困難的問題之一。這不僅僅是關於知道如何連接原子,更是關於了解正確的反應順序、何時保護分子的敏感部分,以及如何避免可能毀掉數月實驗工作的死胡同。
傳統上,這些知識存儲在經驗豐富的化學家腦海中。現在,EPFL的一個團隊希望將其納入語言模型中。
由Philippe Schwaller領導的研究人員本週在《Matter》期刊上發表了一篇論文,介紹了Synthegy,這是一個利用大型語言模型(LLM)作為化學合成規劃推理引擎的框架。其關鍵見解微妙但重要:該團隊不是要求人工智慧生成分子,而是利用人工智慧來評估傳統軟體已經產生的合成路徑。
它的運作方式如下:化學家輸入一個簡單的英文目標,例如「在早期階段形成嘧啶環」。現有的逆合成軟體(透過將目標分子分解成更簡單的部分來工作)隨後會生成數十甚至數百種可能的合成路徑。
Synthegy將每條路徑轉換為文本,並將其交給LLM,LLM會根據每條路徑與化學家指令的匹配程度進行評分。最佳的路徑會浮現出來,並附有書面解釋。
研究的主要作者 Andres M. Bran 在 EPFL 的一份聲明中表示:「為化學家製作工具時,使用者介面非常重要,而以前的工具都依賴繁瑣的過濾器和規則。」
該系統通過了一項雙盲研究驗證,該研究涉及36位獨立化學家,他們審查了368對路徑。他們的選擇與Synthegy的判斷有71.2%的時間吻合,這個數字大致與專家化學家之間相互認同的頻率一致。資深研究人員(教授和研究科學家)比博士生更頻繁地認同Synthegy的判斷,這表明該系統捕捉到了與經驗相關的相同戰略直覺。
研究人員測試了多個人工智慧模型,包括GPT-4o、Claude和DeepSeek-r1。人工智慧多年來在藥物發現領域已取得進展,但大多數方法都專注於針對特定任務進行狹義訓練的模型。Synthegy的設計是模組化的—它可以在後端連接任何逆合成引擎,並在推理端連接任何有能力的大型語言模型。Gemini-2.5-pro在基準測試中得分最高,而DeepSeek-r1似乎是一個強大的開源替代方案,可以在本地運行。
該框架還處理了第二個問題:反應機理闡明。這涉及化學反應為何發生,以及每個步驟中電子運動是如何進行的。Synthegy將反應分解為基本步驟,並讓LLM評估每個候選步驟的化學合理性。在核親取代等簡單反應中,最佳模型達到了近乎完美的準確性。
其潛在應用廣泛。藥物發現是其中一個顯而易見的應用。人工智慧在預測癌症治療結果方面已展現潛力,但同樣的方法也適用於化學家需要設計新材料或優化工業反應的任何領域。一個實際細節是:使用Synthegy評估60條候選路徑大約需要12分鐘,API費用約為2至3美元。
該論文承認了目前的局限性。大型語言模型有時會錯誤解讀其文本表示中反應的方向,導致對可行性的錯誤判斷。較小的模型表現不比隨機猜測好。超過20個步驟的長路徑更難以連貫地追蹤。
相關程式碼和基準測試已在 github.com/schwallergroup/steer 公開提供。