加密新聞標籤聚合與專題資訊

ai-chemistry-instructions-build-molecule

此 AI 解讀您的化學指令並找到最佳建構分子方案

洛桑聯邦理工學院的研究人員建立了一個框架，讓化學家能以簡單語言描述他們的需求，並讓人工智慧篩選成千上萬的合成路徑，以找到合適的那一條。

2026-05-06 來源:decrypt.co

大型語言模型化學

AI 化學合成

逆向合成規劃

簡述

EPFL開發的Synthegy利用大型語言模型（LLM）根據化學家定義的目標對合成路徑進行排名，其判斷與專家判斷的吻合度高達71.2%。
該框架已針對36位獨立化學家進行了368次評估驗證。
實驗達到與專家之間協議相當的一致性。

從零開始設計分子是化學領域最困難的問題之一。這不僅僅是關於知道如何連接原子，更是關於了解正確的反應順序、何時保護分子的敏感部分，以及如何避免可能毀掉數月實驗工作的死胡同。

傳統上，這些知識存儲在經驗豐富的化學家腦海中。現在，EPFL的一個團隊希望將其納入語言模型中。

由Philippe Schwaller領導的研究人員本週在《Matter》期刊上發表了一篇論文，介紹了Synthegy，這是一個利用大型語言模型（LLM）作為化學合成規劃推理引擎的框架。其關鍵見解微妙但重要：該團隊不是要求人工智慧生成分子，而是利用人工智慧來評估傳統軟體已經產生的合成路徑。

它的運作方式如下：化學家輸入一個簡單的英文目標，例如「在早期階段形成嘧啶環」。現有的逆合成軟體（透過將目標分子分解成更簡單的部分來工作）隨後會生成數十甚至數百種可能的合成路徑。

Synthegy將每條路徑轉換為文本，並將其交給LLM，LLM會根據每條路徑與化學家指令的匹配程度進行評分。最佳的路徑會浮現出來，並附有書面解釋。

研究的主要作者 Andres M. Bran 在 EPFL 的一份聲明中表示：「為化學家製作工具時，使用者介面非常重要，而以前的工具都依賴繁瑣的過濾器和規則。」

該系統通過了一項雙盲研究驗證，該研究涉及36位獨立化學家，他們審查了368對路徑。他們的選擇與Synthegy的判斷有71.2%的時間吻合，這個數字大致與專家化學家之間相互認同的頻率一致。資深研究人員（教授和研究科學家）比博士生更頻繁地認同Synthegy的判斷，這表明該系統捕捉到了與經驗相關的相同戰略直覺。

研究人員測試了多個人工智慧模型，包括GPT-4o、Claude和DeepSeek-r1。人工智慧多年來在藥物發現領域已取得進展，但大多數方法都專注於針對特定任務進行狹義訓練的模型。Synthegy的設計是模組化的—它可以在後端連接任何逆合成引擎，並在推理端連接任何有能力的大型語言模型。Gemini-2.5-pro在基準測試中得分最高，而DeepSeek-r1似乎是一個強大的開源替代方案，可以在本地運行。

該框架還處理了第二個問題：反應機理闡明。這涉及化學反應為何發生，以及每個步驟中電子運動是如何進行的。Synthegy將反應分解為基本步驟，並讓LLM評估每個候選步驟的化學合理性。在核親取代等簡單反應中，最佳模型達到了近乎完美的準確性。

其潛在應用廣泛。藥物發現是其中一個顯而易見的應用。人工智慧在預測癌症治療結果方面已展現潛力，但同樣的方法也適用於化學家需要設計新材料或優化工業反應的任何領域。一個實際細節是：使用Synthegy評估60條候選路徑大約需要12分鐘，API費用約為2至3美元。