Angew. Chem. |:ScopeMap——一种探索反应适用范围与边界的“人机协同”AI工作流
2026年5月8日,清华大学基础分子科学中心罗三中教授团队在Angewandte Chemie期刊上在线发表题为“ScopeMap: An AI-Assisted, Human-in-the-Loop Workflow for Mapping Reaction Scope and Boundaries”的研究论文。罗三中教授,赵保国教授和杨骐研究员为论文通讯作者,清华大学基础分子科学中心博士生栗嘉伟为论文第一作者。

评估合成方法的普适性是有机化学研究的基石。然而,传统的底物范围评估通常依赖化学家的直觉和经验法则,这往往导致选出的底物集中在高活性的“安全区”,而无法准确勾勒出反应的真正边界。近年来,一些数据驱动的AI算法虽然被引入,但大多倾向于“最大化反应性能”(如追求高产率),它们类似于寻找目标的“猎人”,而不是绘制整个反应空间版图的“制图师”。
ScopeMap 旨在高效映射反应的适用边界,而非仅仅最大化性能。它的核心优势在于能够将负面的实验反馈(即失败的实验数据)转化为几何约束条件,从而引导采样避开已知错误区域。

图1 底物范围拓展方法的比较。 (A) 传统的纯人工策略:依赖于启发式规则,例如官能团遍历以及空间和电子属性的正交筛选。 (B) 以前的AI辅助方法:这些方法通常利用分子指纹或密度泛函理论(DFT)描述符,并结合降维和层次聚类技术。 (C) 我们提出的工作流:通过将CVT能量函数与排斥惩罚项相结合,该策略确保了采样的均匀性和代表性。其独特之处在于,它结合了一个迭代反馈机制,能够根据实验结果动态地更新采样范围。我们还提出了一种用于评估底物范围的方法。
该工作流主要包含三个迭代阶段:
空间构建:利用混合分子描述符(MACCS Keys和ECFP指纹)对目标化学空间进行参数化,以有效捕捉原子的连接模式和官能团分布。
拓扑采样:与传统的聚类方法不同,ScopeMap 利用改进的质心泰森多边形(CVT)算法,确保采样点在描述符空间中呈现几何均匀分布。
交互式边界优化:当化学家通过实验发现某些底物不兼容(如导致催化剂中毒)时,算法会触发局部的“几何排斥势”。这种排斥力会动态重塑后续的采样网络,主动避开这些失效区域,向未探索的反应边界推进。
为了客观且量化地评估底物选择的质量,研究团队创新性地引入了两个衍生指标:
U-Score(均匀度 Uniformity):基于空间熵,反映在有限实验预算下底物分布的绝对空间均匀性与选择效率。
R-Score(代表性 Representativeness):基于均方距离,衡量选定的底物子集代表和覆盖全局底物空间的能力。

图2 羟醛缩合(Aldol)反应数据集上采样性能的系统基准测试。(A)全局数据集与ScopeMap选择的子集(N=20-100)之间的产率/转化率分布比较,说明了不同样本大小下分布的一致性。(B)芳香醛底物空间的UMAP可视化,对比了ScopeMap与专家知识选择的20个底物。提供了代表性的化学结构和计算出的总空间熵以突出多样性。(C) 在ScopeMap生成的子集 (N=20-100)上训练的分类模型的性能(准确率、召回率和F1分数)。实验方案:数据集按8:1:1的比例划分为训练集、验证集和测试集。随后,仅在训练集内进行采样。(D)在来自不同采样策略的子集(N=20)上训练的回归模型的性能(RMSE)。实验方案:数据集预先划分为训练集、验证集和测试集(8:1:1);采样严格限制在训练集部分。误差线表示由五次独立的随机划分计算出的平均值和标准差。
研究团队对现有主流的底层采样算法进行了系统的基准测试。分析结果揭示了一个化学空间采样中的内在矛盾:
距离最大化策略(如Kennard-Stone、FPS):为了追求极致的均匀度,往往会将采样点强行推向化学空间的稀疏边缘,从而牺牲了对整体底物的代表性。
基于距离的聚类方法(如Ward):通常能很好地捕捉核心密集区的特征,保持高代表性,但容易导致局部扎堆,均匀度表现欠佳。
团队发现,提升代表性必然需要对密集区域进行采样(降低均匀度),而最大化均匀度则迫使样本进入稀疏区域(降低代表性)。ScopeMap 所采用的改进型 CVT 算法(质心泰森多边形),正是在这两者之间找到了极其优异的化学意义上的平衡点,避免了传统统计学抽样(如拉丁超立方LHS、Sobol)在迭代反馈机制中的局限性。

图3 完整的ScopeMap工作流在羟醛缩合反应数据集上的评估。(A)基准催化不对称羟醛缩合反应的常规反应式。(B)由该工作流识别的被选中和被排除的芳香醛代表性示例。该比较突出了ScopeMap捕获的巨大化学多样性,涵盖了广泛的官能团、电子特性和空间位阻环境。(C) 左图:展示所选底物在全芳香醛空间内分布的UMAP投影。蓝点对应于实验验证的阳性(反应成功)结果,橙点代表被模型归类为“接受”(或保留)的底物,而灰点表示阴性结果或原始数据集中缺失的底物。右图:ScopeMap、人类专家选择(以既定的底物范围原则为指导)和WARD聚类方案(以前广泛使用的传统基准)之间空间熵和MSD指标的定量比较。
研究团队在一个包含1000多个手性分子的高通量仿生羟醛缩合反应数据集上对该方法进行了基准测试。结果表明,ScopeMap 仅需使用不到4%的底物空间代表性子集,就能以超过 90%的F1分数成功预测整个反应空间的反应性。

图4 ScopeMap在伯胺-钴催化氧化偶联反应上的评估。(A)钴催化偶联基准的常规反应式。(B)通过UMAP可视化的六次迭代中采样轨迹的时空演变。排斥势场由灰色背景梯度描绘。灰点代表前几轮采样的底物,而蓝点表示当前的选择。该序列说明了算法避免高势能区域(负面区域)和现有集群的动态策略,有效地将新样本引导到未探索的可行空间中。(C) 底物范围分布比较:上图为由ScopeMap生成的最终库,下图为原始实验范围。蓝色轮廓线描绘了全局底物空间的密度。在ScopeMap的选择中,蓝点对应于实验验证的阳性命中,而灰点表示阴性结果或原始数据集中缺失的底物。(D) ScopeMap识别的代表性结构。所选库包含了多种实验上可行的底物,值得注意的是,它自主捕获了原始研究中定义的三个不同类别的非反应性底物,验证了该工作流重新发现反应限制的能力。
此外,团队还在一个近期发表的钴催化氧化偶联反应数据集中进一步证实了该工作流的多功能性。在模拟实验中,ScopeMap 能够自主捕捉并广泛覆盖实验中明确无法反应的底物类别(如酚类、羧酸类等),成功实现了对反应限制边界的重新发现与高分辨率映射。
表1:实验底物集与ScopeMap底物选择的均匀度(Uniformity)和代表性(Representativeness)评估及评分指标。

为了进一步验证该评价体系的实战价值,研究团队将这套标准化打分框架(U-Score与R-Score),应用到了课题组此前发表的涵盖光化学、电化学等领域的四篇真实文献(底物范围在14-60个不等)中,对其人工精心挑选的底物库进行了回溯性“阅卷”。横向对比结果揭示了人类化学家的“偏科”:在绝大多数纯人工选择的底物拓展中(如苯乙烯类、硫醇类底物测试),代表性(R-Score)普遍极高(接近90),但均匀度(U-Score)却极不稳定且偏低(低至10~30左右)。这印证了化学家通常会遵循标准的实验逻辑(如正交筛选吸电子/给电子基团、位阻大小等),从而保证了底物的代表性;但由于缺乏全局视角,常常在熟悉的结构基序上“扎堆”测试,导致极大的冗余和极低的均匀度。这一横向对比证明了,仅仅依赖化学直觉进行底物拓展往往会陷入局部最优的认知偏见。而结合了化学知识的算法干预,能够以更小的实验成本,构建出一个兼顾空间覆盖率与信息密度的完美反应版图。
总结与展望
这项工作为定义合成方法的普适性提供了一种资源节约型的新范式。它倡导将有机合成方法学的评估重点从“详尽的数据枚举”转向“高信息密度的边界映射”。为方便使用,研究团队已将该工具开源并部署在Web平台供大家自由访问(开源地址:https://github.com/DeepSynthesis/ScopeMap,在线工具地址:https://scopemap.deepsynthesis.top/)。
论文信息:Li, J.; Xiao, X.; Yang, Q.; Zhao, B.; Luo, S. ScopeMap: An AI-Assisted, Human-in-the-Loop Workflow for Mapping Reaction Scope and Boundaries. Angew. Chem. Int. Ed. 2026, e2455429. DOI: 10.1002/anie.2455429.
ScopeMap在线服务平台使用指南
在线平台地址:https://scopemap.deepsynthesis.top/
一、 底物空间的构建与导入
ScopeMap提供两种灵活的底物池构建模式,以满足不同实验场景的需求。
模式 A:基于ZINC数据库自动提取生成(Generate Space)
如果您希望在广阔的公共化学空间中寻找灵感,可以使用自然语言描述让系统为您生成底物池。

输入描述:在Generate Space模块的输入框内,用英文描述您所需的底物拓展类型(如:“aromatic aldehydes”, “allyl alcohols”, “biphenyl scaffolds” 等)。
提交与确认:点击右侧Submit。系统后台的大语言模型(LLM)会自动为您提取关键的子结构,并展示其SMARTS表达式及二维结构预览图。请核实识别的子结构是否符合您的预期(如不符合可点击右侧垃圾桶图标删除)。

设置分子量限制:在下方输入期望的最小分子量(Minimum Molecular Weight)和最大分子量(Maximum Molecular Weight),如100至500。
生成空间:点击绿色按钮Generate Space。
⚠️注意:由于ZINC数据库包含海量分子,全库检索耗时较长(预计需要5-10分钟),请耐心等待。

预览与加载:检索完成后系统会弹出成功提示,并展示匹配的分子(默认展示前 20 个)。确认无误后,点击左下方的蓝色按钮 Use Space,将这些分子加载到核心采样系统中。
模式 B:上传实验室自有底物库(File Upload)
如果您已经整理好了实验室现有的底物列表或商业可及库,可以直接上传本地文件。

准备文件:准备一份.csv格式的表格文件。文件必须包含名为SMILES的列,用于存放分子的SMILES字符串(其他列信息随意)。

上传文件:在 File Upload 模块中,点击“选择文件”选中您的CSV,然后点击右侧蓝色的Upload File按钮。
成功确认:等待弹出“File uploaded successfully!”(或CSV file successfully generated and loaded into the sampling system!)提示后,即代表底物库导入成功。
二、 迭代式底物推荐与筛选 (Iterative Sampling)
底物池就绪后,即可进入最核心的“人机协同”环节。

1. 参数配置 (Current Status)
在 Current Status 面板中,您可以查看和调整迭代采样的核心参数:
Iteration Round(迭代轮次):当前进行的迭代轮数(由系统自动推进)。
Batch Size(单批次推荐量):设置每次系统推荐的底物个数(如:5个)。
Target Sample Count(目标总数):您计划在这个反应中总共测试的底物数量(如:20个)。
Repulsion Strength(排斥强度):(核心参数)控制新一轮推荐的底物在多大程度上远离那些“不反应/被剔除”的底物。滑动条默认为0.0,您可以手动调高该强度以主动避开失效区域
2. 执行采样与实验反馈
开始采样:参数设置完毕后,点击控制台下方的绿色按钮 Start Sampling。

空间可视化 (Visualization Chart):系统会自动生成二维UMAP降维图,直观展示底物池的全局密度分布以及当前推荐底物所处的空间位置。
人工实验反馈:
在Current Sample Points(当前样本点)列表中,系统列出了本轮推荐的底物及其结构图。
输入实验结果:进实验室完成测试后,如果底物实验成功(或您想保留它),保持左侧复选框勾选状态(Keep);如果实验失败或不希望继续探索该类结构,取消勾选。
反馈完成后,再次点击Start Sampling进行下一轮迭代。
系统会自动将成功保留的底物移入左下方的Sampled Points(已采样区),将取消勾选的底物移入右下方的Excluded Points(排除区),并基于此动态调整下一轮的采样策略。
三、 实验进度的保存与恢复 (Checkpoint Control)
由于真实的湿法实验周期较长,平台支持实验进度的中途缓存与断点续传。

保存进度:当您完成了一批实验并录入反馈后,在 Checkpoint Control 模块点击黄色的 Download Checkpoint 按钮。系统会下载一个包含当前所有状态信息的备份文件。

恢复进度:几天后如果您想继续该实验,只需点击灰色的Upload Checkpoint按钮上传之前保存的备份文件,系统将瞬间恢复到您上一次离开时的迭代进度和数据分布状态。
四、 结果导出与高阶绘图
当“已保留底物数”达到您的目标底物数量后,迭代即可终止。
下载最终底物单:点击绿色的Download Samples按钮,导出最终挑选出的底物清单。
本地绘制高清 UMAP 降维图(用于论文发表):您可以利用最后一次迭代下载的checkpoint.csv文件,在本地Python环境中重新绘制高清的UMAP分布图(图例会清晰区分 BASE底物池、Sampled已采样点、Excluded排除点和Pending待定点)。

绘图脚本在以下地址获取:https://github.com/DeepSynthesis/ScopeMap/blob/main/get_umap.py
本地Python绘图环境配置代码(以Python 3.11为例):
1. 创建并激活虚拟环境
py -3.11 -m venv .venv
.venv\Scripts\activate.bat
2.升级 pip 并安装所需依赖库
python -m pip install --upgrade pip
python -m pip install pandas numpy matplotlib seaborn umap-learn
3. 执行绘图脚本(需确保获取的 get_umap.py 与 checkpoint.csv 同属一个文件夹)
python get_umap.py checkpoint.csv
4.绘图完成,退出环境
deactivate
ScopeMap 的精髓不在于一次性选出所有分子,而是严格遵循 “生成少量推荐 -> 进行湿法实验 -> 录入成败结果 -> 生成下一批” 的闭环。正是通过将失败的实验结果转化为“几何排斥”约束,系统才能真正帮您精准映射出反应的真实适用边界!