图2. AIScaffold工作流程。
图片来源:J. Chem. Inf. Model.
网站服务器——输入
输入包括:(1)起始骨架;(2)参考分子;(3)定点衍生(可选)。起始骨架是骨架衍生的起点,输入方式包括(1)输入SMILES;(2)使用JSME分子编辑器绘制;(3)上传结构图片;(4)上传后缀为”.sdf”、”.mol”或”.smi”的文件。输入支持3D结构,并会根据起始骨架与参考分子的3D叠合进行打分。参考分子用于筛选衍生结果,保留潜在的生物活性分子,并去除无活性分子。参考分子可以是生物活性分子或药物,其输入方式与起始分子相同。定点衍生可以使部分子结构在衍生后保持不变,即衍生仅发生在特定位点。输入的起始骨架显示在JSME编辑器中后,通过单击编辑器上方的蓝色按钮即可选择需要在衍生后保持不变的原子。
网站服务器——任务列表
提交任务后,页面将自动重定向到任务列表界面,可在此页面查看任务名称、开始时间和状态等。用户可以一次提交多个任务,后提交的任务将在队列中等待之前的任务完成。用户可以在任务完成后单击任务名称查看结果。通过单击任务的“收藏”按钮,该任务将被添加到收藏列表中。通过单击顶部栏中的按钮,用户可以随时访问任务列表。
网站服务器——输出
经过两个阶段的筛选,模型给出了最有前景的500个分子,同时这500个分子会与ChEMBL数据库进行对比,那些出现在ChEMBL中的分子会被标记。对ChEMBL中分子的重现可以证明该模型生成活性分子的能力。对于结果中那些排名在ChEMBL重现分子之前的分子,用户可以给予特别注意。因为这些分子在生物活性和ADMET特性方面可能比已知的ChEMBL分子更好,但尚未被报道。对于最终结果中的每个分子,输出包括(1)2D结构和3D构象;(2)计算得到的QED值(越大表明类药性越好);(3)合成可及性打分(越小越容易合成);(4)计算得到的分子属性、官能团以及理化性质;(5)ADMET性质预测及对应概率;(6)叠合分数;(7)排序在该分子之后的重现ChEMBL分子。
网站服务器——部署
网站服务器托管在微软云平台上,使用Java和Python3开发,在Ubuntu操作系统上运行。硬件包括一个12核CPU,112G内存和2个用于加速的NVIDIA K80 GPU。此外还提供了离线部署解决方案,以保护知识产权。
案例展示