新闻
IBM Research Europe和Science of Synthesis合作改进对化学反应结果的预测 2021-08-03
封面.jpg

Collaborate to accelerate discovery in 

organic chemistry

2018年,IBM推出了RXN for Chemistry云平台,帮助合成有机化学家使用名为Molecular Transformer的人工智能 (AI) 模型预测化学反应的结果。如今,该平台使用相同的底层技术,已经执行了来自26 000名用户的近400万次预测,以及来自世界各地不同群体的100多篇已发表的论文。

获得最佳预测结果的先决条件是高质量的数据集。直到最近,RXN for Chemistry还在接受来自专利和教科书式化学反应的250万条记录的培训。在对训练数据的代表性化学进行测试时,基线模型的准确率超过90%,但要成为发现过程的标准工具,IBM 团队知道需要将其范围扩大到其他反应类别。

今年早些时候,IBM Research和Thieme Chemistry合作,将Science of Synthesis的专家合成数据整合到RXN for Chemistry中,其后在Science of Synthesis上进行测试时的初步结果表明,经过Thieme训练的模型预测正确反应的频率是基线模型的两倍。

6108b79494b21.jpg

Science of Synthesis对两个反应的正向反应预测的初步结果。

IBM Research Europe杰出科学家Teodoro Laino博士说到:

有机化学家面临的挑战是有机化合物有成千上万种可能的反应。为了解决这个问题,我们对所有RXN预测任务使用了自然语言处理模型。RXN模型没有内置化学,也不是基于编码规则。每一个化学预测都基于在训练期间从数据中学到的知识。借助人工智能、云和自动化,今天我们可以将有机化学的发现速度提高十倍。

RXN for Chemistry应用神经机器翻译模型来预测化学反应的结果,这与 AI 模型将文本从一种语言翻译成另一种语言的方式非常相似。 这个人工智能平台的目标是对反应结果进行可靠的预测,从而改进有机化学的合成计划。

用高质量、多样化和结构良好的数据推动技术创新

将一种语言翻译成另一种语言的工具与训练算法所依据的数据一样好,我们的假设是预测化学合成结果也是如此:结果在很大程度上取决于基础数据。

IBM研究科学家 Alain Vaucher博士


Thieme Chemistry产品管理、战略合作伙伴关系和Science of Synthesis高级总监M. Fiona Shortt de Hernandez博士:

我们很高兴直接参与这个对化学界具有重要意义的创新项目,六位知名有机合成专家及其团队已同意测试再培训模型。此次合作将有助于推动开发 为有机化学家提供最先进的定制工具。

Teodoro Laino博士补充说到:

Science of Synthesis的高质量、精选数据,为我们提供一个绝佳机会,将RXN的化学性能提升到前所未有的水平。我很高兴分享这些初步结果,并对他们在接下来的几个月里,将如何改善有机化学家的人工智能体验充满好奇。与Thieme的合作是人工智能解决方案提供商和特定领域数据出版商之间的一个重要里程碑,对双方都具有重大意义和机会。

如果您有兴趣使用接受过Science of Synthesis培训的IBM RXN for Chemistry作为云服务,请联系:ibmrxn@thieme-chemistry.com

免费获取IBM RXN for Chemistry:https://rxn.res.ibm.com