谷歌DeepMind的人工智能梦想中出现了380,000种新材料下一个挑战是让它们真实存在

谷歌DeepMind的人工智能梦想已实现,创造出380,000种新材料,下一步挑战是让它们真正应用于现实世界

机器人的炊事员们都深陷于他们的食谱中,在一个设备堆满的房间里辛勤工作。在一个角落里,一个关节式机械臂选择和混合成分, 另一个沿着固定轨道来回滑动,操作着烤箱.第三个则负责上盘,在一个盘子上小心翼翼地倒出一个坩埚的内容物。劳伦斯伯克利国家实验室和加州大学伯克利分校的物料科学家格兰布兰德·塞德(Gerbrand Ceder),这个机器臂细致地捏住并封好一个空的塑料瓶–这种非常棘手的任务也是他最喜欢观察的任务之一,塞德点了点头表示赞同, 心生赞叹, 然后看着两位研究生露出了一个异样的表情。

配备了镍氧化物和碳酸锂等成分的实验室设施,名为A-Lab,旨在制造新颖有趣的材料,尤其是可能对未来电池设计有用的材料。结果可能是不可预测的。即使是人类科学家通常在第一次尝试的时候都会制作出错误的食谱。所以有时候机器人会制作出一份美丽的粉末。有时候则是一个糊状的熔化物, 或者全部蒸发而没有残留。此时,“人类必须做一个决定:我现在该怎么办?” 塞德说。

机器人的目标是一样的。他们分析他们所创建的东西,调整配方,然后再试一次。再试一次。再试一次。 “早上给它们一些食谱,晚上回家可能你会有一个美味的新的酥状蛋奶酥”,物料科学家克里斯汀·佩尔森(Kristin Persson)说, 他是塞德在劳伦斯伯克利国家实验室(LBNL)的密切合作伙伴(也是配偶)。或者你只会回到一个烧焦的烂摊子。“但至少明天他们会做出一个更好的酥状蛋奶酥。”

视频:玛丽莲·萨金特/伯克利实验室

最近,塞德的机器人的烹饪范围呈指数级增长,得益于Google DeepMind开发的一款AI程序。这款名为GNoME的软件是使用Materials Project的数据进行培训的,该项目是一个可免费使用的数据库,由佩尔森负责监督,其中包含了15万个已知材料的信息。根据这些信息,AI系统为 220 万种新晶体设计了方案,其中 38 万种被预测为稳定的——不太可能分解或爆炸,因此是在实验室中合成的最有可能的候选材料——将已知稳定材料的范围扩大了近10倍。在一篇于今天在《自然》杂志上发表的论文中,作者写道,下一个固态电解质、太阳能电池材料,或者高温超导材料,都有可能隐藏在这个扩大的数据库中。

找到这些一个大海捞针般的东西,开头就要实际制造它们,这就是更加迅速地工作并且在夜晚工作的更多理由。在最近的一系列实验中,劳伦斯伯克利国家实验室的自主实验室在17天内就能够制造出41种被理论预测的材料,从而有助于验证AI模型和实验室的机器人技术。

在决定一个材料是否实际可制造的时候,无论是人类还是机器人,首先要问的问题中之一就是它是否稳定。通常,这意味着其原子的排列方式处于可能能源状态的最低位置。否则,晶体将会希望成为其他物质。几千年来,人们不断增加稳定材料的名单,最初是通过观察自然界中发现这些材料或通过基本的化学直觉或偶然发现它们。最近,候选材料是通过计算机设计的。

问题在于,根据佩尔森的说法,存在偏见:随着时间的推移,这些集体知识已经偏向于某些熟悉的结构和元素。材料科学家称之为“爱迪生效应”,指的是他快速的试错过程,试验了数千种碳材料之后才找到了一种来源于竹子的灯丝。后来又花了十年时间,一个匈牙利团队才找到了钨元素。“他被自己的知识所限制,”佩尔森说。“他有偏见,他坚信不疑。”

DeepMind的方法旨在超越这些偏见。该团队从佩尔森的库中开始了69000个材料,这是一个免费使用并由美国能源部资助的数据库。这是个好的起点,因为这个数据库包含了理解为何某些材料稳定而其他材料不稳定所需的详细能量信息。但这些数据还不足以克服Google DeepMind研究员Ekin Dogus Cubuk所说的机器学习和经验科学之间的“哲学矛盾”。就像爱迪生一样,AI在过去所见之外几乎无法产生真正新颖的想法。他说: “在物理学中,你永远不会想要学到你已经知道的东西,你几乎总是想要一般化出领域 – 不论是发现一种不同类别的电池材料还是一种新的超导理论。”

活跃学习是GNoME所依赖的一种方法。首先,一种名为图神经网络(GNN)的人工智能利用数据库学习稳定结构中的模式,并找出如何在新结构中最小化原子键的能量。然后,利用周期表的整个范围,它产生数千个潜在的稳定候选物。下一步是使用一种名为密度泛函理论(DFT)的量子力学技术对其进行验证和调整。然后,将这些经过精炼的结果插入到训练数据中,并重复这个过程。

图为Materials Project数据库中的12种化合物结构。插图:Jenny Nuss/Berkeley Lab

研究人员发现,通过多次重复,这种方法可以生成比Materials Project数据集中最初的复杂结构更复杂的结构,包括由五个或六个不同元素组成的结构。这些类型的材料涉及如此多的复杂原子相互作用,以至于它们通常超出人类的直觉。“它们以前很难发现,”Cubuk说。“但现在它们不再那么难找了。”

但是, DFT只是理论验证的一部分。下一步是真正制造一些东西。所以,Ceder的团队选择了58种晶体在A-Lab中制造。考虑到实验室的能力和可用的前体材料,这是一次随机选择。一开始,就像预期的那样,机器人失败了,然后一再调整它们的配方。经过17天的实验,A-Lab成功制造出41种材料,占总材料的71%,有时尝试了十多种不同的配方。

参与研究的犹他大学材料科学家Taylor Sparks表示,看到用于新型材料合成的自动化工作是有希望的。但是他补充说,使用人工智能提出数千种新的假设材料,然后用自动化追赶它们,并不实际。图神经网络正广泛用于开发新的材料想法,但通常研究人员希望通过量身定制努力来生产具有有用特性的材料,而不是盲目地生产数十万个材料。他说:“我们已经有了比我们可以承受的更多想要调查的事情。”挑战是这种量产合成能否接近预测的规模?根本不可能。

在《自然》论文中的38万种材料中,可能只有一小部分可以变成实际可制造的。有些涉及放射性元素,或者过于昂贵或稀有。有些则需要涉及无法在实验室中制造的极端条件的合成方法,或者实验室供应商手头没有的前体材料。

即使对于那些有可能成为下一代光伏电池或电池设计的材料而言,将一个基础晶体转化为产品仍然是一个漫长的过程。Persson举例说,一个锂离子电池中的电解质。关于晶体的能量和结构的预测可以应用于解决问题,例如确定锂离子在其上的扩散性(这是性能的一个关键方面)。然而,它很难预测这种电解质是否会与周围材料发生反应,从而破坏整个设备。此外,通常情况下,新材料的实用性只有与其他材料的组合或添加剂的操控相结合时才变得明显。

不过,材料范围的扩展为合成提供了更多的可能性,并为未来的人工智能程序提供了更多的数据,如参与研究的多伦多大学的材料科学家Anatole von Lilienfeld所述。它还有助于将材料科学家从他们的偏见推向未知领域。“你迈出的每一步都是很棒的,”他说。“它可以开启一个新的化合物类型。”

Materials Project可以呈现出材料的原子结构。这种化合物(Ba₆Nb₇O₂₁)是GNoME计算出的新材料之一。它包含了钡(蓝色)、铌(白色)和氧(绿色)。视频:Materials Project/Berkeley Lab

Google也对GNoME产生的新材料的可能性感兴趣,Google DeepMind研究副总裁Pushmeet Kohli表示。他将GNoME与AlphaFold进行了比较,后者是该公司的软件,以其成功预测蛋白质折叠的能力令结构生物学家们大为震惊。两者都通过创建科学家可以探索和扩展的新数据存档来解决基本问题。从这里开始,该公司计划解决更具体的问题,例如聚焦于有趣的材料特性并利用人工智能加快合成。由于在开始时通常可用的数据比预测稳定性的数据少得多,这两个问题都具有挑战性。

Kohli表示,该公司正在探讨直接与物质合作的选择,无论是通过与外部实验室合作还是继续与学术伙伴合作。他还补充说,还可以建立自己的实验室,这与AlphaFold取得成功后于2021年成立的DeepMind的药物探索衍生公司Isomorphic Labs相似。

对于试图将材料投入实际应用的研究人员来说,情况可能会变得复杂。材料项目因允许包括商业活动在内的任何类型的使用而受到学术实验室和公司的欢迎。谷歌DeepMind的材料将根据不同的许可证发布,禁止商业使用。“它是为学术目的而发布的,”Kohli说。“如果人们希望进行调查和探索商业合作等等,我们将根据具体情况进行评审。”

一些使用新材料的科学家指出,如果在学术实验室中的测试导致了一种可能的GNoME生成材料的商业用途,公司将拥有何种发言权尚不清楚。普遍而言,没有特定用途的新晶体不容易获得专利,并且追溯其来源到数据库可能是困难的。

Kohli还表示,虽然数据正在发布,但目前没有发布GNoME模型的计划。他提到了安全考虑因素——该软件理论上可以用于构想危险材料——以及对谷歌DeepMind材料战略的不确定性。“很难对商业影响做出预测,”Kohli说。

Sparks预计,他的学术同行们对GNoME缺少代码将感到不满,就像最初发布AlphaFold时生物学家们的反应一样(该公司后来发布了代码)。他说:“这太差劲了。”其他材料科学家可能希望复制结果并研究如何改进模型或将其调整为特定用途。但是没有模型,他们无法做到这两者,Sparks说。

与此同时,谷歌DeepMind的研究人员希望数以十万计的新材料足以让理论家和合成者——无论是人类还是机器人——忙个不停。“每一种技术都可以通过更好的材料来改进。这是一个瓶颈,”Cubuk说。“这就是为什么我们必须通过发现更多材料并帮助人们发现更多材料来推动该领域。”