公眾號/?
編輯 | 蘿卜皮
材料科學的一個基本挑戰是闡明化學計量、穩定性、結構和性質之間的關系。最近的進展表明,機器學習可用于學習這種關系,從而可以準確預測材料的穩定性和功能特性。然而,這些方法中的大多數使用原子坐標作為輸入,因此在研究以前未識別的材料時會受到晶體結構識別的限制。
劍橋大學的研究人員提出了新方法,通過將原子坐標的無限搜索空間粗化到組合可枚舉的搜索空間中來解決這個瓶頸。關鍵思想是使用 Wyckoff 表示,晶體中對稱相關位置的無坐標集,作為機器學習模型的輸入。
該模型證明了在尋找未知的理論上穩定的材料方面具有極高的精度,僅從 5675 次從頭算計算中識別出位于先前計算材料的已知凸包之下的 1569 種材料。
該研究以「Rapid discovery of stable materials by coordinate-free coarse graining」為題,于 2022 年 7 月 27 日發布在《Science Advances》。
大海撈針通常被用作材料發現的類比。只有一小部分可行的材料組合物[被認為是 O(10^10) 數量級] 將具有熱力學穩定的多晶型物,可通過實驗獲得。應對這一挑戰的大多數方法都集中在材料屬性的預測模型上,即過濾掉 hay 的隱喻篩子。
在這里,劍橋大學的研究人員尋求另一種方法:能否通過改變表示材料的方式來縮小材料空間的大小——讓大部分 hay 消失?
該方法受到科學中普遍存在的概念的推動:粗粒度。以分子化學為例,化學家通常使用分子圖來建立關于化學性質的直覺。分子圖是分子的粗粒度表示,每個圖對應于一個獨特的原子坐標系。在分子圖的可枚舉空間中進行搜索,而不是在可能的原子坐標的無數空間中進行搜索,使得能夠開發強大的計算工具和努力窮舉枚舉化學空間成為可能。
然而,在材料科學中,晶體結構的類似粗粒度表示缺失。研究人員面臨著無數的搜索空間問題。基于成分的方法可以在一定程度上克服這一挑戰,但這樣做的代價是丟棄有關所考慮材料的晶體結構的所有信息。因此,需要廣泛的計算晶體結構搜索或基于實驗室的實驗來驗證預測。
應對這一挑戰的一個途徑是,使用新穎的描述符探索受限類別的結構原型。指定原型避免了晶體結構搜索的需要,隨著驗證的計算成本大大降低,可以進行更廣泛的篩選活動。
圖示:使用 Wyckoff 表示的粗粒度材料空間可實現高效的數據驅動材料發現。(來源:論文)
在這里,研究人員介紹了一種通過考慮 Wyckoff 表示、晶體中對稱相關位置的無坐標集來概括這些原型限制模型的方法。該框架使研究人員能夠為材料發現任務開發準確的機器學習模型,其中松弛的晶體結構是先驗未知的。
研究人員測試了模型在各種化學物質中識別以前未識別的穩定材料的能力,表明它的精度比基于元素替代的最先進的無坐標方法的精度高 3 倍。
同時,評估了該模型在識別具有不同結構的相圖中的穩定結構方面的性能,結構表明,該模型在相圖中找到了低能結構,而計算量降低了約 5 倍。
圖示:Wren 可以對以前未知的穩定材料進行自動計算勘探。(來源:論文)
該團隊還開發了一個材料探索管道,從已知材料的初始核心開始,篩選附近的材料空間,并允許有效地發現新的穩定材料。他們僅從 5675 次從頭算計算中識別出 1569 種迄今未知的材料,它們位于先前計算的材料的已知凸包之下。
這些結果表明,利用 Wren 可以更有效、更廣泛地擴展計算材料科學數據庫。這些努力對于加快尋找向低碳經濟過渡所需的各種工業所需材料至關重要,例如熱電、壓電、快離子導體、高壓多價陰極材料和熱材料。
「這種材料結構預測挑戰類似于生物學中的蛋白質折疊問題。」領導這項研究的劍橋卡文迪什實驗室的 Alpha Lee 博士說,「一種材料可以『折疊』成許多可能的結構。除了材料科學問題可能比生物學更具挑戰性,因為它考慮了更廣泛的元素。」
「可能的材料數量比我們自古代以來制造的材料總數大四到五個數量級。」同樣來自卡文迪什實驗室的 Rhys Goodall 博士說,「我們的方法提供了一種有效的計算方法,可以『挖掘』以前從未制造過的新的穩定材料。然后可以對這些假設材料的功能特性進行計算篩選。」
研究人員現在正在使用他們的機器學習平臺來尋找新的功能材料,例如介電材料。他們還將實驗約束的其他方面整合到他們的材料發現方法中。
論文鏈接:https://www.science.org/doi/10.1126/sciadv.abn4117
相關報道:https://phys.org/news/2022-07-ai-tackles-materials.html