北大深圳钻研生院新质料学院潘锋/李舜宁AI4S妨碍:基于家养智能的物资妄想剖析算法以及模子构建 – 质料牛

时间:2024-04-27 05:08:33 来源:目怔口呆网

布景介绍

运用家养智能(AI)技术实现质料妄想剖析的深圳生院舜宁算法自动化是物资妄想以及新质料钻研的一种新范式。北京大学深圳钻研生院新质料学院潘锋教授团队基于图论数学工具,钻研质料开拓了一套以妄想基元及其衔接关连与相互熏染为因素的新质质料基因开掘措施,乐成构建了搜罗60万余种自力晶体妄想的料学质料学数据库(Sci China Chem, 2019, 8, 982; Natl Sci Rev, 2022, 9, nwac028)。凭证该数据库可能天生质料的院潘于家养智种种模拟图谱,搜罗X射线衍射(XRD)图案、锋李S妨中子衍射图案、碍基红外/拉曼光谱等等。物资妄想这些数据为增长质料表征规模的剖析AI辅助迷信(AI4S)钻研提供了紧张根基。

对于有机化合物,及模X射线衍射(XRD)合成在物资妄想剖析的构建历程中起到了紧张熏染。传统的深圳生院舜宁算法XRD合成流程中,钻研职员在面临未知质料时假如无奈从数据库中找到其物相的钻研质料晶体妄想,则需要借用临近的新质妄想模子,经由对于该模子妨碍调解以取患上实测物资的料学晶体妄想。该历程中所借用的妄想模子对于应了未知质料的一种可能的妄想规范。对于未知质料妄想规范的分说艰深依赖于专家知识,因此接管机械学习措施实现该历程的自动化仍颇为难题。其关键在于有机质料的妄想规范种类繁多,导致了磨炼患上到的深度学习分类模子每一每一难以取患上较高精度。

 

下场掠影

克日,北京大学深圳钻研生院新质料学院潘锋/李舜宁团队基于所构建的质料数据库,妄想了一个基于残差神经收集的深度学习模子CrySTINet该模子可能从试验表征患上到的XRD数据中精确识别出未知质料的妄想规范,为自动化XRD合成提供了新的道路。相关钻研下场以“Crystal Structure Assignment for Unknown Compounds from X‑ray Diffraction Patterns with Deep Learning”为题,宣告于《Journal of the American Chemical Society》(J. Am. Chem. Soc. 2024, DOI: 10.1021/jacs.3c11852)。

 

该使掷中,钻研团队妄想了一个由多个子模子组合而成的模子框架,每一个子模子经由残差神经收集对于特定数目的妄想规范妨碍分说,经由散漫多个子模子的分说服从可能给出未知质料的最可能妄想规范。在该框架下,CrySTINet可能扩展至新的妄想规范而无需对于已经有子模子妨碍重新磨炼,从而使模子可能普遍运用到种种有机质料的钻研之中。

钻研团队选用了100种最罕有的妄想规范的模拟XRD数据来磨炼CrySTINet的初始子模子。这一共搜罗了63963种有机化合物,拆穿困绕了元素周期表中的简直所有元素。模子在模拟数据集上的精确率抵达了80.0%,而且在试验数据会集也具备同样高的精确率。钻研团队进一步运用了梯度加权类激活映射(Grad-CAM)来声名CrySTINet的分类抉择规画。其服从表明,在每一个子模子中,神经搜团聚将留意力会集至特定衍射角区间以提升子模子中响应妄想规范的分类精确率,但这会导致子模子在面临某些扩散外数据时简略给出过高的信托度值。因此,在只依靠神经收集输入的信托度值作为妄想规范判断凭证时,CrySTINet的精确度较低,惟独65.7%。而在判断凭证中引入与响应妄想规范平均XRD图谱比力患上到的余弦相似度值后,则可能填补XRD数据的全局特色信息,从而防止模子陷入对于特色峰的偏激依赖而导致的误判。以该信托度值与余弦相似度值组合妄想的参数作为判断凭证,可能使CrySTINet的精确度最终提升至80.0%。

图1 基于AI的XRD妄想剖析措施。

图2 模子在差距质料妄想规范上的精确率。

图3 运用Grad-CAM批注模子的分类抉择规画。

 

下场开辟

本使命提出了一种由多个子模子散漫分说质料妄想规范的深度学习框架,可能使该XRD剖析工具利便地拓展至新的妄想规范且同时坚持针对于已经有规范的预料精度。该工具不受质料成份的限度,且可能合成无序的固溶体质料,因此有望在金属质料、钙钛矿质料、锂电池质料等多个规模中妨碍运用。本钻研所提出的框架可能拓展至中子衍射以及红外/拉曼等图谱的自动化合成工具的开拓中,从而为实现自驱动试验室(self-driving laboratories)提供关键的钻研根基。

全文链接:https://pubs.acs.org/doi/10.1021/jacs.3c11852

推荐内容