Machinelearning in materials informatics: recent applications
and prospects
Rampi Ramprasad,Rohit Batra, Ghanshyam Pilania, et, al
npj ComputationalMaterials (2017) 3:54
doi:10.1038/s41524-017-0056-5
摘要
得益于材料基因組計劃、算法開發(fā)和其它領域中數(shù)據(jù)驅(qū)動的取得的成功,信息學方法在材料科學中逐步成型。這些方法使機器學習模型能夠基于過去的數(shù)據(jù)進行快速預測,而不是直接實驗或通過基本方程顯示求解的計算/模擬。以數(shù)據(jù)為中心的信息學方法(可靠的已經(jīng)存在的數(shù)據(jù)或者可以為臨界情況下的一個子集)對于確定使用傳統(tǒng)方法(涉及成本、時間或效率因素)難以測量或計算的材料屬性是有用的。預測通常是插值的,首先涉及材料數(shù)字“指紋”,然后在“指紋”和感興趣的屬性之間繪制圖形(通過學習算法建立)?!爸讣y”,通常指的是“描述符”,可能具有多種類型和規(guī)模,由應用和需求領域決定。預測也可以外推延伸到新材料領域,并適當?shù)乜紤]預測不確定性。本文試圖提供一些在過去十年中取得成功的數(shù)據(jù)驅(qū)動的“材料信息學”策略的概述,特別強調(diào)指紋或描述符的選擇,同時還提出目前面臨的一些挑戰(zhàn)和在不久的將來應該克服的挑戰(zhàn)。
文章附圖
圖1:數(shù)據(jù)驅(qū)動的科學和工程的一些經(jīng)典歷史實例
圖2:材料科學中機器學習的關(guān)鍵要素。(a)示例性數(shù)據(jù)集的示意圖;(b)學習問題描述;(c)通過指紋和學習步驟創(chuàng)建代理預測模型,n和m分別是訓練實例的數(shù)目和指紋(或描述符、特征)分量的數(shù)目。
圖3:建立絕緣子本征擊穿場強預測的唯象模型。(a)期望與本征擊穿場相關(guān)的主要特征;(b)利用LASSO建立復合特征、向下選擇臨界復合特征子集的預測模型;(c)二進制八位字節(jié)數(shù)據(jù)集的最終唯象模型性能 vs DFT計算;(d)新型抗擊穿鈣鈦礦型材料識別模型的應用。
圖4:利用片段級指紋研究聚合物性質(zhì)。(a)可用于有機分子、晶體或聚合物的典型片段;(b)有機聚合物指紋圖譜構(gòu)建;(c)核嶺回歸(KRR)方案的示意圖,展示出了指紋(F)空間中的示例情況;(d)代理機器學習(ML)模型預測與關(guān)鍵介電聚合物性能的DFT結(jié)果;(e)聚合物基因組在線預測技術(shù)在聚合物性能預測中的應用。
圖5 從精細級指紋中學習。(a)Behler和同事采用亞原子級原子環(huán)境指紋圖譜方案的示意圖;(b)機器學習力場構(gòu)建的典型工作流程示意圖;(c)利用原子力學習框架AGNI和嵌入原子方法(EAM)預測塊體鋁中的位錯附近的原子力,并與相應的DFT結(jié)果的比較;(d)用SOAP指紋框架對SI原子環(huán)境進行分類降維的示意圖。
圖6:(a)通過不確定性量化實現(xiàn)平衡探索和開發(fā)的自適應設計示意圖;(b)在多保真度學習設置中使用的示例數(shù)據(jù)集,包括在不同級別的保真度獲得的目標屬性和多保真學習問題的陳述。
標簽:
Copyright ? 2017-2024 江蘇隱石實驗科技有限公司 All Rights Reserved 備案號:蘇ICP備2021030923號-2 蘇公網(wǎng)安備32020502001473 技術(shù)支持:迅誠科技