目前,使用機(jī)器學(xué)習(xí)(ML)預(yù)測化學(xué)反應(yīng)結(jié)果已成為推進(jìn)材料合成的有力工具。然而,這種方法需要大量多樣的數(shù)據(jù)集,由于文獻(xiàn)報(bào)道不一致、非標(biāo)準(zhǔn)化及對合成機(jī)制缺乏了解,這些數(shù)據(jù)集在納米材料合成領(lǐng)域的應(yīng)用極為有限。
在此,美國華盛頓大學(xué)Brandi M. Cossairt等人采用不同的預(yù)測性ML算法來深入了解反應(yīng)條件控制對InP量子點(diǎn)(QD)的粒徑、吸收和發(fā)射波長的報(bào)告數(shù)據(jù)。具體而言,作者從72篇出版物中提取了InP QD合成的參數(shù)作為輸入,并將所得特性作為輸出。使用數(shù)據(jù)插補(bǔ)方法“填充”缺失的輸出,作者準(zhǔn)備了包含216個(gè)條目的完整數(shù)據(jù)集用于訓(xùn)練和測試預(yù)測性ML模型。根據(jù)化學(xué)特性或試劑的作用,作者以兩種方式(壓縮和擴(kuò)展)定義描述符空間以研究在可用數(shù)據(jù)有限的情況下預(yù)測QD合成結(jié)果的最佳方法。
作者測試了單輸出和多輸出ML算法,發(fā)現(xiàn)盡管輸出目標(biāo)(直徑、吸收和發(fā)射波長)之間存在物理關(guān)系,但單輸出模型的性能優(yōu)于多輸出模型。模型的性能通過不同的方式進(jìn)行驗(yàn)證,包括分層k折驗(yàn)證、與非估算數(shù)據(jù)集的比較及與新收集的實(shí)驗(yàn)數(shù)據(jù)的比較。
圖1. 工作流程及輸出/輸入特征選擇
基于最好的 ML 模型,作者實(shí)現(xiàn)了吸收、發(fā)射和直徑分別低至20.29、11.46 和0.33 nm的平均絕對誤差。從模型估計(jì)誤差中,作者發(fā)現(xiàn)反應(yīng)溫度、時(shí)間和鋅鹽的添加量是影響最大的合成參數(shù)。此外,作者部署了一個(gè)開源網(wǎng)絡(luò)應(yīng)用程序https://share.streamlit.io/cossairt-lab/indium-phosphide/Hot_injection/hot_injection_prediction.py,以便外部用戶可使用其來預(yù)測InP合成結(jié)果。
基于該程序,作者研究了InP合成中的化學(xué)趨勢,如鋅鹽和三辛基膦等常見添加劑的影響等。作者還基于文獻(xiàn)程序的擴(kuò)展設(shè)計(jì)并進(jìn)行了新的實(shí)驗(yàn),并將實(shí)驗(yàn)測量特性與預(yù)測進(jìn)行了比較,從而評估了模型的準(zhǔn)確性。最后,通過擴(kuò)展先前發(fā)布的數(shù)據(jù)集,作者應(yīng)用相同的方法來訓(xùn)練、測試和啟動CdSe QD的預(yù)測模型??偠灾?,這項(xiàng)研究提出的數(shù)據(jù)預(yù)處理和ML方法證明了即使面對有限的數(shù)據(jù)資源,也能夠設(shè)計(jì)具有目標(biāo)特性的材料并探索潛在的反應(yīng)機(jī)制。
圖2. 實(shí)驗(yàn)值與ML模型預(yù)測值的奇偶校驗(yàn)圖
Predicting Indium Phosphide Quantum Dot Properties from Synthetic Procedures Using Machine Learning, Chemistry of Materials 2022. DOI: 10.1021/acs.chemmater.2c00640
原創(chuàng)文章,作者:v-suan,如若轉(zhuǎn)載,請注明來源華算科技,注明出處:http://www.xiubac.cn/index.php/2023/10/07/ae2d6072b3/