——習(xí)近平總書記在致中國科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求
——中國科學(xué)院辦院方針
語音播報
生成式人工智能的核心技術(shù)是生成模型。生成模型能夠?qū)W習(xí)數(shù)據(jù)背后的概率分布,并通過采樣生成新穎而自然的樣本。若能為無機(jī)晶體構(gòu)建合適的生成模型,將有望為材料發(fā)現(xiàn)與設(shè)計帶來變革。然而,晶體材料作為特殊的數(shù)據(jù)模態(tài),天然蘊(yùn)含著對稱性先驗(yàn),因此無法直接照搬語言或圖像領(lǐng)域的方案。自然界偏好對稱的結(jié)構(gòu),這種偏好由空間群對稱性嚴(yán)格刻畫。事實(shí)上,自然界準(zhǔn)備了兩張“表”——化學(xué)元素周期表和空間群的Wyckoff位置表。要構(gòu)建某種晶體,只需從元素周期表中選擇原子,并依次放置在Wyckoff位置上。由此,晶體呈現(xiàn)出“意料之外、情理之中”的序列化表示。
近期,中國科學(xué)院物理研究所/北京凝聚態(tài)物理國家研究中心與吉林大學(xué)合作,開發(fā)出基于空間群對稱性設(shè)計的自回歸晶體生成模型CrystalFormer。CrystalFormer的核心思想是,通過對晶體數(shù)據(jù)庫的學(xué)習(xí),壓縮內(nèi)化固體化學(xué)規(guī)律,并以序列化方式生成晶體的Wyckoff占位與晶格參數(shù),從而構(gòu)造新的晶體結(jié)構(gòu)。CrystalFormer以神經(jīng)網(wǎng)絡(luò)參數(shù)表達(dá)固體化學(xué)知識,以網(wǎng)絡(luò)激活體現(xiàn)材料空間中的聯(lián)想能力,并以概率模型的似然函數(shù)承載化學(xué)直覺,探索那些“自然界可能存在、但尚未被發(fā)現(xiàn)”的晶體材料。
CrystalFormer是專門講述晶體原生對稱性語言的生成模型。CrystalFormer不依賴于勢能面優(yōu)化,而是直接在對稱性約束下“猜測”合理的晶體結(jié)構(gòu),因此CrystalFormer不同于機(jī)器學(xué)習(xí)力場。在實(shí)際應(yīng)用中,CrystalFormer既可以無約束地探索整個材料空間,也可以針對性地產(chǎn)生具有特定結(jié)構(gòu)特征的晶體材料。同時,通過與性質(zhì)預(yù)測模型即插即用式的結(jié)合,CrystalFormer能夠?qū)崿F(xiàn)基于貝葉斯公式的材料反向設(shè)計。
CrystalFormer將晶體材料中的數(shù)學(xué)對稱性與化學(xué)直覺統(tǒng)一在簡潔、通用且靈活的生成模型框架中,為未來的晶體材料設(shè)計與發(fā)現(xiàn)提供了適配性工具。
相關(guān)研究成果發(fā)表在《科學(xué)通報》(Science Bulletin)上。研究工作得到國家自然科學(xué)基金和中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)等的支持。
基于JAX的開源代碼實(shí)現(xiàn)和應(yīng)用示例

融合空間群對稱性的晶體生成模型
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1
京公網(wǎng)安備110402500047號 網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1
京公網(wǎng)安備110402500047號 網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
© 1996 - 中國科學(xué)院 版權(quán)所有
京ICP備05002857號-1
京公網(wǎng)安備110402500047號
網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話:86 10 68597114(總機(jī))
86 10 68597289(總值班室)