科技日報記者 張佳欣
據(jù)28日《自然·材料》雜志報道,美國哥倫比亞大學工程學院團隊創(chuàng)建了一種機器學習算法,可以通過觀察納米晶體產(chǎn)生的圖案來推斷材料的原子結構。該成果破解了困擾材料科學界一個世紀的納米晶體結構解析難題,有望加速新藥研發(fā)、清潔能源材料開發(fā)及文化遺產(chǎn)研究。
晶體學是理解幾乎所有材料特性的最有效方法。然而,傳統(tǒng)方法僅適用于毫米級完美晶體,面對由微小顆粒組成的粉末狀納米晶體時,現(xiàn)有技術僅能獲得模糊的原子排列信息,導致諸多關鍵材料研究陷入停滯。
此次,研究團隊利用4萬個已知原子結構對一個生成式人工智能(AI)模型進行了訓練,從而開發(fā)出一個能夠從“失真數(shù)據(jù)”中還原原子結構的智能系統(tǒng)。
具體而言,團隊創(chuàng)建了一個包含4萬個晶體結構的數(shù)據(jù)集,并將原子位置打亂,使其看起來像是隨機排列的。隨后,他們訓練了一個深度神經(jīng)網(wǎng)絡,將這些幾乎隨機排列的原子與其對應的X射線衍射圖案聯(lián)系起來。該網(wǎng)絡利用這些觀測結果對晶體進行重建。最后,他們讓AI生成的晶體經(jīng)歷一個名為“里特維爾德精修”的過程,即根據(jù)衍射圖案,將晶體“微調(diào)”到接近最優(yōu)狀態(tài)。
盡管該算法的早期版本表現(xiàn)不佳,但最終它學會了比預期有效得多的晶體重建方法。該算法能夠從各種形狀的納米級晶體中確定原子結構,包括之前實驗難以表征的樣本。
團隊表示,這個AI模型也學會了自然界所允許的原子排列模式。這種模式識別能力預示著蛋白質(zhì)結構預測、藥物分子設計等領域?qū)⒂瓉矸妒睫D(zhuǎn)變。