はじめに
こんにちは、富士通研究所 コンピューティング研究所の松村直樹です。Materials Informatics特集の第2回は、機械学習ポテンシャルに焦点を当て、最新の研究動向や注目論文を取り上げます。前回の記事では、国際学会APS2025にて私が発表した内容の紹介をしました。詳細は以下をご参照ください。
APS2025では、材料特性の分析や第一原理計算の高度化、機械学習ポテンシャルの開発、実験とシミュレーションの融合など、材料探索に関する幅広いテーマが取り上げられました。特に材料分野におけるAI活用の研究は多くの聴講者を集めており、材料分野のビッグトレンドになっていると感じました。本記事では、機械学習ポテンシャルに関する具体的な技術や応用例を通じて、その進展を紹介します。
機械学習ポテンシャルに関する研究動向
今回、私が聴講した機械学習ポテンシャル(MLIP: Machine Learning Interatomic Potential)に関する研究は、大きく分けて以下の4つのジャンルに分類できます。
1. 汎用の機械学習ポテンシャル(uMLIP)を直接利用する研究
材料スクリーニング(膨大な材料候補の中から、望ましい物性値を持った材料を見つけ出す手法)での活用が見られました。私が確認できた研究例は2件程度でしたが、大量データで学習させることで様々な材料への汎用的な適用を目指す汎用機械学習ポテンシャル(uMLIP: universal MLIP)の発展により、今後その研究例は増えていくことが予想されます。
2. MLIPをFine-Tuningして特定の系向けに性能を高める研究
このジャンルは他のジャンルと比べて件数が多く、多くの研究者にとって興味のある領域です。適用先も多種多様で、無機系はもちろん、有機系や適用が難しい界面まで、様々な材料に対しての適用例が報告されていました。MLIPとして様々なものが使われていましたが、とりわけuMLIPをFine-Tuningする研究が多く、uMLIPへの期待が伺えました。富士通では、MLIPを自動かつ効率的に生成するソフトウェアGeNNIP4MDを開発しており、uMLIPをFine-Tuningする枠組みも提供しております。ご興味がある方は、ページ下部にある連絡先にお気軽にお問い合わせください。
3. MLIPの推論速度を向上させるための研究
推論速度の改善手法として、低ビット演算による高速化や、実装の改修による既存フレームワーク(Allegro, FLAREなど)の高速化が報告されていました。MLIPは第一原理計算のサロゲートモデルとして使われますが、分子動力学計算(MD: Molecular Dynamics)など計算負荷が高い手法では依然として計算コストに悩まされます。これらの計算量を減らすことができれば、より大規模・長時間のシミュレーションが可能になるため、研究しているグループも増えているように感じました。
4. MLIP向けのプラットフォームの開発
MLIPを簡単に訓練、あるいは網羅的に評価するプラットフォームなどが開発されていました。近年、多種多様なuMLIPが開発されていますが、それぞれには得意不得意があります(後述)。どのタスクでどのuMLIPを選択すればよいかという指標は、ユーザーにとって非常に有益な情報になりそうです。
ここからは、私が聴講した発表の中から、特に興味深かったジャンル2と4の研究をいくつかご紹介します。
Towards reliable AI for materials discovery
発表者:Bowen Deng(Lawrence Berkeley National Laboratory)
CHGNetの開発者の一人、Bowen Dengさんの発表です。 Matbench DiscoveryやMatGL、MatPES、PES softeningなど、MLIPに関する様々なフレームワーク・論文が紹介されていました。それぞれの詳細を説明します。
Matbench Discovery(ジャンル4)
無機材料向けに構築されたuMLIPのベンチマーク。近年のuMLIPの性能向上は凄まじく、1年の間に多種多様な高性能なuMLIPがリリースされています。
MatGL(ジャンル4)
M3GNetやCHGNet、TensorNetなどの訓練・推論を可能にするフレームワーク。PyTorch Lightningをバックエンドに実装されており、様々なモデルを1つのフレームワークで扱うことができるようになっています。2025年1月には、MatPESデータ(後述)を学習したモデルが公開されています。
MatPES(ジャンル4)
2025年1月に公開された大規模データセット。2.8億ものMDのスナップショットから、約40万個の構造を選択しラベリングすることで、既存のデータセット(MPtrj、OMat24)より幅広い力の分布を持ったデータセットを作成することができたそうです。
MatPESを学習したM3GNet/CHGNet/TensorNetは、公開材料データベースMaterials Projectに含まれている構造についての構造最適化やバルクモジュラス計算を高精度に行うことができ、MDの安定性も向上することを示しました。
論文:Overcoming systematic softening in universal machine learning interatomic potentials by fine-tuning(ジャンル2)
背景
既存のuMLIPのデータセットには、構造最適化計算によるトラジェクトリファイルが多く採用されているため、uMLIPは非安定状態に対して低い力の値を出力してしまうという問題がありました。そのため、表面エネルギーや欠陥形成エネルギー、フォノン、電池の活性化エネルギーなどを過小評価してしまう傾向にありました。(PESの軟化)
研究の概要
uMLIPが出力するエネルギーを調整するために、筆者らはエネルギーの単純なスケーリングや少数データでのFine-Tuningを用いて、ポテンシャルエネルギー曲面(PES: Potential Energy Surface)の軟化を解消するアプローチを提案しました。
結果
結果として、PESの軟化を防ぐことができ、高温のAIMD計算から得られたDFTデータの力とよく一致するMLIPを獲得できたとのことです。
CHIPS-FF: Evaluating Universal Machine Learning Force Fields for Material Properties(ジャンル4)
発表者:Daniel Wines(National Institute of Standards and Technology (NIST))
背景
多様なuMLIPが開発される中で、それらを様々な指標で評価する作業は非常に手間がかかります。Matbench Discoveryがベンチマークとして有名ですが、より柔軟に多様な系に対して評価できるプラットフォームが求められています。
研究の概要
uMLIPの性能を評価するためのPythonベースのフレームワークを開発しました。JARVIS-DFTデータセットとASEを連携し、種々の物性値を評価します。エネルギー、弾性定数、フォノン、欠陥形成エネルギー、表面エネルギー、界面の物性、熱力学特性、分子動力学によるアモルファス構造予測など多種多様な評価が可能です。評価可能なuMLIPの種類はALIGNN-FF、M3GNet、CHGNet、MACE、SevenNet、ORB、EquiformerV2(eqV2)、MatterSimなど、現状でも幅広い種類のuMLIPを評価できます。これらの評価にかかった時間も計測可能であるそうです。
結果
評価の結果、全ての評価指標に対して優れたuMLIPは存在せず、各uMLIPには得意不得意があることを確認しました。eqV2は精度が高いものの、実行時間はORBやMatterSimと比較すると約10-20倍低速です。精度と速度を両立したuMLIPとしては、SevenNetやMatterSimが有力になりそうです。(このように網羅的にuMLIPを評価でき、かつ、精度だけではなく実行時間も計測できる設計は非常に魅力的です)
Hydrogen Diffusion in Materials Studied Using Machine Learning Accelerated Molecular Dynamics Simulations(ジャンル2)
発表者:Andrea Angeletti (University of Vienna)
背景
水素は環境に優しいエネルギー源として注目されており、特にマグネシウムは優れた水素貯蔵能力を持ち、環境に優しく豊富に存在するため、近年注目されています。しかし、水素拡散メカニズムはまだ十分に解明されておらず、原子レベルでの解析が求められています。
研究の概要
マグネシウム内での水素拡散をシミュレートできるMLIPを開発しました。データセットは第一原理計算ソフトウェアであるVASPに搭載されたActive Learning(能動学習)機能を活用して生成され、以下の図のように構築されました。生成したデータセットを、VASPに搭載されている軽量のMLIPやuMLIP(CHGNet、MACE)に学習させ、その訓練精度と水素拡散係数を調査しました。
結果
uMLIPを直接利用した場合は十分な精度が得られませんでしたが、Fine-TuningされたuMLIPは訓練精度が良好で、実験値と良好な一致を示しました。Fine-TuningされたuMLIPを活用してMDを実行したところ、水素がマグネシウムのLattice Siteにトラップしていることがわかり、拡散がしにくくなっている原因が解明されました。uMLIPのFine-TuningによってMLIPの性能を向上させ、これまで解明できていなかった現象を明らかにした興味深い研究です。
まとめ
APS2025におけるMLIPの研究動向を紹介しました。特に、uMLIPの開発とそのFine-Tuningによる特定の材料系への適用が注目されていると感じました。uMLIPとFine-Tuningの組み合わせにより、材料特性のより正確な予測が可能になり、新しい材料の発見や既存材料の特性向上が期待されています。今後も、MLIPの開発と応用は材料科学の分野で重要な役割を果たすと考えられます。富士通は、MLIPを効率的に生成するソフトウェアGeNNIP4MDを進化させ続け、より多くの研究者や企業の材料探索プロセスを加速し、革新的な材料の開発を支援していきます。
お問い合わせ
GeNNIP4MDにご興味をお持ちの方は、以下の連絡先までお気軽にお問い合わせください。
- 連絡先:fj-mi-tech-contact@dl.jp.fujitsu.com
- お問い合わせ内容:資料請求、技術紹介、PoC検証(技術の試用、自社材料への適用を希望される方)など、様々なご要望に対応いたします。