Please enable JavaScript in your browser.

Materials Informatics特集 #1:APS2025で機械学習ポテンシャルの生成技術を発表しました - fltech - 富士通研究所の技術ブログ

fltech - 富士通研究所の技術ブログ

富士通研究所の研究員がさまざまなテーマで語る技術ブログ

Materials Informatics特集 #1:APS2025で機械学習ポテンシャルの生成技術を発表しました

はじめに

こんにちは、富士通研究所 コンピューティング研究所の松村直樹です。私たちはコンピューティングとAIを活用した、材料探索を加速する技術(Materials Informatics: MI)の開発に取り組んでいます。 MIは、近年のコンピューティングとAIの技術進展に伴い、非常に盛んになってきた研究領域であり、材料探索の業界に革新をもたらしています。これから2か月間、MIの特集記事を投稿していきますので、ぜひご期待ください。第一回として、私が国際学会APS2025で発表した内容についてご紹介します。

私たちが開発した材料探索を加速するソフトウェアGeNNIP4MD(Generator of Neural Network Interatomic Potential for Molecular Dynamics)を用いた研究結果[1]が、物理学に関する国際学会APS2025に採択され、2025年3月にアメリカのアナハイムで開催された年次イベントにてポスター発表を行いました。以下ではその発表した内容について紹介します。APS2025に関する記事は連載形式でお届けし、次回の連載では、APS2025の研究動向や注目論文について紹介します。

APS2025とは?

図1.APS2025:企業ブースの様子

APS(正式名称:American Physical Society)は、物理学に関する世界最大級の国際会議です。参加者は14000人以上、投稿されたアブストラクトは10000件を超え、世界最大級の物理学の学会であると言われています。発表者は口頭発表またはポスター発表のどちらかで発表を行います。これらのセッションに加えて、招待講演セッションや技術セッション、ワークショップ、協賛企業による展示など、さまざまなセッションが2025年の3月16日~3月21日の6日間に渡り開催されました。

発表したポスターの内容

1. 研究背景

材料開発の課題

私たちの身の回りには、さまざまな材料が存在しています。これらの材料は、建物や車、電子機器など、日常生活のあらゆる場面で使われています。材料の特性を理解し、より良いものを作るためには、材料を構成する原子や分子の動きや相互作用を知ることが重要です。

従来、材料の原子間の相互作用を予測するためには、量子力学に基づく複雑な数式を使った計算を行っていました。この方法は第一原理計算と呼ばれ、非常に正確な結果を得ることができます。しかし、計算に必要な時間とリソースが膨大であるため、本来解析したい大規模なシステムのシミュレーションに適用することは困難です。その一方で、実験データや既存の知識に基づいて、原子間の相互作用をモデル化する経験的ポテンシャルがよく用いられています。経験的ポテンシャルは計算速度が比較的速く、大規模なシステムのシミュレーションに適していますが、精度が第一原理計算ほど高くない場合があり、かつ、経験的ポテンシャルの作成は職人技と言われており、自身が解析したいシステムに適用することが困難な場合が多くあります。

AIを用いたアプローチ

ここで登場するのが機械学習ポテンシャル(Machine Learning Interatomic Potential: MLIP または Neural Network Potential: NNP)です。機械学習ポテンシャルは、AIが第一原理計算で生成されたデータを学習することで、従来の第一原理計算よりも高速に、かつ、経験的ポテンシャルより精度の高い予測を可能にします。第一原理計算に対して100-10000倍高速であると言われており、より大規模なシステムのシミュレーションを高精度に行うことが可能になります。

表1.各計算方法の計算速度と計算精度

しかし、この機械学習ポテンシャルの開発には、第一原理計算データの生成から機械学習ポテンシャルの訓練まで、複雑かつ多量のプロセスが必要です。

2. 富士通が開発しているツール:GeNNIP4MD

図2.GeNNIP4MDのワークフロー

富士通は、機械学習ポテンシャルを簡単に・効率的に生成するソフトウェアGeNNIP4MDを開発しています[1]。このソフトウェアは、解析対象の構造データを入力することで、自動的に機械学習ポテンシャルを生成します。GeNNIP4MDは、能動学習と呼ばれるAIの訓練に必要となる訓練データを効率的に追加するアルゴリズムを採用しています。図2に示したように、現在の機械学習ポテンシャルの状態に基づいて、精度向上に必要な構造データを大量の候補構造データから自動で選別し(スクリーニング処理)、DFT(Density Functional Theory)計算による構造データのラベリングを経て訓練データを生成し、既存データに追加します。生成されたデータは続く訓練フェーズで学習され、機械学習ポテンシャルの精度が十分に高まると、最終的な訓練済みの機械学習ポテンシャルが出力されます。少ないデータ数で効率的に精度を高めるためには、スクリーニング処理による構造の取捨選択が重要になります。

GeNNIP4MDのスクリーニング処理には、次の2種類の技術が用いられています。

モデルアンサンブルを用いたスクリーニング技術

図3.モデルアンサンブルを用いたスクリーニング技術の概要

図3にこの技術の概要を示します。この技術では、異なる初期値で初期化された複数の機械学習ポテンシャルを同じデータに対して訓練します。訓練された複数の機械学習ポテンシャルが一つの構造を予測した際、複数の予測値のばらつきがどの程度かを測定します。ばらつきが小さい場合、その構造は既に十分な精度で予測されているため、モデルは既にその構造の知識を獲得していると判断し、追加するデータの候補から除外します。逆に予測値のばらつきが大きすぎる構造は、物理的に不自然な構造(原子がオーバーラップしているなど)である可能性が高いため、これも同様に追加するデータの候補から除外します。最終的に、適度な予測値のばらつきを持つ構造を訓練データの候補とします。

構造の特徴量を用いたスクリーニング技術

図4.構造の特徴量を用いたスクリーニング技術の概要

図4にこの技術の概要を示します。この技術では、機械学習ポテンシャルに構造データを読み込ませた際に、中間層から得られる特徴量ベクトルを用いてスクリーニングを行います。中間層から得られるベクトルは一般的には多次元であるので、この中間特徴量にPCA(Principal Component Analysis)などの次元削減手法を適用し、主成分を2軸抽出します。この2軸を二次元座標上にプロットして特徴量マップを作成し、特徴量マップ上に写像された各構造のデータ点間の距離(類似度)を計算します。既存のデータと候補構造の両方に対して類似度を計算することで、既存のデータや他の候補構造とは異なる特徴を持つ候補構造をラベリングの対象として選択することができるようになります。

これらスクリーニング処理で選択された構造は、ラベリングフェーズで第一原理計算を用いてラベル付けされ、データセットに追加されます。

3. 生成した機械学習ポテンシャルの精度評価

今回はポリエチレングリコール(Polyethylene Glycol: PEG)を対象に、機械学習ポテンシャルの精度評価を行いました。機械学習ポテンシャルにはDeepPot-SE[2]、ラベリングにはQuantum ESPRESSO[3-5]を採用しています。機械学習ポテンシャル生成向けのデータには、重合度4(155原子)の構造を使用しています。

重合度4(3,100原子)と重合度150(10,530原子)の構造に対して、訓練された機械学習ポテンシャルを用いた分子動力学シミュレーションを実行し、PEGの物性値として密度と自己拡散係数を計算しました。分子動力学シミュレーションのアンサンブルはNPT、実行時間は21ナノ秒とし、後半の20ナノ秒から物性値を計算しています。

表2.PEGの密度と自己拡散係数の比較

表2に、実験値とGeNNIP4MDにより作成した機械学習ポテンシャルによるMDの計算結果の比較を示します。まずは重合度4について、実験値[6]の物性値と比較します。経験的ポテンシャルであるOPLS[7,8]は密度をよく再現できていますが、自己拡散係数については10倍以上の誤差があります。一方で、GeNNIP4MDを用いて計算した密度は実験値と比べて3%以内の誤差自己拡散係数はオーダーレベルで一致し、両者ともに良く実験値を再現できています。重合度150についても、密度は実験値[9]に対して3%以内の誤差であり、GeNNIP4MDで生成した機械学習ポテンシャルの精度の高さが伺えます。

4. まとめと展望

機械学習ポテンシャルを簡単に・効率的に生成するソフトウェアであるGeNNIP4MDを開発しました。GeNNIP4MDでは、能動学習を用いてデータを追加生成し、機械学習ポテンシャルの精度向上を図ります。その中で、二段階のスクリーニング処理(モデルアンサンブルを用いたスクリーニング技術、構造の特徴量を用いたスクリーニング技術)を活用し、効率的に追加データの選定を行います。PEGを用いた精度評価では、実験値と比較して非常によい一致を示し、精度的に経験的ポテンシャルより優れていることを示しました。今回はPEGという比較的単純な有機材料の結果を紹介しました。今後は、より複雑な系での機械学習ポテンシャルの生成と、それを用いたメカニズムの解析を目指します。

参考文献

[1] Matsumura, N. et al., Generator of neural network potential for molecular dynamics: Constructing robust and accurate potentials with active learning for nanosecond-scale simulations, J. Chem. Theory Comput. 2025, 21, 3832. https://doi.org/10.1021/acs.jctc.4c01613
[2] Zhang, L., et al., End-to-end Symmetry Preserving Inter-atomic Potential Energy Model for Finite and Extended Systems. Advances in Neural Information Processing Systems, Curran Associates, Inc., 2018; Vol. 31.
[3] Giannozzi, P. et al., QUANTUM ESPRESSO: A Modular and Open-Source Software Project for Quantum Simulations of Materials. J Phys Condens Matter 2009, 21 (39), 395502. https://doi.org/10.1088/0953-8984/21/39/395502
[4] Giannozzi, P. et al., Advanced Capabilities for Materials Modelling with Quantum ESPRESSO. J Phys Condens Matter 2017, 29 (46), 465901. https://doi.org/10.1088/1361-648X/aa8f79
[5] Giannozzi, P. et al., Quantum ESPRESSO toward the Exascale. J Chem Phys 2020, 152 (15), 154105. https://doi.org/10.1063/5.0005082
[6] Hoffmann, M. et al., Densities, Viscosities, and Self-Diffusion Coefficients of Ethylene Glycol Oligomers. J. Chem. Eng. Data 2021, 66 (6), 2480–2500. https://doi.org/10.1021/acs.jced.1c00101
[7] Lu, C. et al., OPLS4: Improving Force Field Accuracy on Challenging Regimes of Chemical Space. J. Chem. Theory Comput. 2021, 17 (7), 4291–4300. https://doi.org/10.1021/acs.jctc.1c00302
[8] Mohanty, S. et al., Development of Scalable and Generalizable Machine Learned Force Field for Polymers. Sci Rep 2023, 13 (1), 17251. https://doi.org/10.1038/s41598-023-43804-5
[9] Polyethylene Glycol [MAK Value Documentation, 1998]. In The MAK‐Collection for Occupational Health and Safety; Deutsche Forschungsgemeinschaft, Commission for the Investigation of Health Hazards of Chemical Compounds in the Work Area, Eds.; Wiley, 2012; pp 248–270. https://doi.org/10.1002/3527600418.mb2532268kske0010

お問い合わせ

本技術にご興味をお持ちの方は、以下の連絡先までお気軽にお問い合わせください。

  • 連絡先:fj-mi-tech-contact@dl.jp.fujitsu.com
  • お問い合わせ内容:資料請求、技術紹介、PoC検証(技術の試用、自社材料への適用を希望される方)など、様々なご要望に対応いたします。