Please enable JavaScript in your browser.

ISC2025に参加・展示しました#1 ~ AI Computing BrokerおよびAIベースの量子化学ソリューション - fltech - 富士通研究所の技術ブログ

fltech - 富士通研究所の技術ブログ

富士通研究所の研究員がさまざまなテーマで語る技術ブログ

ISC2025に参加・展示しました#1 ~ AI Computing BrokerおよびAIベースの量子化学ソリューション

はじめに

こんにちは、コンピューティング研究所の飯田です。

コンピューティング研究所が開発している「GeNNIP4MD」と「AI Computing Broker(ACB)」に関するデモを作成しました。このデモの展示と世界のスーパーコンピュータの動向に関する情報収集を行うために2025/06/10~06/13にドイツのハンブルクで開催された国際会議ISC High Performance 2025へ現地参加してきました。

今回のISCでは複数のメンバーが現地参加したため、それぞれISC2025で得られた知見や展示内容などをまとめた記事を連載として4本掲載していきます。今回は1回目としてコンピューティング研究所の展示内容と、HPCシステムの動向について報告します。

ISC High Performanceの概要

ISC High Perfrmance(以降「ISC」)は例年6月にドイツで開催されているHPC(High Performance Computing)に関する大規模な国際会議及び展示会です。ハイパフォーマンスコンピューティング(HPC)、人工知能(AI)、量子コンピューテイング(QC)などの分野に関するカンファレンスと展示が行われました。ISCは1986年に創設され、今年で40周年を迎えました。今年は3585人が参加しており、195社の出展者がハンブルクに集まりました。

ISC2025におけるコンピューティング研究所の展示

学会併設の展示会では富士通ブースにて、HPCとAIが融合した技術であるGeNNIP4MDと、GPUを削減するミドルウェアであるAI Computing Broker(以降「ACB」)技術の適用例を展示しました。材料インフォマティクス(MI)分野におけるACBの活用事例について紹介します。フルスライドはISC High Performance 2025 : Fujitsu Globalをご参照ください。

GeNNIP4MD:材料開発を加速するAI技術

昨今でのHPCはシミュレーションを行うだけではなく、AI処理の加速が重要となっています。また、シミュレーションについてもシミュレーション結果を活用するAI作成や、AIを組み込んだシミュレーションも行われています。HPCシステムとしてはこれら一連の流れを加速していくことが重要です。

Maximize Your GPU Utilization: AI Chemistry as a Case Study (p.2)

その一つの題材として材料分野のMaterial Designがあります。従来のMolecular Dynamicsシミュレーションでは通常100年以上かかるタスクを8日で行うことができるNeural Network Potentials(NNP) aided Molecular Dynamics技術を提供しています。この技術を適用することで、通常であれば正しくシミュレーションできないものについても、精度を保ったまま長時間のMolecular Dynamicsシミュレーションを行えるようになりました。

Maximize Your GPU Utilization: AI Chemistry as a Case Study (p.3)

また、AIモデル構築を実現するためNNP Generator「GeNNIP4MD」が開発されています。GeNNIP4MDは機械学習力場モデルを作成するツールです。自動化されたActive Learningを活用することで、効率的にデータセット作成と機械学習力場モデルの精度向上を実現します。

Active Learningとは、必要最小限のデータセットを効率的に収集するアルゴリズムです。機械学習モデルの構築において最も重要なことの一つは「データセットを大量に収集する」ことです。 データセットの量は、機械学習モデルの性能に直結してきます。 しかし、DFTのようなデータセットを作成する計算コストが非常に大きい分野では、データを大量に用意することは困難です。そこで「大量のデータの中から必要なデータを集め、最低限のデータセットを構築しよう」という考えが生まれます。 このときのデータ収集を効率的に行うアルゴリズムをActive Learningと呼びます。 データセットは原子構造やエネルギー、力、場合によっては応力などから構成されます。

Maximize Your GPU Utilization: AI Chemistry as a Case Study (p.4,5)

GeNNIP4MDについて、より詳しい内容を知りたい場合は以下の記事もご参照ください。 blog.fltech.dev

AI Computing Broker(ACB):GPUリソースを最大限活用する技術

ACBとは、世界的なGPU不足に対応するために開発されたミドルウェア技術です。AI処理におけるGPUの演算効率を高め、GPU資源の利用を最適化します。

今回のデモではACB技術をGeNNIP4MDの学習ジョブに対する適用例を作成しました。1台のGPUで複数のジョブを動作させる内容をご紹介します。

Maximize Your GPU Utilization: AI Chemistry as a Case Study (p.6)

GeNNIP4MDによるAIモデルの学習を複数の研究チームが並行して行うとなった場合、AIについてもシミュレーションについても相応の計算リソースが必要となります。共有のデータセンターで処理するとなった場合、複数のAI処理がGPUサーバに集中してしまいます。

ここで課題となるのはそれぞれのジョブがどの程度GPUリソースを消費するか分からないことです。きちんと制御するためにジョブスケジューラを使い1ジョブずつシーケンシャルに動かすとなった場合、重いジョブがGPUサーバを占有します。その場合短時間で終わるジョブがいつまでも待たされてしまいます。一方で、すべてのジョブをまとめてGPUサーバに投入してもメモリ上限を超え、Out Of Memoryが生じる懸念があります。

Maximize Your GPU Utilization: AI Chemistry as a Case Study (p.7)

このような問題をACB技術は解決します。ACBは複数のAIアプリ間でGPUを共有して効率的に実行します。今回のデモではメモリ管理機能に焦点を当て、実行時のメモリ消費量をモニタリングしました。ACBが適用されたアプリは複数のジョブが投入された際に各ジョブを適宜切り替えながら処理を進めていきます。この時、ジョブごとにメモリ管理が行われるためOut Of Memoryが発生しません。これにより、限られた計算資源であるGPUを複数のジョブ間でうまく共有することができます。実際に動いている様子は次の動画をご参照ください。

Maximize your GPU Utilization: AI Chemistry as a Case Study
Maximize Your GPU Utilization: AI Chemistry as a Case Study動画

中島所長による講演

6月11日にはコンピューティング研究所所長の中島耕太氏による講演が行われました。最先端スーパーコンピュータ技術とAI、量子コンピューティングを統合し、社会課題の解決と持続可能な社会の実現を目指す戦略が紹介されました。実用的な成果とともに戦略を現実化していきます。

中島所長による講演

TOP500:世界のスーパーコンピュータ動向

ISCではTOP500が発表されます。TOP500とはHPL(High Performance Linpack)と呼ばれる共通のベンチマークを用いて、システムの演算性能を競うランキングです。

理化学研究所の「富岳」はTOP500では7位とアジア1位の性能を示しました。グラフ解析に関する性能を測定するGraph500部門では1位で、11期連続の記録です。No.1 in Asiaの表彰では「富岳」の半被が印象的でした。HPCG(High Performance Conjugate Gradient)部門は第2位、HPL-MxP部門は第6位を獲得しています。

「富岳」No.1 in Asia表彰の様子

日本からのTOP500登場台数は40台で、前回の34台から増加しています。TOP100には12台が日本からランクインしました。

TOP500の1位はEl Capitan、2位はFrontier、3位はAuroraと、TOP3は前回から変化せず、米国の独占状態を維持しています。今回新たにJUPITER BoosterがTOP10に加わりました。JUPITER Boosterは4位でNo.1 Europeを獲得しています。

全体的な傾向としては、AI開発の活発化により電力消費は増えたものの、性能の伸びは2017年頃から緩慢になっています。TOP500は今後の成長率を予測し、2030年までにExascale(1018)に到達してMooreの法則は終焉するとの見解を述べました。HPCシステムはより少ないエネルギーでより多くの作業を行えるシステムに注目が集まっていて、Green500のトップ10には4つのNVIDIA Grace Hopperと4つのAMD Zen-4/5 Genoaシステムがランクインしていました。

No.1「EI Captain」とNo.1 in Europe「JUPITER Booster」

おわりに

今回はISC2025でのコンピューティング研究所による展示、ACB技術とGeNNIP4MDについて紹介しました。たくさんのジョブを動かす際、ACBを使うことで少ないGPUで運用が可能となります。

また、ここ数年はGPUによる電力消費の増加は計算基盤管理における課題となっております。TOP500の発表でもGreen500に対する注目が集まっていました。ACB技術はGPU削減や電力削減にも大きく貢献する技術です。展示では計算基盤管理に着目して質問される方もいらっしゃったので、我々の取り組みをアピールしていきたいと思います。

また、初めて行った製品デモの作成と展示説明は非常に良い経験になりました。特に、世界中の技術者の方々と直接対話し、刺激を受けられたことが大きな収穫です。