
こんにちは.人工知能研究所の鈴木と金森です. 2026年1月20日から27日にシンガポールで開催された,AIに関する由緒ある国際学会”The 40th Annual AAAI Conference on Artificial Intelligence (AAAI-26)”において, 富士通からは複数件の論文発表とワークショップ開催の形で参加しました. そこでAAAI-26に関する記事を連載形式でお届けします.
本記事では,本会議に採択された我々の研究成果である「異種データ上での因果探索技術」と「超高速な非線形因果探索技術」に関する研究論文についてご紹介します. 次回の連載では、もう一件の採択論文の内容について解説します.
- 第1弾:AAAI-26に参加しました #1
- ワークショップ主催に関する報告(公開中)
- 第2弾:AAAI-26に参加しました #2
- 因果AI技術の論文発表に関する報告(今回の記事)
- 第3弾:AAAI-26に参加しました #3
- AI推論技術の論文発表に関する報告(3月16日予定)
因果AIに関する2件の論文が AAAI-26 本会議に採択!
富士通研究所では「因果AI技術を用いたデータドリブンな意思決定支援」に関する研究開発を行っており,現実世界の意思決定タスクへの適用(例えば,エンゲージメント調査データに基づいた従業員の生産性向上施策の発見)に取り組んでいます. 今回の AAAI では,因果AIの重要なコア技術である「因果探索」に関する2件の研究論文が本会議に採択されました(採択率 17.6%).
文献情報1
▶ タイトル: I-CAM-UV: Integrating Causal Graphs over Non-Identical Variable Sets Using Causal Additive Models with Unobserved Variables
▶ 著者: Hirofumi Suzuki, Kentaro Kanamori, Takuya Takagi, Thong Pham, Takashi Nicholas Maeda, Shohei Shimizu
▶ 会議: 40th AAAI Conference on Artificial Intelligence (AAAI 2026)
▶ 参考)論文へのリンク (arXiv)
文献情報2
▶ タイトル: Sparse Additive Model Pruning for Order-Based Causal Structure Learning
▶ 著者: Kentaro Kanamori, Hirofumi Suzuki, Takuya Takagi
▶ 会議: 40th AAAI Conference on Artificial Intelligence (AAAI 2026)
▶ 参考)論文へのリンク (arXiv)
研究背景: 因果探索とは?

因果探索 [1] は,複数の変数を含む観測データ(データセット)から,変数どうしの因果関係を推定する技術です(図1).たとえば「降水量・来客数・売上」の3変数からなるデータがあるとき,「降水量が増えると来客数が減る」(降水量 → 来客数)や「来客数が増えると売上が増える」(来客数 → 売上)といった関係が推論されます.推定された複数の因果関係を,原因から結果へ向かう矢印で表し,全体をグラフとしてまとめたものを 因果グラフ と呼びます.
因果グラフが得られると,ある変数に介入(外部から値を変更・固定する)した場合に,他の変数へどのような影響が波及しうるかを検討できます.たとえば,従業員の生産性と関連しそうな複数の指標に対して因果探索を行い,「どの要因に介入すれば生産性にどれだけ影響が見込めるか」を分析することで,生産性向上の施策立案など意思決定に活用できます.
我々が開発した「Fujitsu 因果AI」を支える基盤技術の一つが,この因果探索技術です.「因果AI」では,観測データから因果探索技術で推定した因果DAG(非巡回グラフ)を活用することで,データドリブンな意思決定支援を行っています.一方で,現実世界のデータは,複数の異種データセットに分散して存在することが多く,また,推定が難しい複雑な因果関係を持つことも多いことから,これらの課題に対応したより実用的な因果探索技術の研究開発が求められています.今回発表した研究論文では,これらの課題を解決するための新しい因果探索技術を提案し,数値実験によってその有効性を示しました.
参考
▶ Fujitsu Research Portal: データドリブンは可視化から因果へ
▶ 「Fujitsu 因果AI」のご紹介(全3回) #1 因果アクション最適化技術
▶ 「Fujitsu 因果AI」のご紹介(全3回) #2 知識誘導因果探索技術
▶ ECML-PKDD 2024 にて統計的因果探索の代表的モデル LiNGAM の高速な学習法 LayeredLiNGAM について発表しました
I-CAM-UV: Integrating Causal Graphs over Non-Identical Variable Sets Using Causal Additive Models with Unobserved Variables
ひとこと概要
本論文では,異なるデータセットにおける因果DAGの推定結果を統合することで,それぞれの推定結果と矛盾しない因果DAGの候補を列挙する新技術 I-CAM-UV を提案し,従来手法では見落とされてしまう異種データ間の因果関係を実用的な時間で発見できることを実証しました.
研究背景とモチベーション
実際のデータ分析の現場では,同じ業務課題を扱っていても,収集主体や計測設計の違いにより,利用可能な変数集合がデータセットごとに異なることがよくあります.例えば,A部門では人材データを,B部門では業務ログを収集しており,一部の変数だけが共通している,といった状況です.これらの異種データセットを統合して分析することで,単一データセットでは発見できなかった因果関係を見つけられる可能性があります.例えば,A部門の人材データからは「ワークライフバランスの向上が生産性に影響する」という関係が推定され,B部門の業務ログからは「生産性がプロジェクトの成功に影響する」という関係が推定されたとき,これらを統合することで「ワークライフバランスの向上がプロジェクトの成功に影響する」という新たな因果関係を発見できるかもしれません.
このような異種データセットを統合して因果探索を行うためには,まず各データセットに対して単一のデータセットを前提とする標準的な因果探索手法を適用し,得られた因果DAGを重ね合わせるという素朴なアプローチが考えられます.しかし,どのデータセットでも同時に観測されない変数ペアについては,直接の統計的検定や回帰で因果関係を推定することができません.したがって,単純な重ね合わせによるアプローチでは,同時に観測されない変数ペアの間の因果関係を発見することは原理的に不可能であり,異種データセットを統合することの大きなメリットを享受できないことになります(図2).加えて,一部のデータセット上でのみ観測される変数は,観測されないデータセットにおいては未観測変数としてふるまうため,未観測変数が存在しないことを仮定する標準的な因果探索手法では推定精度が劣化する可能性もあります.

このような課題に対して,複数データを統合する既存研究として,部分祖先グラフ(PAG)と呼ばれる因果DAGの変種を推定する手法が存在します [2].しかし,PAGは変数間の因果関係の方向が不明な辺を含むため,実務で使うには解釈に曖昧さが残るという課題があります.全ての辺の方向が特定された因果DAGを得るために,線形非ガウスに仮定を限定する既存手法もありますが,非線形性を含む実データに対しては推定精度が大きく劣化することが知られています [3].これらの課題に対して本論文では,全ての因果関係の方向が特定された因果DAGを,非線形な関係も許容しつつ,実用的な時間で推定する新しい技術の開発を目指しました.
提案手法のコアアイデア
本論文では,各データセットにおける因果DAGの推定結果を統合して,すべてのデータセットの推定結果と矛盾しない因果DAGの候補を列挙する新技術 I-CAM-UV を提案しました.提案手法は,Maeda & Shimizu (2021) が提案した因果探索手法 CAM-UV [4] に基づいています.これは,未観測変数の存在を考慮した非線形な因果探索手法であり,単一データセットから識別可能な有向辺と,未同定となった変数ペアを推定する手法です.提案手法 I-CAM-UV のコアアイデアは,CAM-UV が出力する識別済み有向辺と,未観測因果経路(unobserved causal path, UCP) および 未観測バックドア経路(unobserved backdoor path, UBP) により未同定となった変数ペア情報を,因果DAG統合時の明示的な制約として利用する点です.これにより,単純な重ね合わせでは取りこぼされる因果関係も復元可能になり,異種データ環境における因果探索の実用性を大きく高めています.一方で,このような制約を満たす統合因果DAGの候補は複数存在する可能性があります.そこで本論文では,制約を満たす統合因果DAG候補を高速に列挙する効率よいアルゴリズムも提案しました.
複数データセットのうち 番目のデータセットにおける変数集合を
,統合後の変数集合を
とし,
をそのデータセットにおける未観測変数集合とします.各データセットに CAM-UV を適用すると,混合グラフ
が得られます(ここで
は識別済み有向辺,
は未同定ペア).このとき,重ね合わせ有向辺を
とおくと,未同定候補は
で定義されます.また,CAM-UV で未同定が生じる要因は UCP/UBP であり,UCP は (
)の形の未観測因果経路,UBP は
(
)の形の未観測バックドア経路です(図3).したがって未同定ペア
は,
上では向きが未同定であるものの,その背景には UCP/UBP が存在する変数ペア集合として解釈できます.

I-CAM-UV はこの情報を各データセットの推定結果との整合性を評価するために活用します.まず と
を定義します.次に,
の各ペア
について,「辺
を挿入」「辺
を挿入」「辺を入れない」の3通りから1つを選び,その結果を集めた有向辺集合を
とします.このとき統合候補は
です.さらに,
を
のもとでの
上の
間の全 UCP/UBP 集合とおくと,整合性(consistency) は
で定義されます.理想条件( かつ CAM-UV 推定誤差なし)の下では真の因果 DAG がこの整合性を満たすことを理論的に示すことができます(Theorem 1).しかし実際には,整合性を満たす因果 DAG は複数存在し得るため,真の因果 DAG を一意に特定することはできません.そこで本論文では,不整合性を定量的に評価する不整合コスト
を定義し,その下界の単調性を用いた best-first 探索 で,候補を低コスト順に効率よく列挙するアルゴリズムを提案しました(図4).

計算機実験の結果
実験では,10変数の非線形な因果関係を持つ人工データを100セット生成し,そこからデータセット数 ,各データセットの未観測変数数
の条件で問題インスタンスを作成して評価しました.比較対象は,標準的な因果探索手法の結果を単純に重ね合わせた PC-UV-OVL と CAM-UV-OVL,欠損補完を経由する Imputation,そして線形非ガウス前提の既存手法 CD-MiNi [3] を採用しました.

図5の実験結果より,提案手法 I-CAM-UV は観測ペア・非観測ペアの双方で再現率が高く,特に CAM-UV 単体では発見できなかった関係や,非同時観測ペアにまたがる因果関係の発見に強みを示しました.一方で,候補DAGを広く列挙する性質上,適合率は CAM-UV-OVL より低下する傾向があり,偽発見が増えるトレードオフも確認されました.ただし,F1 スコアは概ね同等であり,総合性能としてはバランスを保っています.計算時間についても,10変数程度の疎な設定では実用的な範囲で動作し,best-first 探索による効率化の有効性が示されました.以上の結果から,提案手法 I-CAM-UV により,従来手法では見落とされてしまう異種データ間の因果関係を,実用的な時間で復元可能になる ことが確認されました.
Sparse Additive Model Pruning for Order-Based Causal Structure Learning
ひとこと概要
本論文では,非線形因果探索における主要なアプローチである順序ベース手法に着目し,従来手法が抱える計算コストと推定精度劣化の課題を解決する新技術 SARTRE を提案することで,推定精度を維持しつつ最大で5倍程度の高速化を実現 しました.
研究背景とモチベーション
本論文では,変数間に非線形な因果関係を許容する非線形因果探索技術に着目しました.現実世界に現れる因果関係は,非単調性や非均質性のような非線形性を持つことが多いです.このような複雑な因果関係を正確に推定するためには,線形な仮定を置いた従来の因果探索技術では不十分であり,非線形な因果探索技術が必要になります.非線形因果探索の分野では,いくつかの仮定の下で観測データから真の因果DAGを一意に復元できること(identifiability)が知られている一方で,実際のデータに対して高精度な推定を行うための効率的なアルゴリズムの開発は,依然として重要な課題となっています [5].
非線形因果探索における主要なアプローチの一つに,順序ベース手法があります(図6).順序ベース因果探索では,最初に因果DAG上における変数のトポロジカル順序を推定します(順序推定ステップ).このトポロジカル順序は,変数を「多くの変数の原因になっているもの」から「多くの変数の結果になっているもの」へと並べたものとして解釈できます.しかし,このトポロジカル順序において先にある変数が,後にある変数すべての原因になっている,つまり因果 DAG 上で有向辺で接続されているとは限りません.そこで順序ベース手法では,推定したトポロジカル順序に従って完全 DAG を構築したあと,因果関係のない変数ペアを特定しその変数間の辺を削除することで最終的な因果 DAG を推定します(剪定ステップ).

順序ベース手法の利点は,最初に因果 DAG のトポロジカル順序を推定することで,超指数的に膨大になり得る探索空間を大幅に削減できることです [6].このことから,既存研究の多くが順序推定ステップに焦点を当て,これまでに様々な順序推定手法が提案されてきました.一方で,剪定ステップに対しては,一般化加法モデル(GAM)の仮説検定に基づく CAM-pruning という手法が標準的に採用されてきました [7].しかしこの手法は,すべての変数に対してその原因候補となる変数で回帰する GAM の学習を繰り返す必要があります.GAM の学習は,変数の数が増えると計算コストが大幅に増加するため,CAM-pruning は大規模なデータセットに対しては実用的ではありません.さらに CAM-pruning は,因果関係の有無を推定するために全ての変数ペアに対して仮説検定を繰り返すため,多重検定による推定精度の低下を招く可能性があります.
提案手法のコアアイデア
本論文では,順序ベース因果探索の剪定ステップに焦点を当て,CAM-pruning の計算コストと推定精度の課題を解決する新しい剪定手法を提案することで,非線形因果探索の高速化を実現しました.提案手法のコアアイデアは,GAM の代わりに スパース加法モデル を用いることです.これにより,仮説検定なしで冗長な辺を特定できるため,多重検定の問題を回避することができます.一方で,従来のスパース加法モデルの学習は,GAM と同様に計算コストが高いという課題がありました.そこで本論文では,スパース加法モデルを高速に学習する新しい枠組みとして,Sparse Additive Randomized TRee Ensemble (SARTRE) を提案しました(図7).

変数 に対して,事前に推定したトポロジカル順序から定まる親変数候補の集合を
とします.ここでのタスクは,
を用いて変数
を回帰するモデルを
を学習し,真の因果DAG上で
の原因になっている変数を
の中から特定することです.今回提案した SARTRE モデルは,以下の形状関数
を持つGAM
の特殊ケースとして定義されます:
ここで であり(
),
] は変数
に対する区間を表します.また,
は各区間に対応する重みベクトルです.つまり,この形状関数は区間指示関数の線形結合で表されることになり,シンプルな構造でありながら非線形な関係を表現することができます.実際,この形状関数が万能近似性を持つこと理論的に示すことができます(Proposition 1).さらに定義より,
であれば
となるため,このとき変数
は
の原因ではないことが仮説検定を経由せずに判断できるようになります.
SARTRE モデルを学習するためには,まず各変数 に対して区間集合
を構築した後,重みベクトル
を最適化する必要があります.提案アルゴリズムでは,まず ランダム木埋め込み というテクニックを用いて高速に区間集合
を構築します [8].ランダム木埋め込みは,ランダムに生成した決定木の分割点を用いて区間を生成する方法であり,これにより,変数の分布に適応した区間を効率良く構築することができます.次に,構築した区間集合
を用いて,Group Lasso 回帰 を行うことで重みベクトル
を最適化します [9]:
ここで第一項は標準的な二乗誤差であり,第二項は Group Lasso 正則化項です.Group Lasso 正則化項により,なるべく多くの説明変数 に対して
となるように学習が行われます.上記の最適化問題は凸最適化問題なので,既存の効率良い最適化アルゴリズムを用いて高速に SARTRE モデルを学習することができます.GAM の代わりにこの SARTRE モデルを用いることで,仮説検定なしで冗長な辺を高速に特定できるようになり,順序ベース因果探索の剪定ステップを大幅に高速化することができます.
計算機実験の結果
実験では,非線形な因果関係を再現した人工データを用いてベースライン手法との比較を行いました.比較対象としては,順序ベース因果探索の最先端手法である SCORE [6] と,その高速化版 DAS [10] を採用しました.これらの手法は,Rolland et al. (2022) が提案した順序推定手法に,CAM-pruning に基づく剪定法を組み合わせた手法です [6].提案手法は,同じ順序推定法と SARTRE に基づく剪定法を組み合わせて実装しました.各実験で人工データを10回生成し,因果DAGの推定誤差の指標である Structural Hamming Distance (SHD) と Structural Intervention Distance (SID) ,および推定に要した時間(秒)を測定し,その平均値と標準偏差を報告します.

図8の実験結果より,提案手法 SARTRE は,変数の数が増えるにつれて,ベースライン手法より劇的に推定時間が短縮されていることがわかります.さらに,推定精度の指標である SHD と SID も,提案手法がベースライン手法と同等かそれ以上の性能を示していることがわかります.これらの結果から,提案手法 SARTRE が順序ベース因果探索の剪定ステップを大幅に高速化しつつ,同等以上の推定精度を維持できている ことが確認されました.
おわりに
本記事では,AAAI 2026 本会議で発表した「異種データ上での因果探索技術」と「超高速な非線形因果探索技術」に関する研究論文の内容を紹介しました.これらの研究成果は,現実世界の複雑なデータに対しても適用できる実用的な因果探索技術の開発に向けた重要な一歩となると考えています.今後も,これらの技術をさらに発展させるとともに,実際の意思決定タスクへの適用に向けた研究開発を進めていきたいと思います.
参考文献
[1] 清水昌平 (2017). 統計的因果探索 (機械学習プロフェッショナルシリーズ). 講談社.
[2] Tillman and Spirtes (2011). Learning equivalence classes of acyclic models with latent and selection variables from multiple datasets with overlapping variables. Proceedings of the 14th International Conference on Artificial Intelligence and Statistics (AISTATS2011).
[3] Huang et al. (2020). Causal discovery from multiple data sets with non-identical variable sets. Proceedings of the AAAI Conference on Artificial Intelligence (AAAI2020).
[4] Maeda and Shimizu (2021). Causal Additive Models with Unobserved Variables. Proceedings of the 37th Conference on Uncertainty in Artificial Intelligence (UAI2021).
[5] Peters et al. (2014). Causal Discovery with Continuous Additive Noise Models. Journal of Machine Learning Research.
[6] Rolland et al. (2022). Score Matching Enables Causal Discovery of Nonlinear Additive Noise Models. Proceedings of the 39th International Conference on Machine Learning (ICML2022).
[7] Bühlmann et al. (2014). CAM: Causal Additive Models, High-Dimensional Order Search and Penalized Regression. The Annals of Statistics.
[8] Moosmann et al. (2006). Fast discriminative visual codebooks using randomized clustering forests. Advances in Neural Information Processing Systems (NIPS2006).
[9] Yuan and Lin (2006). Model selection and estimation in regression with grouped variables. Journal of the Royal Statistical Society: Series B (Statistical Methodology).
[10] Montagna et al. (2023). Scalable Causal Discovery with Score Matching. Proceedings of the Second Conference on Causal Learning and Reasoning (CLeaR2023).