
こんにちは。人工知能研究所の藤井、簗島です。 本記事では、 Fujitsu 因果AI の知識誘導因果探索技術とその適用事例をご紹介します。
Fujitsu 因果AIは、従来の施策推薦技術が抱えていた、以下のような課題を解決するために生まれました。
- 施策による悪影響(副作用)の考慮が難しい
- 複数の因果関係を同時に考慮できず、最適とは言えない施策を提案してしまう可能性がある
- 単一データセットしか使えないので、データ量や偏りの影響を受けやすく、限定的な施策提案しか得られない
Fujitsu 因果AIは、これらの課題を解決するため、以下の3つのコア技術で構成されます。
- 因果アクション最適化技術
- 統合因果探索技術
- 知識誘導因果探索技術

本連載が、皆様の課題解決のヒントとなれば幸いです。また記事の最後には、本技術を試す方法についてもご案内します。
(1) 因果アクション最適化技術(公開中)
本技術は、数値データから事象間の因果関係を高速に分析し、その因果関係をグラフと自然言語の文章で説明します。さらに、その因果関係の結果を踏まえて、最も効果が高くかつ悪影響のない施策を推薦する技術です。
(2) 知識誘導因果探索技術(本記事)
知識誘導因果探索技術は、因果関係を探索するときの前提知識として過去の因果関係のグラフを活用することで、データ数が少ない場合でも信頼性の高い分析を実現します。
(3) 因果アクション最適化技術の実証事例(1月16日頃、公開予定)
人事のエンゲージメントサーベイの改善施策立案、およびビールの醸造プロセスにおけるパラメータ設計に本技術を活用した実証実験の事例をご紹介します。
知識誘導因果探索 ~少データでも信頼性の高い因果探索を実現~
知識誘導因果探索技術は、因果関係を探索するときの前提知識として過去の因果探索の結果や既知の因果グラフを活用することで、データ数が少ない場合でも信頼性の高い分析を実現する技術です。ここでは本技術の概要と、Fujitsu 因果AIが搭載する既知の因果グラフ「弘前健診因果ネットワーク」を活用した適用事例について紹介します。
データが少ないとどんなことが困るの?
「データ分析をしたいけれど、集められるデータ数に限りがある」という状況は、現実のデータを扱う上でしばしば起こる問題です。また、「特定部署の社員データに因果分析を行いたい」といった状況下では、必然的にデータサイズが小さくなる傾向があります。 Fujitsu 因果AIが基盤とする因果探索技術は、統計的な手法によってデータの背後にある因果関係を推定します。そのため、データ数が少ない場合、変数間の因果関係の向きや大きさを誤って推定してしまい、データの背後に存在するはずの「正しい因果関係」を捉えきれない可能性が高まります。
前提知識を活用するには?
データが少ない場合でも分析の精度を向上させるうえで、「AはBの原因になりうるが、逆はない」といった前提知識の設定が重要です。従来、これらの前提知識はユーザーがドメイン知識に基づいて自身で設定する必要があります。しかし、専門的な知識をもたないユーザーにとっては、正しい前提知識を与えることが難しいという課題があります。 また、複数の変数間の複雑な因果関係まで考慮してユーザーが前提知識を与えることは難しく、これにより分析結果の妥当性や信頼性が損なわれる可能性があります。例えば、AとBの間の直接の因果関係について考えるとき、この二つの変数に影響を与える変数Cも考慮に入れた上でAとBの間の正しい因果関係を前提知識として設定する必要があります。通常、Cと同様にAやBの共通原因になる変数はD、 E、 。。。と複数存在するため、このような共通原因まで考慮した複雑な前提知識の設定は人間にとって非常に困難なタスクです。
どうやって知識誘導因果探索を実現しているの?
この課題を解決するため、本技術では過去に実施した因果探索から得られた因果グラフや、信頼性の高い既知の因果グラフからユーザーデータに合わせた因果関係の情報を前提知識として誘導し、ユーザーデータに対する因果探索に転用します。本技術は大きく次の二つの技術によって実現されています:
- データ変数と因果グラフノードのマッチング
- 因果情報の抽出
データ変数と因果グラフノードのマッチング

データ変数と因果グラフノードのマッチングでは、前提知識となる既知の因果グラフ上のノードを、ユーザーデータのどの変数に対応させるか自動決定します。 例えば、転用先項目「活動レベル」がどの転用元項目と対応するか?を考えます。ここで、図中の青の四角が転用先、黒丸が転用元に対応しています。項目名同士の意味的な近さを測ると、図の例では「活動レベル」が「体格指数」と最も近くなり、より望ましい「運動習慣」とは異なる対応付けになってしまいます。 本来、変数同士のマッチングを行う場合、項目名の意味的な近さと、データとしての近さの両方を考慮して最終的な対応を決定したいです。しかし、既知の因果グラフについてはその元になっているデータに直接アクセスできない場合も多く、データ分布同士を比較して対応関係を付けることが困難です。 そこで、ここでは開発技術であるProxy-assisted matchingによって対応の決定を行います。この技術は、転用元因果グラフの代理データを転用先のデータから取得し、より望ましいマッチングを実現します。まず、意味的な近さに基づいて因果グラフ上のノードに最も近いデータ変数を決めます。そして、この対応によってグラフノードの代理データをユーザーデータから取得し、代理データとユーザーデータの近さをデータ空間で測ります。最後に、これらを総合してグラフノードとユーザーデータ変数の近さを測り、最終的な対応を決定します。 例えば先の例では、意味的な近さだけでは近くなってしまった「活動レベル」と「体格指数」に対して、代理データによる補正を行ったことで「活動レベル」と「運動習慣」がより近くなり、望ましいマッチングが実現できています。
因果情報の抽出

決定された対応に基づいて、前提知識として用いる情報を因果グラフから抽出します。最も単純な方法は、ユーザーデータ変数と対応づいたノード間の直接の因果関係の有無を情報として転用することです。しかし、後述する「弘前健診因果ネットワーク」のように、既知の因果グラフとして巨大なグラフが手元にある場合、局所的な因果関係の有無だけでなく、大域的な関節の因果関係まで含めて情報を転用したほうが、より前提知識を潤沢に用いることができます。 例えば、ユーザーデータと対応づいた既知の因果グラフ上のノード”工場稼働率”、”大気中CO2濃度”があるとき、”工場稼働率”と”大気中CO2濃度”間の因果関係をみると「因果関係なし」となっています。このとき、非対応ノード●を経由して、”工場稼働率” → ● →”大気中CO2濃度”という因果関係が存在する場合に、この関係性まで考慮できる点が本技術の特色です。 一方で、”工場稼働率”、”電力価格”間に経由する非対応ノード●が複数ある場合に、これをそのまま転用して良いのか、という課題もあります。多くの変数を経由する因果関係はその過程で因果効果が消えてしまう場合も多いからです。本技術では、対応づいたノードが既知の因果グラフ上でどのような位置関係にあるかをグラフの連結性などの幾何学的特徴に基づいて解析し、経由する非対応ノードをどの程度考慮すべきかを自動決定しています。
Fujitsu 因果AIが搭載する「弘前健診因果ネットワーク」
ここまで、知識誘導因果探索の技術的背景について紹介してきました。Fujitsu 因果AIでは、この技術を信頼性の高い巨大因果グラフ「弘前健診因果ネットワーク」を前提知識として、実際にお試しいただくことができます。 弘前健診因果ネットワークは、「弘前大学COI-NEXT」が「岩木健康増進プロジェクト」で得た、多項目に渡る健診結果のビッグデータに対し、京都大学と弘前大学の研究グループがベイジアンネットワーク技術を適用し、項目間の因果関係を推定した信頼性の高い因果グラフです。富士通ではこれまで、この弘前健診因果ネットワークを前提知識として用い、本技術を様々なデータセットに適用してきました。ここでは二つの適用事例を紹介します。
適用事例1:遺伝子、食習慣データへの適用
ゲノム科学の進展により、遺伝子と体質・行動の相関は多く報告されています。しかし、何が原因で何が結果なのか、どのようなメカニズムで影響が生じているのかという因果関係を深掘りすることは、相関とは異なり多因子間の影響を考慮する必要があるため困難でした。特に、食嗜好、ライフスタイル習慣、体格といった複雑な要素が絡み合う領域では、精密なデータ分析が不可欠です。 本取り組みでは、株式会社ジーンクエスト(以下、ジーンクエスト)が有する大規模な遺伝子・アンケートデータと、Fujitsu 因果AIを組み合わせ、これらの複雑な因果メカニズムをより深く分析しました。さらに、知識誘導因果探索技術を適用することで、信頼性を強化するとともに、データセット単体では見えてこなかった重要因子の存在が示唆されました。
因果探索から見えたこと
本取り組みでは、同意が得られた約4,000名の遺伝子データとアンケートデータを使い、Fujitsu 因果AIによる因果分析を行いました。その結果、大きく次の二つの成果が得られました。
- アルコール代謝に関連する遺伝的特性と食習慣の関連性: アルコール分解能力に関連する遺伝的特性は飲酒頻度と強く関連し、ジーンクエストによる先行研究でも甘味の嗜好性やコーヒーの摂取頻度など様々な食習慣との関連が示されています。甘味への嗜好性やコーヒー摂取頻度については、これまで遺伝的要因の影響が示唆されていました。Fujitsu 因果AIを用いた分析の結果、甘味への嗜好性には遺伝的なアルコールの強さも一部関連するものの、その関連は主に飲酒頻度を介したものである可能性が示されました。また、コーヒー摂取頻度に関しては飲酒頻度との関連は見られず、遺伝的なアルコールの強さが影響している可能性が示唆されました。これは、特定の遺伝的特性が個人の飲料選択に影響を及ぼす可能性を示しています。
- 体格に関連する遺伝的特性と食習慣・BMIの関連性 : ダイエットやBMIに関連する多数の遺伝的要因を統合した指標であるポリジェニックスコアを用いて、遺伝的な太りやすさと食習慣、BMIとの因果的関連性を分析しました。解析の結果、遺伝的な太りやすさとBMIとの間に直接的な関連性が示唆され、その統計的な影響度は性別や年齢と同程度である可能性が示されました。また、脂っこい味や甘い味といった食嗜好との間にもわずかな関連性が見られました。
知識誘導因果探索の適用
さらに、知識誘導因果探索によって弘前健診因果ネットワークを転用した分析では、より精緻な結果が得られ、これまでの分析でポリジェニックスコアに次ぐBMI変化の主要因と示唆されてきた食事量の影響が相対的に低下し、脂っこい味やうま味への嗜好性がより影響力の高い要因として示唆されました。さらに、親族の病歴(がん、高血圧症、心臓病など)や調査対象者の身長、雇用形態など、これまで分析対象外であったデータに含まれない因子が、変数間の隠れた共通原因となっている可能性も示唆されました。
適用事例2:従業員データへの適用
※本事例で適用したデータは、従業員の健診データをイメージしたものですが、あくまで技術紹介用に作ったシミュレーションデータになります。
部署ごとに適切な施策を
企業が保有する従業員の健診データやエンゲージメントサーベイ、財務データ等を用いて、データ項目の因果関係を考慮した上で、売上利益などの目的変数を向上させる施策立案を考えます。この時、健診、財務等のデータをまとめた統合データ全体から因果関係を推定し、推定された因果関係をもとに、効果的な施策を因果AIが推薦することもできます。しかし、その統合データには、様々な部署が混合されており、部署ごとで異なる特色がみられる可能性も考えられるため、利益を上げるという一つの目的を達成するために企業全体で1つの施策をうつのではなく、それぞれの部署に合った施策を企業全体で複数うつことが効果的かもしれません。このような状況下では、データサンプルを部署ごとに分け、サンプル数の少ないデータで効果的な施策を立案することが求められます。
売上利益を上げるための施策立案

まず、前提知識を用いずに因果グラフを推定し、Fujitsu 因果AIによるアクション提案を実行します。すると、売上利益を上げるためのアクションとして、荒利益を上げることが推薦されてしまいました。因果グラフ(上画像)を見てみると、売上利益の上流にある項目のうち、支配的であったものが荒利益であり、荒利益を上げることで売上利益を上げることが出来る、という施策が推薦されたと考えられます。しかし、これは自明な施策であり、この施策から我々従業員が具体的なアクションを取ることはできません。
知識誘導因果探索の活用

そこで、弘前健診因果ネットワークを前提知識として活用した知識誘導因果探索によって因果グラフを推定しました。推定された因果グラフ(上画像)を用いると、売上利益を上げるための施策としてエンゲイジメントを上げることが推薦されました。エンゲイジメントは我々従業員に直接関係する指標であり、このアクションは先ほどよりも比較的取りやすそうです。
従業員の健康面を損ないたくない
しかし、エンゲイジメントを上げるアクションを取ると、副作用として、従業員のストレスがたまりやすくなってしまうこともわかりました。売上利益を上げることと引き換えに、従業員のストレスがたまりやすくなってしまうのは、健康面の観点から望ましくありません。そこで、因果AIに、従業員のストレスがたまらないようなアクションを推薦してもらいました。すると、エンゲイジメントを上げることに追加して、同僚のサポートもしっかり行うようにというアクションが推薦されました。これは、健診データも同時に用いていることの効果とも言えそうです。ところで、エンゲイジメントを上げるためにはいったいどうすれば良いのでしょうか?
エンゲイジメントを上げたい
先ほどは、売上利益を上げるための施策を因果AIに聞いていました。今回は、エンゲイジメントを上げることにフォーカスして、因果AIに施策を立案してもらいましょう。先ほどの例もあるため、健康面を損なわないような制約も追加します。すると、エンゲイジメントを上げるためには、上司のサポートと同僚のサポートを強化することが知見として得られました。
Fujitsu 因果 AI を試してみませんか
今回ご紹介した因果探索とアクション最適化の機能は、富士通のAI サービス 「Fujitsu Kozuchi」を通じて、APIとGUIで手軽にご利用いただけます。
プログラミングは不要です。CSV ファイルをアップロードするだけで、お手元のデータから因果グラフを可視化し、施策の候補リストを得ることができます。
| ユースケース | 入力 | Kozuchi が提案するアウトプット |
|---|---|---|
| ビール開発 | 味覚チャート (苦味・甘味・香りなど)と工場設定値(発酵温度やホップ投入量など)に関するデータ、および、味覚チャートの目標値 | 発酵温度・時間、麦芽配合比、ホップ投入タイミングなど、製造レシピ全体 |
| 従業員エンゲージメント | 現状サーベイ結果と目標スコア | 研修内容、ピアボーナス額、上司との1on1 の頻度など、具体的な人事施策 |
プログラミングをすることなく, CSV をアップロードするだけで因果グラフの可視化と施策候補一覧が得られます。ぜひ皆さんのデータでも「もし... ならば?」 を即座に検証してみてくださ い。
関連記事
論文発表(ECML-PKDD 2024):
統計的因果探索の代表的モデル LINGAM を高速化する 「LayeredLINGAM」について発表しました。
▶ 技術ブログ解説記事
▶ 論文(Springer)
活用事例(Materials Informatics 特集):
▶ #9: 材料の性質は何が原因で変化するの? 因果発見 AI がお答えします!
▶ #10: 半導体デバイス設計への因果発見 AI の適用
プレスリリース:
▶ ジーンクエストと富士通、「Fujitsu Kozuchi」の高速・高信頼な因果AI活用により遺伝子とライフスタイルの関係性に新たな知見を導出
(20251009)
▶ 複数データを統合することで、少量データでも高精度に因果関係を導出するAI技術を開発(2025/03/06)
▶ 京都大学、Chordia Therapeutics、富士通、因果関係を発見するAI技術を用いてがんの新薬に対するバイオマーカーを発見する実証実験を開始(2023/05/17)
▶ ヒトやモノなどのデータの一つひとつが持つ特徴的な因果関係を発見する技術を開発(2020/12/17)