コンピューティング研究所の「ゲノムAI」チームです。 本チームは、ゲノムデータを対象としたさまざまなAIを開発しているチームになります。 この度、チームメンバーで「第6回日本メディカルAI学会学術集会」に参加してきたのでその報告を行います。開発中の成果を広くアピールしつつ、医療現場の方からフィードバックを得ることを目的に、発表をしてきました。
はじめに
本学術集会は、日本メディカルAI学会が主催しています。日本メディカルAI学会は、メディカル領域でのAI技術の活用と発展を期して2018年に設立されてから年々成長を続けており、学会の特徴としては、基礎医学・臨床医学・情報科学・システム工学・ハード開発・生命倫理など多彩な分野の専門家が、分野の垣根を超えてメディカルAI分野の発展に邁進していることが挙げられます(学会ページの記載を参考にしました)。
第6回となる今大会は、2024年6/21(金)、6/22(土)の2日間、名古屋市公会堂(岡谷鋼機名古屋公会堂)にて開催されました。約830名の参加があり、参加者の内訳として、医師、製薬企業、ITベンダーが多くを占めていました。2つの基調講演、10のシンポジウム、60の一般演題(口演)、62のポスターが展示されていたほか、企業ブースも10企業ほど展示していました。
また本学会の発表内容の傾向を可視化するため、今回抄録集からWordCloudを作成してみました(図1)。データやモデルなどAI関連の用語に加え、患者、診断、臨床、画像など、医療系の対象が反映されています。続いて、予測、評価、解析などモデル評価指標の用語などもあり、AI技術の活用状況が伺えます。
我々のチームは、3つのポスター展示を実施し、参加者と議論を行いました。
学会の様子
学会会場の「岡谷鋼機名古屋公会堂」(図2)は、昭和5年建築という歴史を感じさせる造りは思わず襟を正したくなる荘厳な雰囲気を醸し出していました。 シンポジウム・発表はそれぞれ1階と4階にある大ホールにて二並列で行われ、参加者は時間帯によって好みの方に参加し、合間を縫ってポスターを見に行く、というように比較的自由に会場内を移動できる雰囲気となっていました。踊り場などのスペースでは参加者同士で議論が行われるなど、参加者間による活発な議論が数多く見られたのも特徴です。
当研究チームの発表内容と現地での議論
「がん構造異常の転座において病原性を予測し理由を説明する機械学習モデルの構築」 発表者:村上 勝彦
がん患者の全ゲノム解析では、単一塩基変異だけでなく転座などの構造異常で生じる融合遺伝子の病原性の判定が重要です。本研究では、融合遺伝子の病原性を世界トップレベルの精度で予測し、予測の根拠をがんの発生メカニズムに基づいて説明できる「説明可能な人工知能(XAI)」を世界で初めて開発しました。予測の根拠については、大規模言語モデル(LLM)をもちいて自然文で説明することが出来ます。本XAI技術により、がん患者のゲノムに見つかった構造異常の臨床的な解釈が進み、ゲノム医療の発展が期待されます。
この内容は、がん専門誌に掲載した論文と医学関係者へ向けたプレスリリースと技術を中心に解説した関連ブログなどでも発信しています。ポスター発表は1時間でしたが、その間、多くの質問や励ましをいただきました。ユースケース、課題の条件などの議論があり、今後の方向性を確認できました。また、あらたな繋がりが出来たので、今後は現場医師とのコラボレーションの拡大も期待できそうです。
「大規模言語モデルを活用したゲノム医療のための論文探索の試行とその評価」 発表者:森川 裕章
本技術は、がんの「診断」「治療法」「予後」の観点で、ガイドライン(ゲノム検査ガイドラインなど)から参照される「エビデンスレベル」が高い論文を探索できる技術です。がん研究論文の増大(2014年:約28万論文→2021年:約45万論文)により、論文検索に多くの時間を費やす現場医師に対し、論文調査業務を軽減することを本技術の適用例と考えています。具体的には、遺伝子検査レポートに記載された内容を裏付ける情報(エビデンス情報)を論文から見つけたい医師に対し、有用な技術であると考えています(図3)。
本技術は、Retrieval-Augmented Generation(RAG)を用いています。RAGは、大規模言語モデルに外部情報を入力することにより、外部情報に基づいた回答を得られるため、大規模言語モデルの課題の一つであるハルシネーション(幻覚)を低減する技術として知られています。今回、RAGを論文データに適用、加えて課題を実現するプロンプト群を開発することで本技術を実現しました。定量評価では、ガイドラインで参照している論文を見つけられるかのタスクにおいて、高いF1スコアを達成しました。次に「エビデンスレベル」の高い順に論文を並べ替えたところ、ガイドラインで参照している論文が上位に来ることを確認しました。 さらにAIの価値である発見的事例として、前版(2021年度版)では参照されず、最新のガイドライン(2023年12月策定)で新たに参照されることになった論文を見つけることができました。
ポスターセッションでは、多くの方と議論し、ChatGPTをはじめとする生成AIの医療現場での活用方法、論文調査業務における現場医師の課題・困りごとについてポスターを見ていただいた方から直接聞くことができ、本技術の現場での適用可能性を確認することができました。今後は、さらなる技術適用先(ユースケース)の探索、固形がんでの技術の有用性評価、オープンソースLLMを用いた検証などを進める計画です。
「大規模言語モデル(LLM)を用いた医療文献の医療カテゴリ情報抽出ならびに表示システムの構築」 筆頭:瀧下 祥 発表者:小嶋陸大
本研究では、大規模言語モデルを用いた医療論文の検索システムを開発しました。背景として、医師が医療論文を検索する際に必要以上に時間を取られてしまい、目的となる情報になかなかたどり着けないという課題に我々は着目しました。本システムでは検索語句となる融合遺伝子に対し、RAG, LLMを用いて複数のカテゴリ(薬剤情報や被験者情報、予後情報など)に関する情報抽出や要約生成を行い、その解析結果をもとに事前に論文の概要や内容を比較しながら、複数論文からユーザが必要な論文を選ぶ機能を実現しています(図4)。これにより医師が目的の論文情報を素早く探し当て、医療方針の迅速な決定を支援することを狙います。
ポスターセッションでは企業の方やアカデミックの方から多様な反応を頂きました。中には今すぐにでもこのシステムを使ってみたいという好意的なご意見もいただけたので、今後はサービスの実現に向けて一層邁進したいと思います。
その他の発表
当研究チームで注目したセッションについていくつか紹介します。開幕を飾ったシンポジウム「我が国における医療AI研究開発の動向と今後の戦略」では、日本の医療AI研究の現状と将来の方向性について講演が行われました。AIの医療応用に関する様々な側面について、興味深い議論が展開されました。「メディカルAI開発現場における課題とその克服」というシンポジウムでは、実際の開発現場で直面する問題とその解決策について深い洞察が得られました。また、「説明・解釈可能な医療診断AI」をテーマとしたセッションでは、AIの判断過程の透明性確保の取り組みが議論されました。倫理面では、最新の生成AI技術の医療応用に伴う倫理的問題とリスク管理について重要な指摘がありました。データ利活用に関しては、「仮名化情報」の利用など、個人情報保護と研究推進のバランスを取るための動向が紹介され、より効果的なデータ利活用の可能性が示唆されました。その他、LLMを利用した医療への活用技術全般における課題として、ハルシネーション(LLMが誤情報や曖昧な情報を真実のように出力してしまう)が挙げられていました。本学会でもいくつかの発表中で対策手法が提案されていましたが、特にRAGによる文献検索やプロンプトに参照情報を含めた要約の生成は我々の論文検索・説明でも取り入れている手法であり、我々と世間の研究の方向性の一致を改めて確認することができました。 さまざまな観点からの議論により、我々の今後の研究方向性なども確認できました。 (参考:大会プログラム)
最後に
最後に、この学会で多くの方々と貴重な交流ができたことに私たちは深く感謝しています。皆さんからいただいたフィードバックや議論は、私たちの開発にとって非常に価値のあるものでした。今回の成果を活かし、新たな技術や問題設定を取り入れて、より革新的な製品やサービスの開発を進めていきたいと考えています。今後も産業界のニーズに応え、持続可能なイノベーションを追求していく所存です。