Please enable JavaScript in your browser.

fltech - 富士通研究所の技術ブログ

富士通研究所の研究員がさまざまなテーマで語る技術ブログ

Fujitsu Research of Europeのチームが ICLR 2024にて画像環境にデータを効率よく判定・適応するための新技術を発表

こんにちは、Fujitsu Research of Europeのアブラ・チャウドゥリです。私は、コンピューティングを研究グループのシニアリサーチマネージャーとして、さまざまな状況でデータの分布が変化した時に、深層学習モデルがどのような反応をするかを研究しています。

アンジャン氏との共同研究により開発した技術に関する論文「Learning Conditional Invariances through Non-commutativity 」がInternational Conference on Learning Representations (ICLR) に採択され、5月にオーストリアのウィーンで開催された年次イベントにて発表を行いました。

ICLRは、マシンビジョン、計算生物学、音声認識、テキスト理解、ゲーム、ロボット工学などの重要なアプリケーション分野だけでなく、AI、統計、データサイエンスの分野で使用されるディープラーニング全般に関するトップカンファレンスです。

Fujitsu Research of Europeの研究者たちは、エクセター大学とサリー大学の研究者たちと協力して、新しい技術を開発しました。この技術は、図面、漫画、クリップアートなど、さまざまなソースの画像情報を活用することで、データ量が少ない写真など異なる種類の新しい画像など十分な学習データを準備できない場合でも対応できるAIシステム を実現します。

この手法では、新しい対象画像から得られる画像の特徴を、他のソースから得た画像との共通点と異なる点の両方を考慮して学習します。そして、学習した特徴を包括的に使うことで、新しい種類の画像に対して画像の診断や判断をより正確に行うことができます。

具体的には、他のソースから得たサンプル画像の特長を、新しい画像の表現空間に非可換的にマッピングすることで、新しい画像の画像特徴も考慮した上で効率的に学習します。これにより、新しい種類の画像サンプルが少ない場合でも、さまざまなソースからのサンプルを用いて、新しい画像の汎化を可能にしています。3つの標準的なドメイン適応ベンチマーク (PACS、Office-Home、DomainNet)において、アート、漫画、写真など、さまざまな種類の画像形式を対象に検証を行いました。まず、特定の種類の画像(例えば漫画)に何が映っているかを示すラベルを付けて訓練を行いました。その後は、新しい種類の画像(例えば写真)のラベルなしの画像をほんの数枚入力するだけで、新しい種類の画像に映る物体を認識できるようになりました。この手法は、従来の手法と比べて、画像認識の精度を約2%向上させました。

将来的には、多様な 病理画像を扱うモデルの精度の向上を目指しています 。

開発者コメント

私たちのプロジェクトでは、医療画像やグラフデータのように、データの性質が大きく変わる場合でも、安定して動作するアルゴリズムを開発しています。特に、医療画像のようにデータ量が限られている分野や、グラフデータのように分布の変化がまだ十分に研究されていない分野において、このアルゴリズムは有効です。 この技術は、機械学習モデルを新しいデータに適応させる際に、どの特徴を重視すべきか、どの特徴を無視すべきかを判断する最初のステップです。シンプルで効率的な方法で、必要な特徴を学習することが可能です。将来的には、この技術をヘルスケアや大規模なグラフデータ分析など、さまざまな分野に応用することで、社会に貢献したいと考えています

関連リンク

https://pr.fujitsu.com/jp/news/2024/05/9.html