Please enable JavaScript in your browser.

fltech - 富士通研究所の技術ブログ

富士通研究所の研究員がさまざまなテーマで語る技術ブログ

能動学習の論文がIROS2021に採択されました

f:id:fltech:20211005153616j:plain

こんにちは.人工知能研究所 自律学習PJの鈴木です.富士通研究所では「自律的に学習可能なAI技術」に関する研究開発を行っています.今回は我々の研究成果のうちの一つがロボティクス分野の主要な国際会議であるIROS2021に採択されたので,その内容について概要を説明します.

対象論文

採択された論文の内容

今回採択された論文は,ロボットを用いた能動学習(Active Learning; AL)の効率化に関する内容です.能動学習は効率的にデータに注釈をつける手法であり,機械学習に必要な人間の注釈コストを削減するために用いられています.しかしながら,能動学習においても注釈付けにはドメイン知識を十分に持つ人間が想定されているため,人件費が低いとはいえません.そこで本研究では,ロボットアームを用いて弱ラベル付きデータを集めて自己訓練(Self-training)を行うことで,注釈付け作業の一部を自動化する方法を提案しました.

提案手法

本研究では,能動学習の中の特に,逐次的にデータが流れてくるStream-based ALという設定を扱いました.実データにおける時間的変動を考慮すると,Stream-based ALは蓄積データの影響を大きく受けるPool-based ALよりも適応性に優れています.我々の研究では,ベルトコンベア上を次々と流れてくる物体から分類モデルを構築するタスクを考えました.

f:id:fltech:20211005151349j:plain
図1:提案手法の概要

提案手法は,物体を分類するための分類器・補助分類器としての識別子検出器・データを収集するためのロボットシステムから構成されます.ロボットアームに取り付けられたカメラは,ALによって必要だと判定された対象物体に対して連続した画像を取得します.分類器は,識別子検出器で取得したラベル・自己訓練によって付けられる疑似ラベル・人間によって付けられるラベルの3種類のラベルをもとに訓練が進められます.

ここで,取得した連続画像に映った物体は同じラベルを持つと仮定されます.提案手法ではこの情報を,自己訓練によってつけられる疑似ラベル・識別子検出器により検出された高信頼性のラベルと,ALによって指定されるターゲットインスタンスを結びつけるための弱ラベルとして用います.連続画像中の確信度の高い画像から予測されるラベルと,訓練に有効な画像をペアにすることで,識別子検出器が付けられなかったデータを補助します.また,通常,自己訓練では誤った疑似ラベルは分類器の性能に悪影響を与えることがありますが,高信頼性のラベルを用いることでこれらを軽減することもできます.

実験

実験では,ベルトコンベア上の物体の分類タスクで提案手法を評価しました.コンベア上には100種類の雑貨が逐次的に流れ,分類モデルの構築に必要なデータを取得し,一定数が貯まったら学習を行うプロセスを繰り返します.なお,本研究で集めたデータはDAISO-100として公開し,我々の他の研究でも活用されています.名前からもわかる通り,本データセットは株式会社大創産業様の商品を使用しています.快く商品写真の利用許諾をくださった大創産業様に感謝申し上げます.

f:id:fltech:20211005155342j:plain
図2:実験に使用した雑貨100点(左)と,識別子検出器によるデータ収集の様子(右)

論文ではStream-based ALにおけるデータの与えられ方に関する3つのシナリオ(ランダムにデータが流れてくるシナリオ、事前に持つデータセットに偏りが存在するシナリオ、流れてくるデータに偏りがあるシナリオ)に対して提案手法を適用しました.さらに,データをスタンダートなALによって,または,ランダムに取得した場合をベースラインの手法として提案手法と比較しました(図3).全ての実験シナリオにおいて,提案手法は低い注釈コストでベースラインと同等の精度を達成しており,その有効性が確認されました.

f:id:fltech:20211005151209p:plain
図3:各シナリオにおけるモデルの分類精度

今回提案した手法はシンプルな手法の組み合わせではありますが,分類問題以外のタスクや未ラベルデータの活用など,手法には拡張する余地があり,富士通研究所は今後これらの検討を行う予定です.

終わりに

本記事ではIROS2021で発表した研究の概要についてご紹介しました.実験で用いたデータセットであるDAISO-100は,富士通研究所のAI研究用データセット公開サイトData Platterで公開中です.これらと併せ,今後も本研究を発展されていければと思います.

富士通研究所では一緒に働ける方やインターンシップを随時募集しています.もし興味を持たれた方がいらっしゃいましたら,自律学習PJの小橋がカジュアル面談を行いますので,是非ご連絡ください.