Please enable JavaScript in your browser.

fltech - 富士通研究所の技術ブログ

富士通研究所の研究員がさまざまなテーマで語る技術ブログ

新しいデータセット(DAISO-10とCarsCG)を公開しました

f:id:fltech:20220127115843p:plain

こんにちは.人工知能研究所 自律学習PJの砂川です.富士通研究所では「自律的に学習可能なAI技術」に関する研究開発を行っています.AIアプリケーションの実問題への適用には,学習に使用したデータと適用時のデータの性質が異なることによって性能劣化が起こるという課題があります.こうしたデータの性質の変化を人工的に起こしたDAISO-10CarsCGという2つのデータセットを作成し公開しました.

DAISO-10

DAISO-10DAISO-100から派生したデータセットで,学習時と適用時のデータの性質の差によって起こる性能劣化を防ぐ技術の開発と評価を目的として作成しました.10クラスの雑貨の画像10000枚で構成されていて,10クラスの中にはイルカとクジラ,トマトと青りんごのような分類が難しいクラスの組が存在しています. 10種類の雑貨をロボットアームを使って撮影し,撮影の際に照明,雑貨の配置,雑貨の角度,カメラ(ロボットアーム)の角度を変えて撮影することで,各クラスの画像にバリエーションを持たせました.バリエーションの例を図1に示します.照明は5種類(室内灯・スポットライト・赤・緑・青),雑貨の配置方法は2種類,雑貨の角度は20通り,カメラの角度は5通りのバリエーションがあります.各バリエーションの種類ごとにメタデータが付与されているので,これを使ってデータの性質の差によって起こる性能劣化の評価が行えるようになっています.

f:id:fltech:20220114185532p:plain
図1: DAISO-10のサンプル画像

なお、名前からもわかる通り、本データセットは株式会社大創産業様の商品を使用しています。快く商品写真の利用許諾をくださった大創産業様に感謝申し上げます。

CarsCG

CarsCGは名前の通り,CG技術を用いて作成した車の画像データセットです.DAISO-10同様に学習時と適用時のデータの性質の差によって起こる性能劣化を防ぐ技術の開発と評価を目的として作成しました.3DCG空間に10車種の車を生成し,異なる角度,背景,時間帯(朝,夕,夜)で撮影した画像45000枚で構成されたデータセットです.各車種を10のカラーリングで生成し,10通りの角度で,5つの地点(背景)に配置し,3つのカメラ位置(仰角)から,3つの時間帯で撮影することで各クラスの画像のバリエーションを作成しました.使用した10車種についてはDataset Platter(データ公開ページ)を確認してください.DAISO-10同様バリエーションごとにメタデータが付与されているので,これを使ったデータの性質の差による性能の変化を評価することができます.

f:id:fltech:20220114185120p:plain
図2: CarsCGのサンプル画像

終わりに

本記事では富士通研究所で作成した新しいデータセットついてご紹介しました.

富士通研究所では一緒に働ける方やインターンシップを随時募集しています.もし興味を持たれた方がいらっしゃいましたら,自律学習PJの小橋がカジュアル面談を行いますので,是非ご連絡ください.