
本記事は、TechBlog シリーズ「富士通が提案する企業向けベンチマーク:AIエージェントモデルの真価を引き出す」の第 2 回です。本シリーズは全 3 回で構成され、以下のスケジュールで公開予定です。
- 第 1 回:AIが「見ていないものを見る」とき:マルチモーダル大規模言語モデル(MLLM)の幻覚診断用ベンチマークの紹介(公開済)🔗
- 第 2 回:AAAI 2026 AABA4ET参加報告とFujitsu RAG Hard Benchmarkの紹介 (本記事)
- 第 3 回:エンタープライズデータセットにおけるコンプライアンス評価 (3 月下旬公開予定)
こんにちは。人工知能研究所の彭 思棋と福井 琢です。
2026年1月20日から27日まで、シンガポールで開催された国際会議 AAAI 2026 のワークショップ AABA4ET に参加し、ポスター発表を行いました。
本記事では、まずワークショップでの発表内容と反響を報告し、その後にポスターで発表したベンチマークを具体的に紹介します。
Read more











