Please enable JavaScript in your browser.

fltech - 富士通研究所の技術ブログ

富士通研究所の研究員がさまざまなテーマで語る技術ブログ

Fujitsu Kozuchi 対話型生成AIの特徴と機能のご紹介

こんにちは。技術戦略本部の越智です。 Fujitsu Research Portal で公開している対話型生成AIについてご紹介します。 Fujitsu Research Portal では富士通の先進技術を様々な用途で、いち早くお試しいただく環境として無償で提供しております。 対話型生成AIは、生成AIを用いたチャット機能を提供しており、研究所技術も利用できるようになっています。

開発は今年4月から開始し、6月からお客様の検証に実際に利用いただいています。 すでに多数のお客様にご利用いただき、いただいたフィードバックを踏まえて機能追加してきました。

富士通研究所では生成AIに関する様々な研究をしています。 これらの技術をいち早く使ってもらえるような、インキュベーションベッドとしての”生成AIコンポーネント”が必要でした。 そのため、先端技術の検証やプロトタイピングを得意とする技術戦略本部が対話型生成AIを先行的に開発しました。 こちらのアプリケーションには段階的に研究所技術が搭載されていく予定であり、 対話型生成AIで利用できる幻覚検出機能は富士通研究所にて開発された技術になります。

今回は、対話型生成AIの機能について紹介し、中核の機能の1つであるドキュメント参照機能の仕組みについて詳しく解説します。

対話型生成AIの特徴

対話型生成AIには、大きく3つの特徴があります。

  • チャットインターフェース
    • 生成AIと会話できます。
  • ドキュメント参照機能
    • ドキュメントを参照している生成AIと会話できます。
    • 生成AIが回答時に参照したドキュメントの確認もできます。
  • 幻覚(ハルシネーション)検出機能
    • 生成AIの回答に含まれる、データに基づかない「もっともらしい誤り」を検出します。

チャットインターフェース

一般的なチャットサービスと同じ要領で利用できるインターフェースで操作できます。

ドキュメント参照機能

ドキュメントの内容を参照した回答を生成AIに生成させることができます。 PDF や Word ファイルなどのドキュメントをアップロードして、そのドキュメントに関する質問に答えられるようになっています。 ここでは、プレスリリースのURLを入力してドキュメントをアップロードしています。

生成AIが回答時に参照したドキュメントを確認できます。 生成AIは参照した4つのチャンク(文章のかたまり)を表示しています。

幻覚(ハルシネーション)検出機能

対話型生成AIには、幻覚検出機能も搭載されています。 この機能は研究所独自の技術を利用しており、生成AIの回答に含まれるデータに基づかない「もっともらしい誤り」を検出することができます。 回答の幻覚度合いを幻覚スコアと呼ばれる指標で算出します。幻覚スコアが100%に近いほど回答には誤りが含まれている可能性が高いため、信頼できる情報源を用いた事実確認の要否判断に利用できます。

幻覚検出機能を実行した結果、100%となっており回答に誤りが含まれる可能性が非常に高いということが分かります。

ドキュメント参照機能の仕組み

ドキュメント参照機能では、Retrieval-augmented Generation(RAG)という手法を利用しています。 RAG は外部の知識ベースから事実を検索して、検索結果を基に大規模言語モデル(LLM)に回答を生成させる手法です。 RAG の利用により、LLM 単体よりも回答の精度が増したり、社内ドキュメントなど固有の情報を利用できたりする利点があります。 LLM は、テキスト生成に特化した生成AIの一種です。

ドキュメント参照機能は、以下の3つの操作に分かれます。

  1. ドキュメントをベクトルデータベースに格納する
  2. ユーザーの質問文を基にベクトルデータベースから必要な情報を取得する
  3. ベクトルデータベースから取得した情報を基に回答を生成する

ドキュメントをベクトルデータベースに格納する

ドキュメントをベクトル化(embedding)し、ベクトルデータベースに格納します。 ドキュメントをベクトル化する際には、事前に小さな文章のかたまり(チャンク)に分割しベクトル化します。 ベクトル化は、文章を数値のベクトルに変換する処理です。 チャンクごとにベクトル化することで、必要な情報を検索しやすくなります。

ユーザーの質問文を基にベクトルデータベースから必要な情報を取得する

チャット履歴とユーザーの質問文を基に、LLM を利用して質問文を再生成します。 再生成した質問文をベクトル化し、ベクトルデータベースから類似したチャンクを取得します。

ベクトルデータベースから取得した情報を基に回答を生成する

ベクトルデータベースから取得したチャンクと、チャット履歴、ユーザーの質問文を基に、LLM を利用して回答を生成します。

今後の予定

幻覚検出機能の精度向上や、フィッシングURL検出機能の追加を予定しています。 この2つの技術のプレスリリースは以下になります。

pr.fujitsu.com

ぜひFujitsu Research Portalからアカウント登録の上、対話型生成AIをお試しください。