RAG(Retrieval-Augmented Generation、検索拡張生成)とは、AIが回答を生成する前に、社内文書などの外部知識を検索して取り込み、その内容に基づいて回答する仕組みです。LLM(大規模言語モデル)単体では答えられない自社固有の情報に対して、根拠つきで答えられるようになる技術として注目されています。
RAGとは
RAGは、その名のとおり「検索(Retrieval)」で「拡張(Augmented)」した「生成(Generation)」です。通常のLLMは、学習済みの知識だけをもとに回答します。そのため、学習データにない自社のルールや最新情報を尋ねても、一般論しか返せません。
RAGでは、質問を受けると、まず関連する文書(マニュアルやナレッジベースなど)を検索します。見つかった文書を質問とあわせてLLMに渡し、その内容に基づいて回答を生成させます。つまり、AIに「カンニングペーパー」を渡してから答えてもらうイメージです。これにより、自社固有の情報にも、根拠に基づいて正確に答えられるようになります。
なぜRAGが重要なのか
RAGが重要なのは、LLMの2つの弱点を同時に補えるからです。1つは「自社固有の情報を知らない」こと、もう1つは「事実と異なる内容をもっともらしく出力する(ハルシネーション)」ことです。
RAGは、回答の前に正しい文書を検索して根拠として与えるため、自社の手順やルールに沿った回答が得られます。さらに、どの文書をもとに答えたかを示せるため、利用者が回答の正しさを検証できます。根拠が確認できることは、業務でAIを使ううえで欠かせない安心材料になります。
RAGとマニュアル・ナレッジベース
RAGの効果は、検索対象となる社内文書の充実度に大きく左右されます。マニュアルやナレッジベースが整っていれば、AIはそこから正確な根拠を引き出して答えられます。逆に、手順がベテランの頭の中にしかない状態では、検索する文書がないため、RAGも力を発揮できません。
つまり、RAGを業務で活かす出発点は、業務知識を文書として見える化し、検索できる形で蓄積しておくことです。AIに与える「正しい文脈」を用意することが、精度の高い回答への近道になります。
FlowbaseとRAG
Flowbaseは、現場の業務を画面録画するだけで、AIが手順・スクリーンショット・説明文のそろった業務マニュアルを自動生成します。これは、RAGの前提となる「検索できる正しい社内文書」を、現場の負担を抑えて整えることにあたります。
さらにFlowbaseでは、作ったマニュアルを文脈として、チャットでAIに質問できます。質問に応じてマニュアルの該当箇所を参照し、その記述に基づいて回答するため、一般論ではなく自社の手順に沿った答えが返ります。業務マニュアルの整備と、その内容に基づくAIの回答を、一つの流れでつなげられます。
よくある質問
- RAGはなぜ必要なのか?
- LLM(大規模言語モデル)は、学習データに含まれない自社固有の情報や最新情報を知りません。そのまま質問すると一般論しか答えられず、事実と異なる内容を出すこと(ハルシネーション)もあります。RAGは、回答の前に関連する社内文書を検索して与えることで、自社の正しい情報に基づいた回答を可能にします。
- RAGとファインチューニングの違いは?
- ファインチューニングは、追加データでモデル自体を再学習させて知識や振る舞いを調整する方法です。RAGは、モデルはそのままに、回答時に外部の知識を検索して与える方法です。RAGは、情報の更新が文書を差し替えるだけで済み、回答の根拠を示しやすいという利点があります。頻繁に変わる業務知識には、RAGが向くことが多いです。
- RAGのメリットは?
- 自社固有の情報に基づいて回答できる、回答の根拠となった文書を示せるため検証しやすい、知識を更新するときは元の文書を直すだけでよい、モデルの再学習が不要、といった利点があります。マニュアルやナレッジベースを整えておくほど、RAGの回答精度は高まります。
