一般的な RAG のしくみと限界
RAG(Retrieval-Augmented Generation)は、文書をベクトル化して保存し、ユーザーの質問に類似した文書を検索して AI に渡す手法です。文書をそのまま投入できる手軽さから、現在の社内 AI 導入の主流になっています。
ただし、検索の精度は質問と文書の類似度にしか依存しません。同じ意味でも言い回しが違えばヒットせず、複数の情報をつなぎ合わせる質問には弱い。チャンク分割の境目で文脈が壊れることもあります。
RAG は、大量・非構造の文書群から、それらしい回答を引き出すのが得意な手法です。一方で、類似度ベースの検索という性質上、精度は 6 割前後で頭打ちしやすい。これが現場で「結局使えない」と評価される構造的な原因です。