システム開発とシステムコンサルティングのミリオンウェーブズ menu

スタッフ日記

RAGで確実に知識データベースから情報を引き出す

 LLMに文書生成をさせる前段階で、知識データベース(重要メモ、ノウハウ、達内容などの知識文書)から情報を引き出し、プロンプト(指示書)に組み込みます。これはRAG(Retrieval-Augmented Generation)と呼ばれています。LLMのSystem1の話です。

 RAGをベクトル計算(cos類似度)のみでやろうとして、知識データベースから適切な情報が抽出できず失敗し、ベクトル計算自体を捨ててしまうケースが見受けられます。

 まずTransformerの仕組みを思い出すのが大事です。それと人間の認知の仕組みと比較します。それによりベクトル計算だけでは足りないことに気付くかと思います。その足りないものを実装します。そうすると軽量、高速、確実に知識文書を抽出することができます。

 ベクトル計算は強力で必要です。しかしそれだけでは足りず、プラスαが必要なことが当然です。LLMがどこまで進歩しても、人間に及ばない部分があります。

 前の投稿で述べた通り、Transformerでベクトル計算のみに焦点を絞ることで、リソース(GPU、メモリーなど)の無駄遣い、エネルギー不足、AIバブルが意図的に作り出されています。

 人間の認知メカニズムは効率的です。その理由を考えるわけです。

ローカルLLM
【 】

同じジャンル

  • これから増やしていきます!
  • 関連情報

    Loop Engineeringはシューティングゲームと同じ

     LLMのSystem2について、Loop Engineeringの話があります。 サラリーマンに毎日、社内ルールーに従って仕事をさせるのと同じように、AI社員(エージェント)に仕事をさ…

    AIバブル、Transformer N2乗問題

     最近のLLMでは、Transformerという仕組みが使われています。これはとてもシンプルで、高校で習う三角関数(sin、cos)で理解できるものです。 Transformerのベクトル計…

    Let’s noteでローカルLLM

     当社開発のAIシステムでは、質問するとサーバーが関連する情報を返します。それをLet's noteで受け取り、回答を生成しています。 サーバーとローカルでLLMを分散し…

    AIシステムについて、少し

     世間ではAIと言えば、生成AIになっていますが、AIの醍醐味はAIシステムにあります。 当社では約4年前、2021年頃から、AIシステムの研究開発を行っています。まだ世…