ローカルNotebookLMクローン構築(Qdrant×vLLM×マルチドキュメントRAG)

🔍 抽出済み | 技術 | 優先度:🟠 高

シリーズ: AI・IT実践シリーズ


目的(ゴール)

PDF・Markdown・技術ドキュメント等の任意ファイルを大量投入し、クロスドキュメント分析・ソース引用付き回答・長文要約をクラウドAPIなしで完結させるローカルRAGシステムを構築する。GoogleのNotebookLMに近い「複数資料を同時に読み込んで横断的に答える」能力をCBFラボ環境で実現する。

アクター

  • 著者(Manabazu)
  • Node2(EVO-X1 Ubuntu)——Vector DB(Qdrant)・APIゲートウェイ・オーケストレーター
  • Node3 RX7900XTX(24GB / ROCm)——ロングコンテキスト推論エンジン(32k〜128kコンテキスト)
  • Node3 RTX5070Ti(16GB / CUDA)——リランカー(BGE-Reranker等)・高精度推論
  • Node3 RTX4060Ti + RTX3060——バックグラウンド埋め込み(Embedding)非同期処理
  • QNAP NAS——ソースドキュメント永続化・ログ保管

検証シナリオ

S1:ドキュメント埋め込みパイプライン構築

NASの指定フォルダにPDF/MDを置くとNode2 Watchdogが検知 → RTX4060Ti/3060がsentence-transformersでベクトル化 → QdrantにインデックスするE2Eフローを確立。

S2:ハイブリッド検索の実装

Qdrantのベクトル検索とBM25全文検索を組み合わせたハイブリッド検索を実装。専門用語・固有名詞への耐性を確認し、単純ベクトル検索との回答品質を比較。

S3:ロングコンテキスト横断推論

RX7900XTX(24GB)でvLLM ROCm版を起動し、コンテキスト長32k〜128kの設定で20件以上のPDFを同時参照する要約タスクを実行。NotebookLM相当の多文書横断能力を測定。

S4:リランク精度向上

RTX5070Ti上にBGE-Rerankerをデプロイし、Qdrant検索結果を第2段階でフィルタリング。リランクあり/なしでの回答精度差を定量評価。

S5:出版ワークフローへの統合

CBFラボの研究論文・技術文書・Lab Logを投入し、「リスクR260506-003に関連する技術トレンドをソース引用付きで説明せよ」のような出版執筆支援クエリを実行。

対応リスク

期待成果

  • クラウドAPIへの機密文書送信ゼロで実用的なドキュメント解析環境を実現
  • UC260506-004(Vault-GraphRAG)との統合で「Vault知識+外部文書」を横断検索できる統合RAG基盤へ発展
  • NotebookLMを超える「ローカル完結・プライバシー保護・無制限文書数」の競争優位を確立