ローカルNotebookLMクローン構築（Qdrant×vLLM×マルチドキュメントRAG）

🔍 抽出済み｜技術｜優先度：🟠 高

シリーズ: AI・IT実践シリーズ

目的（ゴール）

PDF・Markdown・技術ドキュメント等の任意ファイルを大量投入し、クロスドキュメント分析・ソース引用付き回答・長文要約をクラウドAPIなしで完結させるローカルRAGシステムを構築する。GoogleのNotebookLMに近い「複数資料を同時に読み込んで横断的に答える」能力をCBFラボ環境で実現する。

アクター

著者（Manabazu）
Node2（EVO-X1 Ubuntu）——Vector DB（Qdrant）・APIゲートウェイ・オーケストレーター
Node3 RX7900XTX（24GB / ROCm）——ロングコンテキスト推論エンジン（32k〜128kコンテキスト）
Node3 RTX5070Ti（16GB / CUDA）——リランカー（BGE-Reranker等）・高精度推論
Node3 RTX4060Ti + RTX3060——バックグラウンド埋め込み（Embedding）非同期処理
QNAP NAS——ソースドキュメント永続化・ログ保管

検証シナリオ

S1：ドキュメント埋め込みパイプライン構築

NASの指定フォルダにPDF/MDを置くとNode2 Watchdogが検知 → RTX4060Ti/3060がsentence-transformersでベクトル化 → QdrantにインデックスするE2Eフローを確立。

S2：ハイブリッド検索の実装

Qdrantのベクトル検索とBM25全文検索を組み合わせたハイブリッド検索を実装。専門用語・固有名詞への耐性を確認し、単純ベクトル検索との回答品質を比較。

S3：ロングコンテキスト横断推論

RX7900XTX（24GB）でvLLM ROCm版を起動し、コンテキスト長32k〜128kの設定で20件以上のPDFを同時参照する要約タスクを実行。NotebookLM相当の多文書横断能力を測定。

S4：リランク精度向上

RTX5070Ti上にBGE-Rerankerをデプロイし、Qdrant検索結果を第2段階でフィルタリング。リランクあり/なしでの回答精度差を定量評価。

S5：出版ワークフローへの統合

CBFラボの研究論文・技術文書・Lab Logを投入し、「リスクR260506-003に関連する技術トレンドをソース引用付きで説明せよ」のような出版執筆支援クエリを実行。

対応リスク

期待成果

クラウドAPIへの機密文書送信ゼロで実用的なドキュメント解析環境を実現
UC260506-004（Vault-GraphRAG）との統合で「Vault知識＋外部文書」を横断検索できる統合RAG基盤へ発展
NotebookLMを超える「ローカル完結・プライバシー保護・無制限文書数」の競争優位を確立

シンギュラリティ志向ライフ

ローカルNotebookLMクローン構築（Qdrant×vLLM×マルチドキュメントRAG）

ローカルNotebookLMクローン構築（Qdrant×vLLM×マルチドキュメントRAG）

目的（ゴール）

アクター

検証シナリオ

S1：ドキュメント埋め込みパイプライン構築

S2：ハイブリッド検索の実装

S3：ロングコンテキスト横断推論

S4：リランク精度向上

S5：出版ワークフローへの統合

対応リスク

期待成果

目次

バックリンク