ブロードリスニング実装(Pol.is型AI意見集約システムをローカル構築する)
🔍 抽出済み | 技術 | 優先度:🟠 高
シリーズ: AI・IT実践シリーズ
目的(ゴール)
Audrey TangがvTaiwanで活用したPol.is方式——多数の発言を意味的にクラスタリングし、「対立の構造」と「意外な合意点」を可視化する——をローカルLLM+Embeddingで実装する。サイレントマジョリティの立場を数値化し、少数の声の大きい意見に左右されない**ブロードリスニング(広聴)**基盤をCBFラボ環境で構築・実証する。
アクター
- 著者(Manabazu)
- Node3 RTX4060Ti——多言語Embedding(bge-m3)による意見ベクトル化
- Node3 RTX5070Ti——クラスタリング結果の言語的要約・ラベル生成LLM
- Node3 RX7900XTX——Vector DB(Qdrant)による意見インデックス管理
- 意見データソース(読者アンケート / コミュニティ投稿 / X投稿等)
- 可視化フロントエンド(Streamlit / Gradio)
技術アーキテクチャ
意見投稿(テキスト)
↓ Embedding (bge-m3 / multilingual)
ベクトル空間にマッピング
↓ クラスタリング(UMAP + HDBSCAN)
意見グループの可視化(2D散布図)
↓ LLMによるクラスタ要約
「グループAは〇〇を重視、グループBは△△を懸念」
↓ 合意マップ生成
「全グループが同意する点:□□」
検証シナリオ
S1:意見ベクトル化パイプライン
100件以上のテキスト意見をbge-m3でベクトル化 → UMAP(2D次元圧縮)→ HDBSCANでクラスタリング。クラスタの凝集度と分離度を評価。
S2:合意・対立の自動検出
クラスタ間で「賛成比率が高い発言」と「分断を生む発言」を自動識別するスコアリングを実装。Pol.isの「グループ情報スコア」に相当する指標を設計。
S3:CBFラボ読者への適用
著者の出版読者・フォロワーを対象に「AIと社会についてどう考えるか」のアンケートを実施し、実データでシステムを検証。出版コンテンツの需要把握にも活用。
S4:Plurality概念との整合性検証
UC260506-008のPluralityナレッジベースを参照しながら、vTaiwanでの実績事例と自実装の設計を比較。「ブロードリスニングの理念を忠実に実装できているか」を検証。
S5:UC優先度決定への応用
CBFラボのUCリスト(66件)について、複数の評価者(将来的には読者投票)による優先度付けをブロードリスニング方式で集約。UC260506-011(Quadratic Voting)との比較評価。
対応リスク
期待成果
- Plurality/vTaiwanの核心技術をCBFラボのローカル環境で再現
- UC260506-007(クロスリンガルRAG)の技術スタックを意見集約という新領域に応用
- 出版読者・コミュニティとのエンゲージメント手法として実用化