2024年後半から2025年にかけて、LLM(大規模言語モデル)の回答精度を劇的に向上させる手法として「GraphRAG」が台頭しました。その中でも、グラフデータベースの巨人・Neo4jが満を持して投入した公式ライブラリ neo4j-graphrag は、現時点で最も実用的かつ高機能なフレームワークです。
本記事では、このライブラリの概要から、核心となる Text2CypherRetriever の使いこなし方、精度を最大化する Few-shot の極意までを徹底解説します。
1. GraphRAGとは何か?:従来のRAGとの決定的な違い
従来のベクトル検索によるRAGは、テキストの「断片(チャンク)」を類似度で探すため、点と点の情報は得意ですが、「点と点を結ぶ線」の情報に弱いという課題がありました。
特徴 普通のRAG (Vector RAG) GraphRAG (Neo4j-based)
データ保持 テキストをベクトル化して格納 エンティティ(実体)と関係を抽出し「グラフ」化
検索手法 意味の近さ(コサイン類似度など) ベクトル検索 + グラフ探索(トラバーサル)
得意な質問 単一の事実の抽出(例:〜の定価は?) 多段推論、関係性、集計(例:A氏の部下のB氏が関わるプロジェクトは?)
情報の連続性 チャンクごとに分断されやすい 知識が網目状につながっており、文脈が深い
2. neo4j-graphrag の主要機能と実用度
neo4j-graphrag は、単なる検索ライブラリではなく、データの取り込み(KG構築)から回答生成までをカバーするエンドツーエンドのパッケージです。
主要機能マトリクス(2025-2026年最新)
機能カテゴリ 具体的なコンポーネント 実用度 特徴
KG構築 SimpleKGPipeline ★★★★★ PDF/テキストからLLM経由で自動でグラフ構造を生成。
検索(Retriever) VectorRetriever, Text2CypherRetriever ★★★★★ 用途に応じた多彩な検索戦略を選択可能。
生成(Generation) GraphRAG クラス ★★★★★ RetrieverとLLMを統合し、1行でQ&Aを実行。
エコシステム連携 LangChain, LlamaIndex 互換 ★★★★☆ 既存のAIエージェントフレームワークに組み込みやすい。
