AI活用が「検証」から「本番運用」へと移行する中、Google CloudのVertex AI Searchは、RAG(Retrieval-Augmented Generation)構築のデファクトスタンダードになりつつあります。本記事では、Vertex AI Searchが提供するRAGの仕組み、現場で直面する限界、そして評価フレームワーク「Ragas」を用いた品質改善手法までを徹底解説します。
1. Vertex AI SearchにおけるRAGの標準技法
Vertex AI Searchは、複雑なRAGパイプラインを「マネージドサービス」としてパッケージ化しています。従来、個別実装が必要だったプロセスを以下の6つのステップで自動化・最適化します。
RAGエンジンの6ステップ・プロセス
ステップ 名称 概要とVertex AIの強み
1 データ摂取 GCS, Google Drive, Salesforce, Confluence等の多様なコネクタ。Document AIによる高精度なOCR解析。
2 データ変換 文脈を維持したチャンク分割。メタデータ(タグ、著者等)の自動付与による検索性の向上。
3 エンベディング テキストをベクトル化。マルチモーダル(画像+テキスト)エンベディングにも対応。
4 インデックス Vertex AI Vector Searchによる高速検索。キーワード+ベクトルのハイブリッド検索をサポート。
5 検索 (Retrieval) セマンティック検索に加え、Ranking APIによる再ランク付け。価格やカテゴリによるフィルタリング。
6 生成 (Generation) Geminiによる回答生成。Grounding APIでGoogle検索や企業内データを参照し、幻覚を抑制。
