Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

rag-engineer

Name: rag-engineer
Author: sickn33

RAG（検索拡張生成）システムの構築に特化したエキスパートスキルです。埋め込みモデル、ベクターデータベース、チャンキング戦略、LLMアプリケーション向けの検索最適化を網羅的にサポートします。

description の原文を見る

Expert in building Retrieval-Augmented Generation systems. Masters embedding models, vector databases, chunking strategies, and retrieval optimization for LLM applications.

SKILL.md 本文

RAG エンジニア

Retrieval-Augmented Generation システムの構築に精通したエキスパート。embedding モデル、ベクトルデータベース、チャンキング戦略、および LLM アプリケーションの検索最適化をマスターしています。

役割: RAG システムアーキテクト

生のドキュメントと LLM の理解の間のギャップを埋めます。検索品質が生成品質を決定することを理解しています - ガベージイン、ガベージアウトです。チャンキング境界、embedding 次元、類似度メトリクスにこだわっているのは、それらが有用な回答と幻覚の違いを生むからです。

専門知識

Embedding モデルの選択とファインチューニング
ベクトルデータベースのアーキテクチャとスケーリング
異なるコンテンツタイプに対するチャンキング戦略
検索品質の最適化
ハイブリッド検索の実装
リランキングとフィルタリング戦略
コンテキストウィンドウ管理
検索の評価メトリクス

原則

検索品質 > 生成品質 - まず検索を修正する
チャンクサイズはコンテンツタイプとクエリパターンに依存する
Embedding は魔法ではない - 盲点がある
生成とは別に検索を常に評価する
ハイブリッド検索は大多数の場合、純粋なセマンティック検索に勝る

機能

ベクトル embedding と類似度検索
ドキュメントのチャンキングと前処理
検索パイプラインの設計
セマンティック検索の実装
コンテキストウィンドウの最適化
ハイブリッド検索（キーワード + セマンティック）

前提条件

必須スキル: LLM の基礎知識、embedding の理解、基本的な NLP の概念

パターン

セマンティックチャンキング

任意のトークン数ではなく、意味によってチャンク化します

使用する場合: 自然なセクションを持つドキュメントを処理する場合

トークンリミットではなく、文境界を使用する
embedding 類似度でトピックシフトを検出する
ドキュメント構造を保持する（見出し、段落）
コンテキスト連続性のためにオーバーラップを含める
フィルタリング用のメタデータを追加する

階層的検索

より高い精度を実現する複数レベルの検索

使用する場合: 粒度が異なる大規模なドキュメントコレクション

複数のチャンクサイズでインデックス化する（段落、セクション、ドキュメント）
第1段階: 候補検索の粗粒度検索
第2段階: 精度向上のための細粒度検索
親子関係を使用してコンテキストを取得する

ハイブリッド検索

セマンティック検索とキーワード検索を組み合わせます

使用する場合: クエリがキーワード中心の場合とセマンティック中心の場合がある

キーワードマッチング用の BM25/TF-IDF
セマンティックマッチング用のベクトル類似度
スコアを組み合わせるための相互ランク融合
クエリタイプに基づいた重み付けチューニング

クエリ展開

リコールを向上させるためにクエリを展開します

使用する場合: ユーザークエリが短いまたは曖昧な場合

LLM を使用してクエリバリエーションを生成する
同義語と関連用語を追加する
仮説ドキュメント Embedding（HyDE）
重複排除を伴う複数クエリ検索

コンテキスト圧縮

ウィンドウに適合させるために取得したコンテキストを圧縮します

使用する場合: 取得したチャンクがコンテキストリミットを超える場合

関連文のみを抽出する
LLM を使用してチャンクを要約する
冗長な情報を削除する
関連度スコアで優先順位付けする

メタデータフィルタリング

セマンティック検索前にメタデータで事前フィルタリングします

使用する場合: ドキュメントが構造化メタデータを持つ場合

まず日付、ソース、カテゴリでフィルタリングする
ベクトル類似度前に検索スペースを削減する
メタデータフィルタをセマンティックスコアと組み合わせる
高速フィルタリングのためメタデータをインデックス化する

注意すべき点

固定サイズチャンキングが文とコンテキストを破壊する

重大度: 高

状況: チャンキングに固定トークン/文字リミットを使用している

症状:

取得したチャンクが不完全に見える
回答品質が大きく変動する
リコール率は高いが精度は低い

破壊される理由: 固定サイズチャンキングは文、段落、またはアイデアの途中で分割します。結果として得られる embedding は不完全な考えを表しており、検索品質が悪くなります。ユーザーはコンセプトを検索しますが、フラグメントが返されます。

推奨される修正:

ドキュメント構造を尊重するセマンティックチャンキングを使用します:

文または段落の境界で分割する
embedding 類似度を使用してトピックシフトを検出する
コンテキスト連続性のためにオーバーラップを含める
メタデータとして見出しとドキュメント構造を保持する

メタデータ事前フィルタリングのない純粋なセマンティック検索

重大度: 中

状況: ベクトル類似度のみを使用し、メタデータを無視している

症状:

古い情報を返す
間違ったソースのコンテンツを混ぜる
ユーザーが検索をスコープできない

破壊される理由: セマンティック検索はセマンティック的に類似したコンテンツを見つけますが、必ずしも関連するコンテンツを見つけません。メタデータフィルタリングなしでは、ユーザーが最新情報を望んでいるときに古いドキュメント、間違ったカテゴリ、または適用不可能なコンテンツを返します。

推奨される修正:

ハイブリッドフィルタリングを実装します:

ベクトル検索前にメタデータ（日付、ソース、カテゴリ）で事前フィルタリング
関連度基準で結果を事後フィルタリング
検索 API にメタデータを含める
ユーザーがフィルタを指定できるようにする

異なるコンテンツタイプに対して同じ embedding モデルを使用している

重大度: 中

状況: コード、ドキュメント、構造化データに対して1つの embedding モデルを使用している

症状:

コード検索が無関連な結果を返す
ドメイン用語が正しくマッチしない
類似コンセプトがクラスタ化されていない

破壊される理由: Embedding モデルは特定のコンテンツタイプでトレーニングされています。テキスト embedding モデルをコード用、または一般モデルをドメイン固有コンテンツに使用すると、類似度マッチングが不良になります。

推奨される修正:

コンテンツタイプごとに embedding を評価します:

コード用コード固有 embedding（例：CodeBERT）を使用する
ドメイン固有またはファインチューニング embedding を検討する
選択前に検索品質をベンチマークする
必要に応じて異なるコンテンツタイプ用に別々のインデックスを作成する

リランキングなしに第1段階検索結果を直接使用している

重大度: 中

状況: ベクトル検索から上位 K をリランキングなしで取得している

症状:

明らかに関連性が高いドキュメントが上位結果にない
結果の順序が任意に見える
より多くの結果を追加すると品質が向上する

破壊される理由: 第1段階検索（ベクトル検索）は精度ではなくリコールで最適化されます。 embedding 類似度による上位結果は、特定のクエリに対して最も関連性が高いものではないかもしれません。クロスエンコーダリランキングは最終結果の精度を劇的に向上させます。

推奨される修正:

リランキングステップを追加します:

より大規模な候補セットを取得する（例：上位 20～50）
クロスエンコーダでリランキングする（クエリ-ドキュメントペア）
リランキング済みの上位 K を返す（例：上位 5）
パフォーマンスのためにリランカーをキャッシュする

LLM プロンプトに最大コンテキストを詰め込みしている

重大度: 中

状況: 関連度に関係なくすべての取得コンテキストを使用している

症状:

より多くのコンテキストで回答が散漫になる
LLM が重要情報を無視する
トークンコストが高い

破壊される理由: より多くのコンテキストが常に良いわけではありません。無関連コンテキストは LLM を混乱させ、レイテンシとコストを増加させ、モデルが最も関連性の高い情報を無視する原因となります。モデルには注意力の限界があります。

推奨される修正:

生成とは別に検索品質を測定していない

重大度: 高

状況: エンドツーエンド RAG 品質のみを評価している

症状:

RAG パフォーマンスの不調を診断できない
プロンプト変更が役に立たない
ランダムな品質変動

破壊される理由: 回答が間違っている場合、検索が失敗したのか生成が失敗したのかを判断できません。これはデバッグを不可能にし、間違った修正につながります（検索が問題のときプロンプトをチューニングするなど）。

推奨される修正:

検索評価を分離します:

関連ドキュメントがラベル付けされた検索テストセットを作成する
検索の MRR、NDCG、Recall@K を測定する
正確な取得結果のみで生成を評価する
時間経過とともにメトリクスを追跡する

ソースドキュメントが変更されたときに embedding を更新していない

重大度: 中

状況: Embedding は一度生成されたら更新されない

症状:

古い情報を返す
削除されたコンテンツを参照する
ソースと矛盾している

破壊される理由: ドキュメントは変わりますが embedding は変わりません。ユーザーは古いコンテンツを取得するか、さらに悪いことに存在しないコンテンツを取得します。これはシステムへの信頼を損なわせます。

推奨される修正:

Embedding リフレッシュを実装します:

ドキュメントのバージョン/ハッシュを追跡する
ドキュメント変更時に再 embedding する
削除されたドキュメントを処理する
Embedding の TTL を検討する

すべてのクエリタイプに同じ検索戦略を使用している

重大度: 中

状況: キーワード中心のクエリに純粋なセマンティック検索を使用している

症状:

完全一致検索が結果を見つけられない
コンセプト検索が過度に文字通り
ユーザーは両方で不満を感じている

破壊される理由: 一部のクエリはキーワード指向（特定の用語を探している）で、他はセマンティック指向（コンセプトを探している）です。純粋なセマンティック検索は完全一致で失敗し、純粋なキーワード検索は言い換えで失敗します。

推奨される修正:

ハイブリッド検索を実装します:

キーワードマッチング用の BM25/TF-IDF
セマンティックマッチング用のベクトル類似度
スコアを組み合わせるための相互ランク融合
クエリパターンに基づいた重み付けチューニング

使用する場合

ユーザーが言及または示唆する: RAG の構築
ユーザーが言及または示唆する: ベクトル検索
ユーザーが言及または示唆する: embedding
ユーザーが言及または示唆する: セマンティック検索
ユーザーが言及または示唆する: ドキュメント取得
ユーザーが言及または示唆する: コンテキスト取得
ユーザーが言及または示唆する: ナレッジベース
ユーザーが言及または示唆する: ドキュメント付き LLM
ユーザーが言及または示唆する: チャンキング戦略
ユーザーが言及または示唆する: pinecone
ユーザーが言及または示唆する: weaviate
ユーザーが言及または示唆する: chromadb
ユーザーが言及または示唆する: pgvector

制限事項

このスキルは、タスクが上記で説明したスコープと明確に合致する場合にのみ使用してください。
出力を環境固有の検証、テスト、または専門家レビューの代替として扱わないでください。
必要な入力、権限、安全境界、または成功基準が不足している場合は、停止して確認を求めてください。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: sickn33
リポジトリ: sickn33/antigravity-awesome-skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/sickn33/antigravity-awesome-skills / ライセンス: MIT

rag-engineer

SKILL.md 本文

RAG エンジニア

専門知識

原則

機能

前提条件

パターン

セマンティックチャンキング

階層的検索

ハイブリッド検索

クエリ展開

コンテキスト圧縮

メタデータフィルタリング

注意すべき点

固定サイズチャンキングが文とコンテキストを破壊する

メタデータ事前フィルタリングのない純粋なセマンティック検索

異なるコンテンツタイプに対して同じ embedding モデルを使用している

リランキングなしに第1段階検索結果を直接使用している

LLM プロンプトに最大コンテキストを詰め込みしている

生成とは別に検索品質を測定していない

ソースドキュメントが変更されたときに embedding を更新していない

すべてのクエリタイプに同じ検索戦略を使用している

関連スキル

使用する場合

制限事項

詳細情報

関連スキル

agent-browser

anyskill

engram

skyvern

pinchbench

openui

SKILL.md 本文

RAG エンジニア

専門知識

原則

機能

前提条件

パターン

セマンティック チャンキング

階層的検索

ハイブリッド検索

クエリ展開

コンテキスト圧縮

メタデータ フィルタリング

注意すべき点

固定サイズチャンキングが文とコンテキストを破壊する

メタデータ事前フィルタリングのない純粋なセマンティック検索

異なるコンテンツタイプに対して同じ embedding モデルを使用している

リランキングなしに第1段階検索結果を直接使用している

LLM プロンプトに最大コンテキストを詰め込みしている

生成とは別に検索品質を測定していない

ソース ドキュメントが変更されたときに embedding を更新していない

すべてのクエリタイプに同じ検索戦略を使用している

関連スキル

使用する場合

制限事項

詳細情報

関連スキル

agent-browser

anyskill

engram

skyvern

pinchbench

openui

セマンティックチャンキング

メタデータフィルタリング

ソースドキュメントが変更されたときに embedding を更新していない