agent-guard
AIエージェント向けのリアルタイムプロンプトインジェクション検出・サニタイゼーション機能です。Clinejectionスタイルの攻撃、コマンドインジェクション、悪意あるプロンプト操作から保護します。OpenClawスキルとClaude MCPサーバーの両方として動作します。
description の原文を見る
Real-time prompt injection detection and sanitization for AI agents. Protects against Clinejection-style attacks, command injection, and malicious prompt manipulation. Works as both OpenClaw skill and Claude MCP server.
SKILL.md 本文
Agent Guard
AIエージェント向けのリアルタイムセキュリティフレームワーク。悪意のあるGitHub issue タイトルを通じて4,000台の開発者マシンを侵害したClinejection攻撃への対応として構築されました。
機能
AgentGuardは多層的なパターン検出を提供し、プロンプトインジェクション攻撃がAIエージェントに到達する前に検出します。
- コマンドインジェクション検出 -
npm install、curl | bash、rm -rfなどを検出 - プロンプトインジェクションブロック - 「前の指示を無視する」などの攻撃を検出
- ソーシャルエンジニアリング検出 - 緊急性に基づく操作(「緊急の修正」「信頼して」)にフラグを立てる
- GitHub issue スクリーニング - Clinejection形式の攻撃向けの特殊検出
- リアルタイム無害化 - 危険なコンテンツを
[BLOCKED_COMMAND]プレースホルダーに変換
インストール
OpenClaw スキルとして
# スキルディレクトリにコピー
cp -r agent-guard-skill ~/.openclaw/skills/agent-guard
# 依存関係をインストー
...
詳細情報
- 作者
- numbergroup
- ライセンス
- unknown
- 最終更新
- 2026/3/6
Source: https://github.com/numbergroup/AgentGuard / ライセンス: unknown
関連スキル
secure-code-guardian
認証・認可の実装、ユーザー入力の保護、OWASP Top 10の脆弱性対策が必要な場合に使用します。bcrypt/argon2によるパスワードハッシング、パラメータ化ステートメントによるSQLインジェクション対策、CORS/CSPヘッダーの設定、Zodによる入力検証、JWTトークンの構築などのカスタムセキュリティ実装に対応します。認証、認可、入力検証、暗号化、OWASP Top 10対策、セッション管理、セキュリティ強化全般で活用できます。ただし、構築済みのOAuth/SSO統合や単独のセキュリティ監査が必要な場合は、より特化したスキルの検討をお勧めします。
claude-authenticity
APIエンドポイントが本物のClaudeによって支えられているか(ラッパーやプロキシ、偽装ではないか)を、claude-verifyプロジェクトを模した9つの重み付きルールベースチェックで検証できます。また、Claudeの正体を上書きしているプロバイダーから注入されたシステムプロンプトも抽出します。完全に自己完結しており、httpx以外の追加パッケージは不要です。Claude APIキーまたはエンドポイントを検証したい場合、サードパーティのClaudeサービスが本物か確認したい場合、APIプロバイダーのClaude正当性を監査したい場合、複数モデルを並行してテストしたい場合、またはプロバイダーが注入したシステムプロンプトを特定したい場合に使用できます。
anth-security-basics
Anthropic Claude APIのセキュリティベストプラクティスを適用し、キー管理、入力値の検証、プロンプトインジェクション対策を実施します。APIキーの保護、Claudeに送信する前のユーザー入力検証、コンテンツセーフティガードレールの実装が必要な場合に活用できます。「anthropic security」「claude api key security」「secure anthropic」「prompt injection defense」といったフレーズでトリガーされます。
x-ray
x-ray.mdプレ監査レポートを生成します。概要、強化された脅威モデル(プロトコルタイプのプロファイリング、Gitの重み付け攻撃面分析、時間軸リスク分析、コンポーザビリティ依存関係マッピング)、不変条件、統合、ドキュメント品質、テスト分析、開発者・Gitの履歴をカバーしています。「x-ray」「audit readiness」「readiness report」「pre-audit report」「prep this protocol」「protocol prep」「summarize this protocol」のキーワードで実行されます。
semgrep
Semgrepスタティック分析スキャンを実行し、カスタム検出ルールを作成します。Semgrepでのコードスキャン、セキュリティ脆弱性の検出、カスタムYAMLルールの作成、または特定のバグパターンの検出が必要な場合に使用します。重要:ユーザーが「バグをスキャンしたい」「コード品質を確認したい」「脆弱性を見つけたい」「スタティック分析」「セキュリティlint」「コード監査」または「コーディング標準を適用したい」と尋ねた場合も、Semgrepという名称を明記していなくても、このスキルを使用してください。Semgrepは30以上の言語に対応したパターンベースのコードスキャンに最適なツールです。
ghost-bits-cast-attack
Java「ゴーストビッツ」/キャストアタック プレイブック(Black Hat Asia 2026)。16ビット文字が8ビットバイトに暗黙的に縮小されるJavaサービスへの攻撃時に使用します。WAF/IDSを回避して、SQLインジェクション、デシリアライゼーション型RCE、ファイルアップロード(Webシェル)、パストトラバーサル、CRLF インジェクション、リクエストスマグリング、SMTPインジェクションを実行できます。Tomcat、Spring、Jetty、Undertow、Vert.x、Jackson、Fastjson、Apache Commons BCEL、Apache HttpClient、Angus Mail、JDK HttpServer、Lettuce、Jodd、XMLWriterに影響し、WAFバイパスにより多くの「パッチ済み」CVEを再度有効化します。