汎用セキュリティ⭐ リポ 100品質スコア 75/100

agent-guard

Name: agent-guard
Author: numbergroup

AIエージェント向けのリアルタイムプロンプトインジェクション検出・サニタイゼーション機能です。Clinejectionスタイルの攻撃、コマンドインジェクション、悪意あるプロンプト操作から保護します。OpenClawスキルとClaude MCPサーバーの両方として動作します。

description の原文を見る

Real-time prompt injection detection and sanitization for AI agents. Protects against Clinejection-style attacks, command injection, and malicious prompt manipulation. Works as both OpenClaw skill and Claude MCP server.

SKILL.md 本文

注意: このスキルのライセンスは unknown です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。

Agent Guard

AIエージェント向けのリアルタイムセキュリティフレームワーク。悪意のあるGitHub issue タイトルを通じて4,000台の開発者マシンを侵害したClinejection攻撃への対応として構築されました。

機能

AgentGuardは多層的なパターン検出を提供し、プロンプトインジェクション攻撃がAIエージェントに到達する前に検出します。

コマンドインジェクション検出 - npm install、curl | bash、rm -rfなどを検出
プロンプトインジェクションブロック - 「前の指示を無視する」などの攻撃を検出
ソーシャルエンジニアリング検出 - 緊急性に基づく操作（「緊急の修正」「信頼して」）にフラグを立てる
GitHub issue スクリーニング - Clinejection形式の攻撃向けの特殊検出
リアルタイム無害化 - 危険なコンテンツを [BLOCKED_COMMAND] プレースホルダーに変換

インストール

OpenClaw スキルとして

# スキルディレクトリにコピー
cp -r agent-guard-skill ~/.openclaw/skills/agent-guard

# 依存関係をインストー

...

全文を GitHub の原本で見る →リポジトリ

詳細情報

作者: numbergroup
リポジトリ: numbergroup/AgentGuard
ライセンス: unknown
最終更新: 2026/3/6

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/numbergroup/AgentGuard / ライセンス: unknown

関連スキル

Anthropic Claudeセキュリティ⭐ リポ 8,981

secure-code-guardian

認証・認可の実装、ユーザー入力の保護、OWASP Top 10の脆弱性対策が必要な場合に使用します。bcrypt/argon2によるパスワードハッシング、パラメータ化ステートメントによるSQLインジェクション対策、CORS/CSPヘッダーの設定、Zodによる入力検証、JWTトークンの構築などのカスタムセキュリティ実装に対応します。認証、認可、入力検証、暗号化、OWASP Top 10対策、セッション管理、セキュリティ強化全般で活用できます。ただし、構築済みのOAuth/SSO統合や単独のセキュリティ監査が必要な場合は、より特化したスキルの検討をお勧めします。

by Jeffallan

汎用セキュリティ⭐ リポ 1,982

claude-authenticity

APIエンドポイントが本物のClaudeによって支えられているか（ラッパーやプロキシ、偽装ではないか）を、claude-verifyプロジェクトを模した9つの重み付きルールベースチェックで検証できます。また、Claudeの正体を上書きしているプロバイダーから注入されたシステムプロンプトも抽出します。完全に自己完結しており、httpx以外の追加パッケージは不要です。Claude APIキーまたはエンドポイントを検証したい場合、サードパーティのClaudeサービスが本物か確認したい場合、APIプロバイダーのClaude正当性を監査したい場合、複数モデルを並行してテストしたい場合、またはプロバイダーが注入したシステムプロンプトを特定したい場合に使用できます。

by LeoYeAI

Anthropic Claudeセキュリティ⭐ リポ 2,159

anth-security-basics

Anthropic Claude APIのセキュリティベストプラクティスを適用し、キー管理、入力値の検証、プロンプトインジェクション対策を実施します。APIキーの保護、Claudeに送信する前のユーザー入力検証、コンテンツセーフティガードレールの実装が必要な場合に活用できます。「anthropic security」「claude api key security」「secure anthropic」「prompt injection defense」といったフレーズでトリガーされます。

by jeremylongshore

汎用セキュリティ⭐ リポ 699

x-ray

x-ray.mdプレ監査レポートを生成します。概要、強化された脅威モデル（プロトコルタイプのプロファイリング、Gitの重み付け攻撃面分析、時間軸リスク分析、コンポーザビリティ依存関係マッピング）、不変条件、統合、ドキュメント品質、テスト分析、開発者・Gitの履歴をカバーしています。「x-ray」「audit readiness」「readiness report」「pre-audit report」「prep this protocol」「protocol prep」「summarize this protocol」のキーワードで実行されます。

by pashov

汎用セキュリティ⭐ リポ 677

semgrep

Semgrepスタティック分析スキャンを実行し、カスタム検出ルールを作成します。Semgrepでのコードスキャン、セキュリティ脆弱性の検出、カスタムYAMLルールの作成、または特定のバグパターンの検出が必要な場合に使用します。重要：ユーザーが「バグをスキャンしたい」「コード品質を確認したい」「脆弱性を見つけたい」「スタティック分析」「セキュリティlint」「コード監査」または「コーディング標準を適用したい」と尋ねた場合も、Semgrepという名称を明記していなくても、このスキルを使用してください。Semgrepは30以上の言語に対応したパターンベースのコードスキャンに最適なツールです。

by wimpysworld

汎用セキュリティ⭐ リポ 591

ghost-bits-cast-attack

Java「ゴーストビッツ」/キャストアタックプレイブック（Black Hat Asia 2026）。16ビット文字が8ビットバイトに暗黙的に縮小されるJavaサービスへの攻撃時に使用します。WAF/IDSを回避して、SQLインジェクション、デシリアライゼーション型RCE、ファイルアップロード（Webシェル）、パストトラバーサル、CRLF インジェクション、リクエストスマグリング、SMTPインジェクションを実行できます。Tomcat、Spring、Jetty、Undertow、Vert.x、Jackson、Fastjson、Apache Commons BCEL、Apache HttpClient、Angus Mail、JDK HttpServer、Lettuce、Jodd、XMLWriterに影響し、WAFバイパスにより多くの「パッチ済み」CVEを再度有効化します。

by yaklang