seo-robots-ai
robots.txtファイルを監査して、AI クローラーのアクセスポリシーを確認できます。GPTBot、ClaudeBot、PerplexityBot、Google-Extended、その他のAIクローラーに対する設定をチェックします。ユーザーが「robots AI」「AIクローラー」「AIブロック」「AI ボット許可」「AIクロール ポリシー」などと指示した際にご利用ください。
description の原文を見る
Audit robots.txt for AI crawler access policies. Checks GPTBot, ClaudeBot, PerplexityBot, Google-Extended, and other AI crawlers. Use when user says "robots AI", "AI crawlers", "block AI", "allow AI bots", "AI crawl policy".
SKILL.md 本文
AI クローラー Robots.txt 監査
サイトの robots.txt を AI クローラーのアクセスポリシーに特化して分析します。
/seo-technical(robots.txt の広範なチェック)を補完する形で、AI 固有の詳細な分析を実施します。
@skills/seo/references/ai-crawlers-guide.md
AI クローラー レジストリ
| ボット名 | 所有者 | 目的 |
|---|---|---|
| GPTBot | OpenAI | トレーニングデータ + ChatGPT ウェブ検索 |
| OAI-SearchBot | OpenAI | ChatGPT 検索のみ(トレーニング対象外) |
| ChatGPT-User | OpenAI | ChatGPT ブラウジング(リアルタイム) |
| ClaudeBot | Anthropic | トレーニングデータ収集 |
| anthropic-ai | Anthropic | Anthropic ウェブクローラー |
| PerplexityBot | Perplexity | AI 検索エンジン |
| Google-Extended | Gemini / AI トレーニング(Search 対象外) | |
| Bytespider | ByteDance | TikTok / AI トレーニング |
| CCBot | Common Crawl | 多くの AI モデルで使用されるオープンデータセット |
| Applebot-Extended | Apple | Apple Intelligence トレーニング |
| cohere-ai | Cohere | AI モデルトレーニング |
| FacebookBot | Meta | Meta AI トレーニング |
| Meta-ExternalAgent | Meta | Meta AI ブラウジングエージェント |
| Amazonbot | Amazon | Alexa / AI トレーニング |
| Diffbot | Diffbot | AI ナレッジグラフ |
| ImagesiftBot | ImagesiftBot | AI 画像トレーニング |
| Omgili | Webz.io | AI データフィード |
入力
url: 監査するウェブサイトの URL(サイトルートから/robots.txtを取得)- ドメインルートに正規化:
example.com/page→https://example.com/robots.txt
- ドメインルートに正規化:
実行手順
-
robots.txt の取得: WebFetch
<domain>/robots.txt- 404 の場合 → 「robots.txt が見つかりません。デフォルトではすべてのクローラーが許可されています」と報告
- 200 の場合 → 解析に進む
-
User-agent ブロックの解析: すべての
User-agentディレクティブおよび関連するAllow/Disallowルールを抽出 -
各 AI クローラーの確認: レジストリ内の各ボットについて、アクセス状況を判定
- 許可 — 特定ブロックがない、または明示的な
Allow: /がある - ブロック — このユーザーエージェントに対する
Disallow: /がある - 部分的 — 一部パスがブロック、他は許可(詳細を記載)
- 継承 —
User-agent: *ルールの下にある(注記する)
- 許可 — 特定ブロックがない、または明示的な
-
ワイルドカード ルールの確認:
User-agent: *にDisallow: /がある場合、明示的に許可されていない限りすべてのボット(AI 含む)がブロックされることを注記 -
ai.txt の確認: WebFetch
<domain>/ai.txt— AI クローラーポリシー用の新興標準です。発見された場合は報告し、内容をまとめる -
llms.txt の確認: WebFetch
<domain>/llms.txt— 発見された場合は報告(/seo llms-txtによる完全監査とクロスリファレンス) -
クロール遅延の分析: AI ボット固有、またはワイルドカード経由で影響する
Crawl-delayディレクティブを記載 -
サイトマップ宣言の確認:
Sitemap:ディレクティブが存在するかどうかを記載(AI クローラーがコンテンツ発見を支援)
出力形式
## AI クローラー監査: [domain]
### クローラー アクセス マトリックス
| クローラー | 所有者 | ステータス | ルール出典 | 詳細 |
|---|---|---|---|---|
| GPTBot | OpenAI | 許可/ブロック/部分的 | 行 [#] | [特定ルール] |
| ClaudeBot | Anthropic | 許可/ブロック/部分的 | 行 [#] | [特定ルール] |
| PerplexityBot | Perplexity | 許可/ブロック/部分的 | 行 [#] | [特定ルール] |
| Google-Extended | Google | 許可/ブロック/部分的 | 行 [#] | [特定ルール] |
| ... | ... | ... | ... | ... |
### AI オープン度スコア: X/10
スコアリング:
- 10/10 = すべての AI クローラーが許可、ai.txt 存在、llms.txt 存在
- 7-9 = ほとんどのクローラーが許可、軽微なギャップあり
- 4-6 = 混在ポリシー — 一部許可、一部ブロック
- 1-3 = ほとんどの AI クローラーがブロック
- 0/10 = すべての AI クローラーがブロック(または包括的な Disallow: /)
### 主な発見
- **AI クローラー明示的ブロック**: [合計]中[数]
- **AI クローラー明示的許可**: [数]
- **ワイルドカードルール対象**: [数]
- **ai.txt 存在**: はい/いいえ
- **llms.txt 存在**: はい/いいえ
- **サイトマップ宣言**: はい/いいえ
### 推奨事項
サイトの目的に基づいた推奨:
**目的が最大限の AI 可視性の場合:**
- [AI クローラーを許可するための具体的な推奨]
- [必要に応じて llms.txt 作成を提案]
**目的が AI 保護の場合:**
- [まだブロックされていないクローラーを記載]
- [ai.txt の採用を提案]
**目的が選別アクセスの場合:**
- [検索フォーカス型ボットの許可を推奨: OAI-SearchBot、PerplexityBot]
- [トレーニング専用ボットのブロックを推奨: CCBot、Bytespider]
- [トレーニング型と検索型クローラーを区別]
### 業界の文脈
サイトのポリシーがどのように共通パターンと比較されるかを記載:
- 大手出版社の大多数はトレーニングボットはブロックするが検索ボットは許可
- ほとんどの SaaS 企業は可視性向上のためすべての AI クローラーを許可
- eコマースサイトは通常すべてのクローラーを許可
- メディア/ニュースサイトはトレーニング専用ボットのブロックを増加させている
### robots.txt スニペット
ユーザーが変更を実装したい場合、選択した戦略に対応する robots.txt ブロックを提供:
**すべての AI クローラーを許可:**
AI クローラー — 許可
User-agent: GPTBot Allow: /
User-agent: ClaudeBot Allow: /
User-agent: PerplexityBot Allow: /
User-agent: Google-Extended Allow: /
**トレーニングはブロック、検索は許可:**
AI 検索 — 許可
User-agent: OAI-SearchBot Allow: /
User-agent: PerplexityBot Allow: /
AI トレーニング — ブロック
User-agent: GPTBot Disallow: /
User-agent: ClaudeBot Disallow: /
User-agent: CCBot Disallow: /
User-agent: Google-Extended Disallow: /
User-agent: Bytespider Disallow: /
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- YogeshKu7877
- ライセンス
- MIT
- 最終更新
- 2026/5/12
Source: https://github.com/YogeshKu7877/claude-seo-skills / ライセンス: MIT
関連スキル
secure-code-guardian
認証・認可の実装、ユーザー入力の保護、OWASP Top 10の脆弱性対策が必要な場合に使用します。bcrypt/argon2によるパスワードハッシング、パラメータ化ステートメントによるSQLインジェクション対策、CORS/CSPヘッダーの設定、Zodによる入力検証、JWTトークンの構築などのカスタムセキュリティ実装に対応します。認証、認可、入力検証、暗号化、OWASP Top 10対策、セッション管理、セキュリティ強化全般で活用できます。ただし、構築済みのOAuth/SSO統合や単独のセキュリティ監査が必要な場合は、より特化したスキルの検討をお勧めします。
claude-authenticity
APIエンドポイントが本物のClaudeによって支えられているか(ラッパーやプロキシ、偽装ではないか)を、claude-verifyプロジェクトを模した9つの重み付きルールベースチェックで検証できます。また、Claudeの正体を上書きしているプロバイダーから注入されたシステムプロンプトも抽出します。完全に自己完結しており、httpx以外の追加パッケージは不要です。Claude APIキーまたはエンドポイントを検証したい場合、サードパーティのClaudeサービスが本物か確認したい場合、APIプロバイダーのClaude正当性を監査したい場合、複数モデルを並行してテストしたい場合、またはプロバイダーが注入したシステムプロンプトを特定したい場合に使用できます。
anth-security-basics
Anthropic Claude APIのセキュリティベストプラクティスを適用し、キー管理、入力値の検証、プロンプトインジェクション対策を実施します。APIキーの保護、Claudeに送信する前のユーザー入力検証、コンテンツセーフティガードレールの実装が必要な場合に活用できます。「anthropic security」「claude api key security」「secure anthropic」「prompt injection defense」といったフレーズでトリガーされます。
x-ray
x-ray.mdプレ監査レポートを生成します。概要、強化された脅威モデル(プロトコルタイプのプロファイリング、Gitの重み付け攻撃面分析、時間軸リスク分析、コンポーザビリティ依存関係マッピング)、不変条件、統合、ドキュメント品質、テスト分析、開発者・Gitの履歴をカバーしています。「x-ray」「audit readiness」「readiness report」「pre-audit report」「prep this protocol」「protocol prep」「summarize this protocol」のキーワードで実行されます。
semgrep
Semgrepスタティック分析スキャンを実行し、カスタム検出ルールを作成します。Semgrepでのコードスキャン、セキュリティ脆弱性の検出、カスタムYAMLルールの作成、または特定のバグパターンの検出が必要な場合に使用します。重要:ユーザーが「バグをスキャンしたい」「コード品質を確認したい」「脆弱性を見つけたい」「スタティック分析」「セキュリティlint」「コード監査」または「コーディング標準を適用したい」と尋ねた場合も、Semgrepという名称を明記していなくても、このスキルを使用してください。Semgrepは30以上の言語に対応したパターンベースのコードスキャンに最適なツールです。
ghost-bits-cast-attack
Java「ゴーストビッツ」/キャストアタック プレイブック(Black Hat Asia 2026)。16ビット文字が8ビットバイトに暗黙的に縮小されるJavaサービスへの攻撃時に使用します。WAF/IDSを回避して、SQLインジェクション、デシリアライゼーション型RCE、ファイルアップロード(Webシェル)、パストトラバーサル、CRLF インジェクション、リクエストスマグリング、SMTPインジェクションを実行できます。Tomcat、Spring、Jetty、Undertow、Vert.x、Jackson、Fastjson、Apache Commons BCEL、Apache HttpClient、Angus Mail、JDK HttpServer、Lettuce、Jodd、XMLWriterに影響し、WAFバイパスにより多くの「パッチ済み」CVEを再度有効化します。