geo-llmstxt
Webサイトの構造とコンテンツをAIが理解しやすくするための新興標準規格「llms.txt」ファイルを解析・生成します。既存のllms.txtファイルの検証や、サイトをクロールしてゼロから新規作成することも可能です。
description の原文を見る
Analyzes and generates llms.txt files -- the emerging standard for helping AI systems understand website structure and content. Can validate existing llms.txt files or generate new ones from scratch by crawling the site.
SKILL.md 本文
llms.txt標準分析および生成スキル
目的
このスキルは llms.txt 標準に関するあらゆることを扱います。これは新興の慣例であり、Jeremy Howard が 2024 年 9 月に提案し、2025〜2026 年を通じて採用が広がっています。ウェブサイトが AI システムに対して、そのコンテンツ、構造、および主要情報について構造化されたガイダンスを提供できるようにします。これは robots.txt(クローラーがアクセスすべきではないことを指示)に類似していますが、代わりに AI システムにサイトについて理解するのに最も有用なことを指示します。
llms.txt が重要な理由
AI言語モデルは、ウェブサイトを処理する際に根本的な課題に直面します。どのページが最も重要であるか、サイトについて何か、およびコンテンツがどのように整理されているかを判断する必要があります。通常は多くのページをクロールして構造を推論することで判断します。llms.txt はこれを解決します。これは明示的で、機械可読的(かつ人間が読める)サマリーを提供することで実現します。
よく構成された llms.txt を持つことのメリット:
- AI による高速な理解: AI システムは、数十のページをクロールするのではなく、単一のファイルからサイトの目的と構造を理解できます。
- 統制されたナレーティブ: AI システムが最初に見るページと事実を選択し、あなたのブランドをどのように表現するかを形作ります。
- より正確な引用: llms.txt に相談する AI システムは、各トピックについて正しい権威的なページを引用できます。
- 誤った表現の削減: 主要な事実(価格、機能、場所)が明示的に記述されており、AI があなたのビジネスについて幻覚を起こす可能性を低減します。
- 早期採用者の利点: 2026 年初めの時点で、5% 未満のウェブサイトが llms.txt ファイルを持っており、これは差別化要因となります。
llms.txt 仕様
ファイル位置
ファイルはドメインのルートに配置する必要があります:
https://example.com/llms.txt
フォーマット仕様
ファイルは特定の慣例を備えた Markdown フォーマットを使用します:
# [Site Name]
> [サイト/ビジネスが何をするかについての1文の説明。200 文字未満に保つ。]
## Docs
- [Page Title](https://example.com/page-url): このページがカバーする内容と重要な理由の簡潔な説明。
- [Another Page](https://example.com/another-page): コンテンツの説明。
## Optional
- [Less Critical Page](https://example.com/optional-page): 説明。
詳細なフォーマット規則
1. タイトル(必須)
# Site Name
- ファイルの最初の行である必要があります。
- 正式なビジネス/サイト名である必要があります。
- H1 見出しフォーマット(単一の
#)を使用します。
2. 説明(必須)
> サイト/ビジネスの簡潔な説明
- タイトルの直後に表示される必要があります。
- Markdown ブロッククォートフォーマット(
>)を使用します。 - 200 文字以内に保ちます。
- ビジネスが何をするか、そして誰に奉仕するかを明確に述べるべきです。
- マーケティングの余計な部分を避け、事実的かつ具体的であってください。
3. メインセクション(必須 — 最低1つ)
H2 見出し(##)を使用してページをカテゴリ別に整理します。一般的なセクション名:
| セクション名 | 目的 | サンプルコンテンツ |
|---|---|---|
## Docs | プライマリドキュメンテーションまたは主要ページ | 製品ページ、サービス説明、コアコンテンツ |
## Optional | 知っておく価値のある二次ページ | ブログ投稿、補足リソース |
## API | API ドキュメンテーション | API リファレンス、認証ガイド |
## Blog | ブログまたはニュースコンテンツ | 最近/人気の記事 |
## Products | 製品カタログ | 製品ページ、価格 |
## Services | サービス提供 | サービス説明、プロセスページ |
## About | 企業情報 | About ページ、チーム、ミッション |
## Resources | 教育的/参考コンテンツ | ガイド、チュートリアル、ホワイトペーパー |
## Legal | 法的文書 | サービス利用規約、プライバシーポリシー |
## Contact | 連絡先情報 | Contact ページ、サポートチャネル |
4. ページエントリ(必須)
各エントリは以下のフォーマットに従います:
- [Page Title](URL): ページコンテンツの説明
ページエントリのルール:
- タイトル: 実際のページタイトルまたは明確な説明的タイトルを使用します。
- URL: 完全で絶対的な URL である必要があります(相対パスではなく)。
- 説明: ページがカバーするもの説明する 10~30 語。具体的に、利用可能な情報について説明してください。
- 順序: 各セクション内で重要度の順に並べます。
- 制限: 合計で 10~30 のページエントリを含めます。最も権威的で有用なページを優先します。
5. 主要事実セクション(推奨)
## Key Facts
- [年] に [創業者] により設立
- 本社:[都市、国]
- [X] の顧客/ユーザーが [Y] カ国にいる
- 主要製品:[製品 A]、[製品 B]、[製品 C]
- 業界:[業界分類]
このセクションは、AI システムがあなたのビジネスについてのユーザークエリに回答するために頻繁に必要とするクイックリファレンスデータを提供します。
6. Contact セクション(推奨)
## Contact
- Website: https://example.com
- Email: hello@example.com
- Support: support@example.com
- Phone: +1-555-123-4567
- Address: 123 Main St, City, State, ZIP, Country
llms-full.txt(拡張版)
llms.txt に加えて、サイトは /llms-full.txt を提供できます。これはより詳細な拡張版です。
llms.txt との違い:
| フィーチャ | llms.txt | llms-full.txt |
|---|---|---|
| 長さ | 簡潔(50~150 行) | 包括的(150~500 行以上) |
| ページエントリ | 10~30 の主要ページ | 30~100 以上のページ |
| 説明 | エントリあたり 10~30 語 | エントリあたり 30~100 語、各ページの主要事実を含める可能性あり |
| 対象者 | AI による高速な理解 | AI による深い分析 |
| セクション | 3~6 セクション | 8~15 セクション |
| 主要事実 | ビジネスレベルの事実 | ページレベルの事実とデータポイント |
両ファイルは共存できます。AI システムは最初に llms.txt をチェックしてから、より深い理解のため llms-full.txt を選択的にロードする場合があります。
分析モード
既存の llms.txt ファイルをチェックするとき:
ステップ 1: ファイルの取得
- WebFetch を使用して
[domain]/llms.txtを取得します。 [domain]/llms-full.txtも確認します。- HTTP ステータスコードを記録します:
- 200: ファイルが存在します。検証に進みます。
- 404: ファイルが存在しません。生成を推奨します。
- 403: ファイルが存在しますがブロックされています。設定ミスとしてフラグを立てます。
- 301/302: リダイレクト。フォローしてリダイレクトを記録します。
ステップ 2: フォーマットの検証
各構造要素をチェックします:
| 要素 | チェック | 不足時の重大度 |
|---|---|---|
| H1 タイトル | 存在し、ビジネス名と一致 | 致命的 |
| ブロッククォート説明 | 存在、200 文字以下、事実的 | 高 |
| 少なくとも1つの H2 セクション | 存在 | 致命的 |
| URL を含むページエントリ | 少なくとも 5 エントリが存在 | 高 |
| URL が絶対的 | すべての URL が完全な https:// パスを使用 | 高 |
| URL が有効 | すべての URL が 200 ステータスを返す | 中 |
| 説明が存在 | すべてのエントリがコロンの後に説明を持つ | 中 |
| 主要事実セクション | ビジネス情報を含む | 中 |
| Contact セクション | 少なくともメールを含む | 低 |
| 合理的な長さ | 30~200 行 | 低 |
| Markdown 破損がない | ファイル全体を通じた適切なフォーマット | 中 |
ステップ 3: コンテンツ品質の評価
これらの側面で llms.txt を評価します:
完全性(0~100):
- ナビゲーションに表示されるすべてのメインサイトセクションをカバーしていますか?
- 最も重要/最高トラフィックのページが含まれていますか?
- Key Facts セクションが正確なビジネスデータを含んでいますか?
- 最近/更新されたコンテンツが含まれていますか?
正確性(0~100):
- 説明はページコンテンツを正確に反映していますか?
- URL は有効で、正しいページを指していますか?
- Key Facts は検証可能で現在的ですか?
- ビジネス説明は正確ですか?
有用性(0~100):
- AI システムはこのファイルだけでサイトの目的を理解できますか?
- 説明はページを区別するために十分具体的ですか?
- 最も引用価値のあるページが強調されていますか?
- 組織は論理的で直感的ですか?
全体的な llms.txt スコア = (完全性 * 0.40) + (正確性 * 0.35) + (有用性 * 0.25)
ステップ 4: サイトコンテンツとの比較
- サイトのメインナビゲーションとサイトマップをクロールします。
- llms.txt にリストされていない重要なページを特定します。
- リストされた URL が壊れているか、リダイレクトされているかを確認します。
- ビジネス説明が現在のホームページメッセージと一致することを確認します。
- llms.txt が書かれた後に大幅に更新されたページ(古いエントリ)にフラグを立てます。
生成モード
ゼロから新しい llms.txt ファイルを作成するとき:
ステップ 1: サイト発見
- ホームページをフェッチして以下を抽出します:
- サイト名(
<title>、<meta property="og:site_name">、または H1 から) - ビジネス説明(メタ説明またはヒーローセクションから)
- メインナビゲーションリンク
- フッターリンク
- サイト名(
/sitemap.xmlをフェッチしてすべてのパブリックページを発見します。- サイトのプライマリビジネスタイプを特定します(SaaS、E-commerce、Local、Publisher、Agency)。
ステップ 2: ページの優先順位付け
発見したすべてのページを分類し、最も重要なものを選択します:
必ず含める:
- ホームページ
- About / Company ページ
- Pricing ページ(存在する場合)
- プライマリ製品/サービスページ(上位 3~5)
- Contact ページ
- ドキュメンテーションランディングページ(存在する場合)
高品質な場合は含める:
- トップブログ投稿(明らかな重要性、新しさ、または包括性による)
- ケーススタディまたは顧客ストーリー
- 主要なリソース/ガイドページ
- FAQ ページ
- Careers ページ(大企業の場合)
スキップ:
- 薄いカテゴリ/タグページ
- ページネーションページ
- ログイン/サインアップページ
- 法的定型文(特に関連がない限り)
- 重複またはほぼ重複するコンテンツ
- ユニークなコンテンツが最小限のページ
ステップ 3: 説明を作成
選択した各ページについて:
- WebFetch を使用してページコンテンツをフェッチします。
- H1、メタ説明、および最初の 2~3 段落を読みます。
- 以下を含む説明を作成します:
- 10~30 語の長さ
- ページにある情報を述べる
- カバーされている特定のトピック、データ、または機能に言及
- マーケティング言語(「最高」、「リーディング」、「革新的」)を避ける
- 事実的で有用な言語を使用
優れた説明の例:
3つの価格設定層(Free、Pro、Enterprise)を説明し、機能比較と年間/月次コストを記載しています。2018年の企業設立、45人のチームメンバー、Austin と London のオフィス場所について詳述しています。Slack、Salesforce、HubSpot との統合設定をカバーしており、段階的なガイドと API エンドポイントを備えています。
悪い説明の例:
素晴らしい価格設定ページです!(マーケティング言語、具体性なし)当社についてさらに詳しく学ぶ。(曖昧すぎる)詳細はここをクリック。(説明的でない)
ステップ 4: 主要事実をコンパイル
サイトから主要ビジネス事実を収集します:
- 設立年
- 創業者名
- 本社所在地
- 従業員数(公開されている場合)
- 顧客/ユーザー数(公開されている場合)
- 主要製品またはサービス(上位 3~5)
- 業界分類
- 注目すべきクライアントまたはパートナーシップ(公開されている場合)
- 主要な差別化要因(このビジネスをユニークにするもの)
- 最近のマイルストーンまたは成果(過去 12 ヶ月)
ステップ 5: ファイルをアセンブル
このテンプレートに従って llms.txt を構成します:
# [Site Name]
> [明確な1文:ビジネスが何をするか、誰に奉仕するか、その主要な価値提案。200 文字以内。]
## Docs
- [Most Important Page](https://example.com/page): このページの主要なコンテンツをカバーしている説明。
- [Second Page](https://example.com/page-2): このページのコンテンツと価値の説明。
- [Third Page](https://example.com/page-3): ユーザーと AI システムがここで見つけるもの。
## Products
- [Product A](https://example.com/product-a): 製品 A のコア機能、ターゲットユーザー、価格モデル。
- [Product B](https://example.com/product-b): 製品 B が何をするか、および製品 A とどのように異なるか。
## Resources
- [Guide Title](https://example.com/guide): [トピック] をカバーする包括的ガイド。[X] セクションと実践的な例を含む。
- [Blog Post](https://example.com/blog/post): [トピック] の分析。[ソース] からのオリジナルデータを含む。
## Key Facts
- [年] に [名前] により設立
- [都市、国] に本社
- [具体的なメトリック例:「40カ国で 10,000 以上のビジネスにサービス」]
- [主要な差別化要因例:「X と Y のリアルタイム統合を提供する唯一のプラットフォーム」]
- 業界:[分類]
## Contact
- Website: https://example.com
- Email: [プライマリ連絡先メール]
- Support: [サポート URL またはメール]
ステップ 6: 生成されたファイルの検証
出力する前に:
- すべての URL に到達可能であることを確認します(200 ステータス)。
- 合計エントリ数が 10~30 の間であることを確認します。
- 説明が 50 語を超えていないことを確認します。
- ファイル全体の長さが 50~150 行であることを確認します。
- Markdown フォーマットが清潔で一貫していることを確認します。
出力フォーマット
分析モードの場合
GEO-LLMSTXT-ANALYSIS.md を生成します:
# llms.txt 分析:[ドメイン]
**分析日:** [日付]
**llms.txt ステータス:** [URL で見つかった / 見つかりません / エラー]
**llms-full.txt ステータス:** [見つかった / 見つかりません]
---
## 全体的な llms.txt スコア:[X]/100
| 側面 | スコア |
|---|---|
| 完全性 | [X]/100 |
| 正確性 | [X]/100 |
| 有用性 | [X]/100 |
---
## フォーマット検証
| 要素 | ステータス | 注釈 |
|---|---|---|
| H1 タイトル | [合格/不合格] | [注釈] |
| 説明ブロッククォート | [合格/不合格] | [注釈] |
| H2 セクション | [合格/不合格] | [X セクション見つかった] |
| ページエントリ | [合格/不合格] | [X エントリ見つかった] |
| URL の有効性 | [合格/不合格] | [X 壊れた URL] |
| エントリの説明 | [合格/不合格] | [X 説明なし] |
| Key Facts | [合格/不合格] | [注釈] |
| Contact セクション | [合格/不合格] | [注釈] |
---
## 不足しているページ
これらの重要なページがサイトで見つかりましたが、llms.txt にはありません:
1. [Page Title](URL) -- [含めるべき理由]
2. [Page Title](URL) -- [含めるべき理由]
## 改善推奨事項
1. [具体的な推奨事項]
2. [具体的な推奨事項]
3. [具体的な推奨事項]
## 提案の更新された llms.txt
[大幅な改善が必要な場合は、完全に書き直された llms.txt ファイル]
生成モードの場合
サイトのルートディレクトリに保存する準備が整った完全な llms.txt ファイルコンテンツを出力します。また、以下を説明する簡潔な GEO-LLMSTXT-GENERATION.md レポートも出力します:
- 発見されたページ数と選択されたページ数
- 優先順位付けの根拠
- 境界線上のページ(後で追加する可能性あり)
- 推奨される更新頻度(例:活発なブログの場合は月次、安定したサイトの場合は四半期ごと)
ベストプラクティスリファレンス
- 定期的に更新する。 サイトが週次でブログ投稿を公開している場合は、llms.txt を月次に更新します。製品が四半期ごとに変わる場合は、各リリースの後に更新します。
- 最も強力なコンテンツを最初に配置する。 各セクションの最初のエントリは、最も権威的で包括的なページである必要があります。
- 説明を具体的にする。 「React Server Components に関する包括的な 3,000 語ガイド、コード例付き」は「React ガイド」よりもはるかに有用です。
- 差別化要因を含める。 サイトにユニークなデータ、オリジナル研究、または排他的な機能がある場合は、説明と Key Facts で強調します。
- 簡潔に保つ。 llms.txt は 60 秒未満でスキャンできるべきです。詳細は llms-full.txt に保存します。
- 絶対 URL を使用する。 常に完全な
https://URL を含めます。相対パスは使用しません。 - デプロイ後にテストする。 アップロード後、ファイルが
https://yourdomain.com/llms.txtでアクセス可能で、リダイレクトがないことを確認します。 - robots.txt と調整する。 llms.txt にリストされたページが robots.txt で AI クローラーに対してブロックされていないことを確認します。
- サイト構造を反映する。 llms.txt のセクション名は、メインナビゲーションカテゴリに大まかに対応する必要があります。
- センシティブなページを避ける。 内部ツール、管理パネル、またはセンシティブ情報を含むページを含めないでください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- zubair-trabzada
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/zubair-trabzada/geo-seo-claude / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。