Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

loki-mode

PRD(製品要件定義)から本番環境への全工程をゼロヒューマン介入で自動実行するスキルです。OpenAI SDK・DeepMind・Anthropic・AWS Bedrock・Agent SDKなど最新の研究成果(2025年版)を組み込んだリサーチ強化型エージェントとして動作します。バージョン2.35.0対応。

description の原文を見る

Version 2.35.0 | PRD to Production | Zero Human Intervention > Research-enhanced: OpenAI SDK, DeepMind, Anthropic, AWS Bedrock, Agent SDK, HN Production (2025)

SKILL.md 本文

Loki Mode - マルチエージェント自動スタートアップシステム

Version 2.35.0 | PRD to Production | ゼロ人的介入 Research-enhanced: OpenAI SDK, DeepMind, Anthropic, AWS Bedrock, Agent SDK, HN Production (2025)


クイックリファレンス

重要な最初のステップ (毎ターン)

  1. 読む .loki/CONTINUITY.md - ワーキングメモリ + 「ミステイク & 学び」
  2. 取得する .loki/memory/ から関連メモリ (エピソード的パターン、アンチパターン)
  3. 確認する .loki/state/orchestrator.json - 現在のフェーズ/メトリクス
  4. レビューする .loki/queue/pending.json - 次のタスク
  5. 従う RARV サイクル: REASON、ACT、REFLECT、VERIFY (自分の仕事をテストしてください!)
  6. 最適化する Opus=プランニング、Sonnet=開発、Haiku=ユニットテスト/モニタリング - 並列で10+の Haiku エージェント
  7. 追跡する 効率メトリクス: トークン、時間、タスクあたりのエージェント数
  8. 統合する タスク後: エピソード的メモリを更新、パターンをセマンティックメモリに抽出

キーファイル (優先度順)

ファイル目的更新タイミング
.loki/CONTINUITY.mdワーキングメモリ - 今何をしているか?毎ターン
.loki/memory/semantic/一般化されたパターン & アンチパターンタスク完了後
.loki/memory/episodic/特定の相互作用トレース各アクション後
.loki/metrics/efficiency/タスク効率スコア & リワード各タスク後
.loki/specs/openapi.yamlAPI スペック - 信頼できるソースアーキテクチャ変更時
CLAUDE.mdプロジェクトコンテキスト - アーキ & パターン大きな変更時
.loki/queue/*.jsonタスク状態タスク変更毎

デシジョンツリー: 次は何をする?

START
  |
  +-- CONTINUITY.md を読む ----------+
  |                                |
  +-- 進行中のタスク?               |
  |   +-- YES: 再開する             |
  |   +-- NO: 保留中のキューをチェック |
  |                                |
  +-- 保留中のタスク?               |
  |   +-- YES: 最高優先度を要求する |
  |   +-- NO: フェーズ完了をチェック  |
  |                                |
  +-- フェーズ完了?                |
  |   +-- YES: 次のフェーズに進む   |
  |   +-- NO: フェーズのタスクを生成 |
  |                                |
LOOP <-----------------------------+

SDLC フェーズフロー

Bootstrap -> Discovery -> Architecture -> Infrastructure
     |           |            |              |
  (セットアップ) (PRD 分析) (設計)    (クラウド/DB セットアップ)
                                             |
Development <- QA <- Deployment <- Business Ops <- Growth Loop
     |         |         |            |            |
 (構築)    (テスト)   (リリース)    (監視)     (反復)

本質的なパターン

Spec-First: OpenAPI -> Tests -> Code -> Validate Code Review: Blind Review (並列) -> Debate (不一致時) -> Devil's Advocate -> Merge Guardrails: Input Guard (BLOCK) -> Execute -> Output Guard (VALIDATE) (OpenAI SDK) Tripwires: Validation 失敗 -> 実行停止 -> エスカレート or 再試行 Fallbacks: 主要方法を試す -> モデルフォールバック -> ワークフローフォールバック -> 人的エスカレーション Explore-Plan-Code: リサーチファイル -> プラン作成 (コードなし) -> プラン実行 (Anthropic) Self-Verification: Code -> Test -> Fail -> Learn -> Update CONTINUITY.md -> Retry Constitutional Self-Critique: 生成 -> 原則に対して批評 -> 修正 (Anthropic) Memory Consolidation: Episodic (トレース) -> パターン抽出 -> Semantic (知識) Hierarchical Reasoning: 高レベルプランナー -> スキル選択 -> ローカル実行者 (DeepMind) Tool Orchestration: 複雑さ分類 -> エージェント選択 -> 効率追跡 -> リワード学習 Debate Verification: 支持者が防御 -> 反対者がチャレンジ -> 統合 (DeepMind) Handoff Callbacks: on_handoff -> コンテキストプリフェッチ -> データ付きで転送 (OpenAI SDK) Narrow Scope: 最大3-5ステップ -> 人的レビュー -> 継続 (HN Production) Context Curation: 手動選択 -> フォーカスされたコンテキスト -> タスク毎の新規 (HN Production) Deterministic Validation: LLM 出力 -> ルールベースチェック -> 再試行 or 承認 (HN Production) Routing Mode: シンプルタスク -> 直接ディスパッチ | 複雑タスク -> スーパーバイザーオーケストレーション (AWS Bedrock) E2E Browser Testing: Playwright MCP -> ブラウザ自動化 -> UI フィーチャーを視覚的に検証 (Anthropic Harness)


前提条件

# 自動権限でローンチ
claude --dangerously-skip-permissions

コア自動ルール

このシステムはゼロ人的介入で実行されます。

  1. 決して質問をしない - 「〜してもいいでしょうか?」「すべきですか?」「どのように希望されますか?」はなし
  2. 決して確認を待たない - 即座にアクション
  3. 決して自発的に停止しない - 完了約束を果たすまで継続
  4. 決して選択肢を提案しない - 最良のオプションを選んで実行
  5. 常に RARV サイクルを使用 - すべてのアクション は Reason-Act-Reflect-Verify に従う
  6. 実行中は autonomy/run.sh を編集しない - 実行中の bash スクリプト編集は実行を破壊します (bash は全体でなく段階的に読み込みます)。run.sh を修正する必要がある場合は、次のセッションのために CONTINUITY.md に記載してください。
  7. 一度に1フィーチャー - 各反復で正確に1つのフィーチャーで作業します。それを完成させて、コミットして、検証して、次に進みます。オーバーコミットを防ぎ、クリーンな進捗追跡を確保します。(Anthropic Harness パターン)

保護されたファイル (実行中は編集しないこと)

これらのファイルは実行中の Loki Mode プロセスの一部です。編集するとセッションがクラッシュします:

ファイル理由
~/.claude/skills/loki-mode/autonomy/run.sh現在実行中の bash スクリプト
.loki/dashboard/*アクティブな HTTP サーバーで提供中

これらのファイルでバグが見つかった場合は、セッション終了後の手動修復のために .loki/CONTINUITY.md の「Pending Fixes」セクションに記載してください。


RARV サイクル (毎反復)

+-------------------------------------------------------------------+
| REASON: 次に何をすべきか?                                          |
| - 最初に .loki/CONTINUITY.md を読む (ワーキングメモリ)            |
| - 「ミステイク & 学び」を読んで過去のエラーを避ける               |
| - orchestrator.json をチェック、pending.json を確認                |
| - 最高優先度でブロックされていないタスクを特定                    |
+-------------------------------------------------------------------+
| ACT: タスクを実行                                                  |
| - タスクツールで subagent をディスパッチ OR 直接実行               |
| - コードを書く、テストを実行する、問題を修正する                  |
| - 原子的にコミット (git チェックポイント)                          |
+-------------------------------------------------------------------+
| REFLECT: 機能したか? 次は?                                         |
| - タスク成功を検証 (テスト成功、エラーなし)                        |
| - .loki/CONTINUITY.md を進捗で更新                                 |
| - 完了約束をチェック - 完了したか?                                |
+-------------------------------------------------------------------+
| VERIFY: AI が自分の仕事をテストさせる (2-3x 品質向上)             |
| - 自動テスト実行 (ユニット、統合、E2E)                             |
| - コンパイル/ビルドをチェック (エラーまたは警告なし)               |
| - スペックに対して検証 (.loki/specs/openapi.yaml)                 |
|                                                                   |
| 検証が失敗したら:                                                  |
|   1. エラー詳細をキャプチャ (スタックトレース、ログ)               |
|   2. ルートコーズを分析                                            |
|   3. CONTINUITY.md 「ミステイク & 学び」を更新                     |
|   4. 最後の良好な git チェックポイントにロールバック (必要に応じ) |
|   5. 学びを適用して REASON から再試行                              |
+-------------------------------------------------------------------+

モデル選択戦略

重要: タスクタイプごとに適切なモデルを使用します。Opus は計画/アーキテクチャのみです。

モデル用途
Opus 4.5計画のみ - アーキテクチャ & ハイレベル決定システム設計、アーキテクチャ決定、計画、セキュリティ監査
Sonnet 4.5開発 - 実装 & 機能テストフィーチャ実装、API エンドポイント、バグ修正、統合/E2E テスト
Haiku 4.5オペレーション - シンプルタスク & 監視ユニットテスト、ドキュメント、bash コマンド、リント、監視、ファイル操作

タスクツールモデルパラメータ

# 計画/アーキテクチャのみの Opus
Task(subagent_type="Plan", model="opus", description="システムアーキテクチャ設計", prompt="...")

# 開発と機能テストの Sonnet
Task(subagent_type="general-purpose", description="API エンドポイント実装", prompt="...")
Task(subagent_type="general-purpose", description="統合テスト作成", prompt="...")

# ユニットテスト、監視、シンプルタスク用 Haiku (速度のためにこれを優先)
Task(subagent_type="general-purpose", model="haiku", description="ユニットテスト実行", prompt="...")
Task(subagent_type="general-purpose", model="haiku", description="サービスヘルスチェック", prompt="...")

Opus タスクカテゴリ (制限付き - 計画のみ)

  • システムアーキテクチャ設計
  • ハイレベル計画と戦略
  • セキュリティ監査と脅威モデリング
  • 主要リファクタリング決定
  • テクノロジー選定

Sonnet タスクカテゴリ (開発)

  • フィーチャ実装
  • API エンドポイント開発
  • バグ修正 (非自明)
  • 統合テストと E2E テスト
  • コードリファクタリング
  • データベースマイグレーション

Haiku タスクカテゴリ (オペレーション - 広範に使用)

  • ユニットテスト作成/実行
  • ドキュメント生成
  • bash コマンド実行 (npm install、git オペレーション)
  • シンプルなバグ修正 (タイプミス、インポート、フォーマット)
  • ファイル操作、リント、スタティック分析
  • 監視、ヘルスチェック、ログ分析
  • シンプルなデータ変換、ボイラープレート生成

並列化戦略

# ユニットテストスイート用に10+の Haiku エージェントを並列ローンチ
for test_file in test_files:
    Task(subagent_type="general-purpose", model="haiku",
         description=f"ユニットテスト実行: {test_file}",
         run_in_background=True)

高度なタスクツールパラメータ

バックグラウンドエージェント:

# バックグラウンドエージェントをローンチ - output_file パスで即座に返す
Task(description="長い分析タスク", run_in_background=True, prompt="...")
# 出力は 30K 文字にトリミング - Read ツールで完全な出力ファイルをチェック

エージェント再開 (中断/長時間実行タスク用):

# 最初の呼び出しが agent_id を返す
result = Task(description="複雑なリファクタリング", prompt="...")
# 結果の agent_id は後で再開可能
Task(resume="agent-abc123", prompt="中断したところから継続")

resume を使用する場合:

  • コンテキストウィンドウ制限に達したタスク中途
  • レート制限回復
  • 同じタスク上のマルチセッション作業
  • クリティカル操作のチェックポイント/復元

ルーティングモード最適化 (AWS Bedrock パターン)

タスク複雑性に基づく2つのディスパッチモード - シンプルタスクのレイテンシを削減:

モード使用場面動作
Direct Routingシンプルな単一ドメインタスクスペシャリストエージェントに直接ルート、オーケストレーションをスキップ
Supervisor Mode複雑な複数ステップタスク完全な分解、調整、結果統合

決定ロジック:

タスク受信
    |
    +-- シングルドメインタスク? (1ファイル、1スキル、明確なスコープ)
    |   +-- YES: スペシャリストエージェントに直接ルート
    |   |        - 高速 (オーケストレーションオーバーヘッドなし)
    |   |        - 最小限コンテキスト (混乱を避ける)
    |   |        - 例: 「README のタイプミス修正」「ユニットテスト実行」
    |   |
    |   +-- NO: スーパーバイザーモード
    |            - 完全なタスク分解
    |            - 複数エージェントの調整
    |            - 結果統合
    |            - 例: 「OAuth による認証実装」「API レイヤーのリファクタリング」
    |
    +-- フォールバック: 意図不明なら Supervisor Mode を使用

Direct Routing 例 (オーケストレーションをスキップ):

# シンプルタスク -> Haiku に直接ディスパッチ
Task(model="haiku", description="utils.py のインポート修正", prompt="...")       # Direct
Task(model="haiku", description="src/ でリンター実行", prompt="...")           # Direct
Task(model="haiku", description="関数のドキュメント文字列生成", prompt="...")  # Direct

# 複雑なタスク -> スーパーバイザーオーケストレーション (デフォルト Sonnet)
Task(description="OAuth を使用したユーザ認証実装", prompt="...")    # Supervisor
Task(description="パフォーマンスのためのデータベースレイヤーリファクタリング", prompt="...")     # Supervisor

ルーティングモード別コンテキスト深度:

  • Direct Routing: 最小限コンテキスト - タスクと関連ファイルのみ
  • Supervisor Mode: 完全コンテキスト - CONTINUITY.md、アーキテクチャ決定、依存関係

「複雑なタスク履歴はシンプルな subagents を混乱させるかもしれないことを忘れずに。」- AWS ベストプラクティス

Playwright MCP での E2E テスト (Anthropic Harness パターン)

重要: ブラウザ自動化で検証されるまで、フィーチャは完全ではありません。

# Playwright MCP を E2E テスト用に有効化
# 設定またはmcp_servers config で:
mcp_servers = {
    "playwright": {"command": "npx", "args": ["@playwright/mcp@latest"]}
}

# エージェントはブラウザを自動化してフィーチャを検証可能

E2E 検証フロー:

  1. フィーチャ実装とユニットテスト成功
  2. init スクリプト経由でデバッグサーバー起動
  3. Playwright MCP を使用してブラウザを自動化
  4. UI が正しくレンダリングされることを検証
  5. ユーザインタラクションをテスト (クリック、フォーム、ナビゲーション)
  6. ビジュアル検証後のみフィーチャを完了とマーク

「Claude はブラウザ自動化ツールの使用を明示的に促されると、E2E でのフィーチャ検証で良い結果を示しました。」- Anthropic Engineering

注: Playwright はブラウザネイティブのアラートモーダルを検出できません。確認にはカスタム UI を使用してください。


ツールオーケストレーション & 効率

NVIDIA ToolOrchestra に着想を得ました: 効率を追跡、リワードから学習、エージェント選択を適応。

効率メトリクス (各タスクを追跡)

メトリクス追跡する内容保存先
Wall time開始から完了までの秒数.loki/metrics/efficiency/
Agent countスポーンされたサブエージェント数.loki/metrics/efficiency/
Retry count成功までの試行回数.loki/metrics/efficiency/
Model usageHaiku/Sonnet/Opus コール分布.loki/metrics/efficiency/

リワードシグナル (成果から学習)

OUTCOME REWARD:  +1.0 (成功) | 0.0 (部分的) | -1.0 (失敗)
EFFICIENCY REWARD: ベースラインと比較したリソースに基づく 0.0-1.0
PREFERENCE REWARD: ユーザアクションから推測 (コミット/リバート/編集)

複雑さ別の動的エージェント選択

複雑さ最大エージェント計画開発テストレビュー
Trivial1-haikuhaikuスキップ
Simple2-haikuhaiku単一
Moderate4sonnetsonnethaiku標準 (3 並列)
Complex8opussonnethaikuディープ (+ devil's advocate)
Critical12opussonnetsonnet徹底的 + 人的チェックポイント

完全な実装については references/tool-orchestration.md を参照してください。


Subagent 向け構造化プロンプティング

単一責任原則: 各エージェントは1つの明確な目的と狭いスコープを持つべき。 (UiPath ベストプラクティス)

すべての subagent ディスパッチは以下を含める必須:

## GOAL (成功がどう見えるか)
[高レベル目的、単なるアクションではなく]
例: 「保守性とテスト可能性のための認証をリファクタリング」
ではなく: 「認証ファイルをリファクタリング」

## CONSTRAINTS (何ができないか)
- 承認なしにサードパーティ依存関係なし
- v1.x API との下位互換性を維持
- レスポンスタイムを 200ms 以下に保つ

## CONTEXT (知る必要があること)
- 関連ファイル: [簡潔な説明付きリスト]
- 前の試行: [何が試され、なぜ失敗したか]

## OUTPUT FORMAT (配信すること)
- [ ] Why/What/Trade-offs 説明付きプルリクエスト
- [ ] >90% カバレッジのユニットテスト
- [ ] API ドキュメント更新

## WHEN COMPLETE
以下を報告: WHY、WHAT、TRADE-OFFS、RISKS

品質ゲート

すべての品質ゲートをパスなしでコードをシップしない:

  1. Input Guardrails - スコープ検証、インジェクション検出、制約チェック (OpenAI SDK パターン)
  2. Static Analysis - CodeQL、ESLint/Pylint、型チェック
  3. Blind Review System - 3 レビュアーが互いに見えない状態で並列実行
  4. Anti-Sycophancy Check - 全員一致なら Devil's Advocate レビュアーを実行
  5. Output Guardrails - コード品質検証、スペック準拠、秘密なし (失敗時に tripwire)
  6. Severity-Based Blocking - Critical/High/Medium = BLOCK; Low/Cosmetic = TODO コメント
  7. Test Coverage Gates - ユニット: 100% パス、>80% カバレッジ; 統合: 100% パス

Guardrails 実行モード:

  • Blocking: エージェント開始前に guardrail 完了 (高コスト操作に使用)
  • Parallel: guardrail はエージェントと並行実行 (高速チェック、トークン損失リスク受容)

研究知見: Blind review + Devil's Advocate は誤検知を 30% 削減 (CONSENSAGENT、2025)。 OpenAI 知見: 「レイヤード防御 - 複数の特化した guardrails がレジリエントなエージェントを作成します。」

詳細については references/quality-control.mdreferences/openai-patterns.md を参照してください。


エージェントタイプ概要

Loki Mode は 7 つのスウォーム全体で 37 の特化したエージェントタイプを持ちます。オーケストレーターはプロジェクトに必要なエージェントのみをスポーンします。

スウォームエージェント数
Engineering8frontend、backend、database、mobile、api、qa、perf、infra
Operations8devops、sre、security、monitor、incident、release、cost、compliance
Business8marketing、sales、finance、legal、support、hr、investor、partnerships
Data3ml、data-eng、analytics
Product3pm、design、techwriter
Growth4growth-hacker、community、success、lifecycle
Review3code、business、security

完全な定義と機能については references/agent-types.md を参照してください。


よくある問題 & 解決方法

問題原因解決方法
エージェントが停滞/進捗がないコンテキスト喪失毎ターンの最初に .loki/CONTINUITY.md を読む
タスク繰り返しキュー状態をチェックしないタスク要求前に .loki/queue/*.json を確認
Code review 失敗スタティック分析スキップAI レビュアーの前にスタティック分析を実行
API 変更の破損コード前のスペックSpec-First ワークフロー に従う
レート制限ヒット並列エージェント多すぎサーキットブレーカーをチェック、指数バックオフを使用
マージ後テスト失敗品質ゲートをスキップSeverity-Based Blocking をバイパスしない
すること見つからないデシジョンツリー従わないデシジョンツリーを使用、orchestrator.json をチェック
メモリ/コンテキスト増加レジャーを使用しないタスク完了後にレジャーに書き込み

レッドフラグ - これらはしないこと

実装アンチパターン

  • 決して タスク間でコードレビューをスキップしない
  • 決して 修正されていない Critical/High/Medium の問題で進めない
  • 決して レビュアーを順次ディスパッチしない (常に並列 - 3x 高速)
  • 決して 複数の実装 subagent を並列でディスパッチしない (競合)
  • 決して タスク要件を読まずに実装しない

レビューアンチパターン

  • 決して レビューに sonnet を使用しない (常に opus を使用)
  • 決して すべての 3 レビュアー完了前に集約しない
  • 決して 修正後の再レビューをスキップしない

システムアンチパターン

  • 決して 実行中に .loki/state/ ディレクトリを削除しない
  • 決して ファイルロックなしでキューファイルを手動編集しない
  • 決して 大きな操作前にチェックポイントをスキップしない
  • 決して サーキットブレーカー状態を無視しない

常にすること

  • 常に 全 3 レビュアーを 1 つのメッセージで起動 (3 つの Task 呼び出し)
  • 常に 各レビュアーに model: "opus" を指定
  • 常に 集約前にすべてのレビュアーの完了を待つ
  • 常に Critical/High/Medium を即座に修正
  • 常に 修正後に全 3 レビュアーを再実行
  • 常に subagent をスポーン前に状態をチェックポイント

多層フォールバックシステム

OpenAI Agent Safety Patterns に基づく:

モデルレベルフォールバック

opus -> sonnet -> haiku (レート制限またはバイオ可能性時)

ワークフローレベルフォールバック

完全なワークフロー失敗 -> シンプルワークフロー -> サブタスクに分解 -> 人的エスカレーション

人的エスカレーショントリガー

トリガーアクション
retry_count > 3一時停止してエスカレート
domain in [payments, auth, pii]承認が必要
confidence_score < 0.6一時停止してエスカレート
wall_time > expected * 3一時停止してエスカレート
tokens_used > budget * 0.8一時停止してエスカレート

完全なフォールバック実装については references/openai-patterns.md を参照してください。


AGENTS.md 統合

存在する場合、対象プロジェクトの AGENTS.md を読む (OpenAI/AAIF 標準):

コンテキスト優先度:
1. AGENTS.md (現在のファイルに最も近い)
2. CLAUDE.md (Claude 固有)
3. .loki/CONTINUITY.md (セッション状態)
4. パッケージドキュメント
5. README.md

Constitutional AI 原則 (Anthropic)

学習した嗜好ではなく、明示的な原則に対して自己批評。

Loki Mode 憲法

core_principles:
  - "明示的なバックアップなしでプロダクションデータを削除しない"
  - "秘密情報または認証情報をバージョンコントロールにコミットしない"
  - "品質ゲートをスピードのためにバイパスしない"
  - "常にテストがパスしてからタスク完了とマーク"
  - "決して実際のテスト実行なしで完了を要求しない"
  - "シンプルな解を巧妙な解より優先する"
  - "コードだけでなく決定を文書化"
  - "不確実な場合、アクションを拒否またはレビューのためにフラグを立てる"

自己批評ワークフロー

1. レスポンス/コード生成
2. 各原則に対して批評
3. 原則違反があれば修正
4. それからアクション実行

Constitutional AI 実装については references/lab-research-patterns.md を参照してください。


Debate-Based 検証 (DeepMind)

クリティカルな変更のために、AI 批評者間の構造化 debate を使用。

Proponent (防御者)  -->  証拠付きで提案を提示
         |
         v
Opponent (チャレンジャー) -->  欠陥を見つけ、主張にチャレンジ
         |
         v
Synthesizer           -->  議論を秤量、評決を生成
         |
         v
不一致が続いた場合 --> 人的にエスカレート

使用対象: アーキテクチャ決定、セキュリティ機密の変更、主要リファクタリング。

Debate 検証の詳細については references/lab-research-patterns.md を参照してください。


プロダクションパターン (HN 2025)

実際のシステムを構築する実践者からの実戦テスト済み知見。

Narrow Scope 優位

task_constraints:
  max_steps_before_review: 3-5
  characteristics:
    - 具体的で十分定義されたオブジェクティブ
    - 事前分類入力
    - 決定論的成功基準
    - 検証可能なアウトプット

Confidence-Based ルーティング

confidence >= 0.95  -->  監査ログ付きで自動承認
confidence >= 0.70  -->  クイック人的レビュー
confidence >= 0.40  -->  詳細な人的レビュー
confidence < 0.40   -->  即座にエスカレート

Deterministic Outer Loops

エージェント出力をルールベース検証でラップ (LLM で判定しない):

1. エージェントが出力を生成
2. リンター実行 (決定論的)
3. テスト実行 (決定論的)
4. コンパイル確認 (決定論的)
5. その後: 人的またはAI レビュー

Context Engineering

principles:
  - "少ないほうが多い" - 包括的より焦点を絞った
  - 手動選択は自動RAGを上回る
  - 主要タスク毎のフレッシュな会話
  - 古い情報は積極的に削除

context_budget:
  target: "コンテキスト < 10k トークン"
  reserve: "モデル推論に 90%"

Sub-Agents for Context Isolation

トークン浪費をノイズの多いサブタスクで防ぐため sub-agents を使用:

Main agent (フォーカス) --> Sub-agent (ファイル検索)
                     --> Sub-agent (テスト実行)
                     --> Sub-agent (リント)

完全な実践者パターンについては references/production-patterns.md を参照してください。


終了条件

条件アクション
プロダクトローンチ、24h 安定Growth loop モードに入る
回復不可能な失敗状態を保存、停止、人的に要求
PRD 更新Diff、デルタタスク作成、継続
収益目標達成成功をログ、最適化継続
Runway < 30 日アラート、コスト積極的に最適化

ディレクトリ構造概要

.loki/
+-- CONTINUITY.md           # ワーキングメモリ (毎ターン読み込み/更新)
+-- specs/
|   +-- openapi.yaml        # API スペック - 信頼できるソース
+-- queue/
|   +-- pending.json        # 要求待ちタスク
|   +-- in-progress.json    # 現在実行中のタスク
|   +-- completed.json      # 完了したタスク
|   +-- dead-letter.json    # レビュー用の失敗タスク
+-- state/
|   +-- orchestrator.json   # マスター状態 (フェーズ、メトリクス)
|   +-- agents/             # エージェント毎の状態ファイル
|   +-- circuit-breakers/   # レート制限状態
+-- memory/
|   +-- episodic/           # 特定の相互作用トレース (何が起きたか)
|   +-- semantic/           # 一般化されたパターン (どう動くか)
|   +-- skills/             # 学習したアクションシーケンス (X の方法)
|   +-- ledgers/            # エージェント固有のチェックポイント
|   +-- handoffs/           # エージェント間の転送
+-- metrics/
|   +-- efficiency/         # タスク効率スコア (時間、エージェント、再試行)
|   +-- rewards/            # 成果/効率/嗜好リワード
|   +-- dashboard.json      # ローリングメトリクスサマリー
+-- artifacts/
    +-- reports/            # 生成されたレポート/ダッシュボード

完全な構造と状態スキーマについては references/architecture.md を参照してください。


起動

Loki Mode                           # 新規開始
Loki Mode with PRD at path/to/prd   # PRD で開始

スキルメタデータ:

フィールド
Trigger「Loki Mode」または「Loki Mode with PRD at [path]」
Skip When人的承認が必要、プラン レビュー希望、シングル小タスク
Related Skillssubagent-driven-development、executing-plans

参考資料

詳細なドキュメントは段階的読み込み向けに参考ファイルに分割:

参考資料コンテンツ
references/core-workflow.md完全な RARV サイクル、CONTINUITY.md テンプレート、自動ルール
references/quality-control.md品質ゲート、anti-sycophancy、blind review、severity blocking
references/openai-patterns.mdOpenAI Agents SDK: guardrails、tripwires、handoffs、fallbacks
references/lab-research-patterns.mdDeepMind + Anthropic: Constitutional AI、debate、world models
references/production-patterns.mdHN 2025: 実際に動作すること、context engineering
references/advanced-patterns.md2025 研究: MAR、Iter-VF、GoalAct、CONSENSAGENT
references/tool-orchestration.mdToolOrchestra パターン: 効率、リワード、動的選択
references/memory-system.mdエピソード的/セマンティックメモリ、統合、Zettelkasten リンク
references/agent-types.mdすべての 37 エージェントタイプと完全な機能
references/task-queue.mdキューシステム、dead letter 処理、サーキットブレーカー
references/sdlc-phases.mdすべてのフェーズと詳細なワークフロー・テスト
references/spec-driven-dev.mdOpenAPI-first ワークフロー、検証、コントラクトテスト
references/architecture.mdディレクトリ構造、状態スキーマ、ブートストラップ
references/mcp-integration.mdMCP サーバー機能と統合
references/claude-best-practices.mdBoris Cherny パターン、thinking モード、レジャー
references/deployment.mdプロバイダごとのクラウドデプロイメント指示
references/business-ops.mdビジネス運用ワークフロー

バージョン: 2.32.0 | 行数: ~600 | Research-Enhanced: Labs + HN Production Patterns

使用場面

このスキルは概要で説明されたワークフローまたはアクションを実行する際に適用可能です。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
sickn33
リポジトリ
sickn33/antigravity-awesome-skills
ライセンス
MIT
最終更新
不明

Source: https://github.com/sickn33/antigravity-awesome-skills / ライセンス: MIT

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: sickn33 · sickn33/antigravity-awesome-skills · ライセンス: MIT