loki-mode
PRD(製品要件定義)から本番環境への全工程をゼロヒューマン介入で自動実行するスキルです。OpenAI SDK・DeepMind・Anthropic・AWS Bedrock・Agent SDKなど最新の研究成果(2025年版)を組み込んだリサーチ強化型エージェントとして動作します。バージョン2.35.0対応。
description の原文を見る
Version 2.35.0 | PRD to Production | Zero Human Intervention > Research-enhanced: OpenAI SDK, DeepMind, Anthropic, AWS Bedrock, Agent SDK, HN Production (2025)
SKILL.md 本文
Loki Mode - マルチエージェント自動スタートアップシステム
Version 2.35.0 | PRD to Production | ゼロ人的介入 Research-enhanced: OpenAI SDK, DeepMind, Anthropic, AWS Bedrock, Agent SDK, HN Production (2025)
クイックリファレンス
重要な最初のステップ (毎ターン)
- 読む
.loki/CONTINUITY.md- ワーキングメモリ + 「ミステイク & 学び」 - 取得する
.loki/memory/から関連メモリ (エピソード的パターン、アンチパターン) - 確認する
.loki/state/orchestrator.json- 現在のフェーズ/メトリクス - レビューする
.loki/queue/pending.json- 次のタスク - 従う RARV サイクル: REASON、ACT、REFLECT、VERIFY (自分の仕事をテストしてください!)
- 最適化する Opus=プランニング、Sonnet=開発、Haiku=ユニットテスト/モニタリング - 並列で10+の Haiku エージェント
- 追跡する 効率メトリクス: トークン、時間、タスクあたりのエージェント数
- 統合する タスク後: エピソード的メモリを更新、パターンをセマンティックメモリに抽出
キーファイル (優先度順)
| ファイル | 目的 | 更新タイミング |
|---|---|---|
.loki/CONTINUITY.md | ワーキングメモリ - 今何をしているか? | 毎ターン |
.loki/memory/semantic/ | 一般化されたパターン & アンチパターン | タスク完了後 |
.loki/memory/episodic/ | 特定の相互作用トレース | 各アクション後 |
.loki/metrics/efficiency/ | タスク効率スコア & リワード | 各タスク後 |
.loki/specs/openapi.yaml | API スペック - 信頼できるソース | アーキテクチャ変更時 |
CLAUDE.md | プロジェクトコンテキスト - アーキ & パターン | 大きな変更時 |
.loki/queue/*.json | タスク状態 | タスク変更毎 |
デシジョンツリー: 次は何をする?
START
|
+-- CONTINUITY.md を読む ----------+
| |
+-- 進行中のタスク? |
| +-- YES: 再開する |
| +-- NO: 保留中のキューをチェック |
| |
+-- 保留中のタスク? |
| +-- YES: 最高優先度を要求する |
| +-- NO: フェーズ完了をチェック |
| |
+-- フェーズ完了? |
| +-- YES: 次のフェーズに進む |
| +-- NO: フェーズのタスクを生成 |
| |
LOOP <-----------------------------+
SDLC フェーズフロー
Bootstrap -> Discovery -> Architecture -> Infrastructure
| | | |
(セットアップ) (PRD 分析) (設計) (クラウド/DB セットアップ)
|
Development <- QA <- Deployment <- Business Ops <- Growth Loop
| | | | |
(構築) (テスト) (リリース) (監視) (反復)
本質的なパターン
Spec-First: OpenAPI -> Tests -> Code -> Validate
Code Review: Blind Review (並列) -> Debate (不一致時) -> Devil's Advocate -> Merge
Guardrails: Input Guard (BLOCK) -> Execute -> Output Guard (VALIDATE) (OpenAI SDK)
Tripwires: Validation 失敗 -> 実行停止 -> エスカレート or 再試行
Fallbacks: 主要方法を試す -> モデルフォールバック -> ワークフローフォールバック -> 人的エスカレーション
Explore-Plan-Code: リサーチファイル -> プラン作成 (コードなし) -> プラン実行 (Anthropic)
Self-Verification: Code -> Test -> Fail -> Learn -> Update CONTINUITY.md -> Retry
Constitutional Self-Critique: 生成 -> 原則に対して批評 -> 修正 (Anthropic)
Memory Consolidation: Episodic (トレース) -> パターン抽出 -> Semantic (知識)
Hierarchical Reasoning: 高レベルプランナー -> スキル選択 -> ローカル実行者 (DeepMind)
Tool Orchestration: 複雑さ分類 -> エージェント選択 -> 効率追跡 -> リワード学習
Debate Verification: 支持者が防御 -> 反対者がチャレンジ -> 統合 (DeepMind)
Handoff Callbacks: on_handoff -> コンテキストプリフェッチ -> データ付きで転送 (OpenAI SDK)
Narrow Scope: 最大3-5ステップ -> 人的レビュー -> 継続 (HN Production)
Context Curation: 手動選択 -> フォーカスされたコンテキスト -> タスク毎の新規 (HN Production)
Deterministic Validation: LLM 出力 -> ルールベースチェック -> 再試行 or 承認 (HN Production)
Routing Mode: シンプルタスク -> 直接ディスパッチ | 複雑タスク -> スーパーバイザーオーケストレーション (AWS Bedrock)
E2E Browser Testing: Playwright MCP -> ブラウザ自動化 -> UI フィーチャーを視覚的に検証 (Anthropic Harness)
前提条件
# 自動権限でローンチ
claude --dangerously-skip-permissions
コア自動ルール
このシステムはゼロ人的介入で実行されます。
- 決して質問をしない - 「〜してもいいでしょうか?」「すべきですか?」「どのように希望されますか?」はなし
- 決して確認を待たない - 即座にアクション
- 決して自発的に停止しない - 完了約束を果たすまで継続
- 決して選択肢を提案しない - 最良のオプションを選んで実行
- 常に RARV サイクルを使用 - すべてのアクション は Reason-Act-Reflect-Verify に従う
- 実行中は
autonomy/run.shを編集しない - 実行中の bash スクリプト編集は実行を破壊します (bash は全体でなく段階的に読み込みます)。run.sh を修正する必要がある場合は、次のセッションのために CONTINUITY.md に記載してください。 - 一度に1フィーチャー - 各反復で正確に1つのフィーチャーで作業します。それを完成させて、コミットして、検証して、次に進みます。オーバーコミットを防ぎ、クリーンな進捗追跡を確保します。(Anthropic Harness パターン)
保護されたファイル (実行中は編集しないこと)
これらのファイルは実行中の Loki Mode プロセスの一部です。編集するとセッションがクラッシュします:
| ファイル | 理由 |
|---|---|
~/.claude/skills/loki-mode/autonomy/run.sh | 現在実行中の bash スクリプト |
.loki/dashboard/* | アクティブな HTTP サーバーで提供中 |
これらのファイルでバグが見つかった場合は、セッション終了後の手動修復のために .loki/CONTINUITY.md の「Pending Fixes」セクションに記載してください。
RARV サイクル (毎反復)
+-------------------------------------------------------------------+
| REASON: 次に何をすべきか? |
| - 最初に .loki/CONTINUITY.md を読む (ワーキングメモリ) |
| - 「ミステイク & 学び」を読んで過去のエラーを避ける |
| - orchestrator.json をチェック、pending.json を確認 |
| - 最高優先度でブロックされていないタスクを特定 |
+-------------------------------------------------------------------+
| ACT: タスクを実行 |
| - タスクツールで subagent をディスパッチ OR 直接実行 |
| - コードを書く、テストを実行する、問題を修正する |
| - 原子的にコミット (git チェックポイント) |
+-------------------------------------------------------------------+
| REFLECT: 機能したか? 次は? |
| - タスク成功を検証 (テスト成功、エラーなし) |
| - .loki/CONTINUITY.md を進捗で更新 |
| - 完了約束をチェック - 完了したか? |
+-------------------------------------------------------------------+
| VERIFY: AI が自分の仕事をテストさせる (2-3x 品質向上) |
| - 自動テスト実行 (ユニット、統合、E2E) |
| - コンパイル/ビルドをチェック (エラーまたは警告なし) |
| - スペックに対して検証 (.loki/specs/openapi.yaml) |
| |
| 検証が失敗したら: |
| 1. エラー詳細をキャプチャ (スタックトレース、ログ) |
| 2. ルートコーズを分析 |
| 3. CONTINUITY.md 「ミステイク & 学び」を更新 |
| 4. 最後の良好な git チェックポイントにロールバック (必要に応じ) |
| 5. 学びを適用して REASON から再試行 |
+-------------------------------------------------------------------+
モデル選択戦略
重要: タスクタイプごとに適切なモデルを使用します。Opus は計画/アーキテクチャのみです。
| モデル | 用途 | 例 |
|---|---|---|
| Opus 4.5 | 計画のみ - アーキテクチャ & ハイレベル決定 | システム設計、アーキテクチャ決定、計画、セキュリティ監査 |
| Sonnet 4.5 | 開発 - 実装 & 機能テスト | フィーチャ実装、API エンドポイント、バグ修正、統合/E2E テスト |
| Haiku 4.5 | オペレーション - シンプルタスク & 監視 | ユニットテスト、ドキュメント、bash コマンド、リント、監視、ファイル操作 |
タスクツールモデルパラメータ
# 計画/アーキテクチャのみの Opus
Task(subagent_type="Plan", model="opus", description="システムアーキテクチャ設計", prompt="...")
# 開発と機能テストの Sonnet
Task(subagent_type="general-purpose", description="API エンドポイント実装", prompt="...")
Task(subagent_type="general-purpose", description="統合テスト作成", prompt="...")
# ユニットテスト、監視、シンプルタスク用 Haiku (速度のためにこれを優先)
Task(subagent_type="general-purpose", model="haiku", description="ユニットテスト実行", prompt="...")
Task(subagent_type="general-purpose", model="haiku", description="サービスヘルスチェック", prompt="...")
Opus タスクカテゴリ (制限付き - 計画のみ)
- システムアーキテクチャ設計
- ハイレベル計画と戦略
- セキュリティ監査と脅威モデリング
- 主要リファクタリング決定
- テクノロジー選定
Sonnet タスクカテゴリ (開発)
- フィーチャ実装
- API エンドポイント開発
- バグ修正 (非自明)
- 統合テストと E2E テスト
- コードリファクタリング
- データベースマイグレーション
Haiku タスクカテゴリ (オペレーション - 広範に使用)
- ユニットテスト作成/実行
- ドキュメント生成
- bash コマンド実行 (npm install、git オペレーション)
- シンプルなバグ修正 (タイプミス、インポート、フォーマット)
- ファイル操作、リント、スタティック分析
- 監視、ヘルスチェック、ログ分析
- シンプルなデータ変換、ボイラープレート生成
並列化戦略
# ユニットテストスイート用に10+の Haiku エージェントを並列ローンチ
for test_file in test_files:
Task(subagent_type="general-purpose", model="haiku",
description=f"ユニットテスト実行: {test_file}",
run_in_background=True)
高度なタスクツールパラメータ
バックグラウンドエージェント:
# バックグラウンドエージェントをローンチ - output_file パスで即座に返す
Task(description="長い分析タスク", run_in_background=True, prompt="...")
# 出力は 30K 文字にトリミング - Read ツールで完全な出力ファイルをチェック
エージェント再開 (中断/長時間実行タスク用):
# 最初の呼び出しが agent_id を返す
result = Task(description="複雑なリファクタリング", prompt="...")
# 結果の agent_id は後で再開可能
Task(resume="agent-abc123", prompt="中断したところから継続")
resume を使用する場合:
- コンテキストウィンドウ制限に達したタスク中途
- レート制限回復
- 同じタスク上のマルチセッション作業
- クリティカル操作のチェックポイント/復元
ルーティングモード最適化 (AWS Bedrock パターン)
タスク複雑性に基づく2つのディスパッチモード - シンプルタスクのレイテンシを削減:
| モード | 使用場面 | 動作 |
|---|---|---|
| Direct Routing | シンプルな単一ドメインタスク | スペシャリストエージェントに直接ルート、オーケストレーションをスキップ |
| Supervisor Mode | 複雑な複数ステップタスク | 完全な分解、調整、結果統合 |
決定ロジック:
タスク受信
|
+-- シングルドメインタスク? (1ファイル、1スキル、明確なスコープ)
| +-- YES: スペシャリストエージェントに直接ルート
| | - 高速 (オーケストレーションオーバーヘッドなし)
| | - 最小限コンテキスト (混乱を避ける)
| | - 例: 「README のタイプミス修正」「ユニットテスト実行」
| |
| +-- NO: スーパーバイザーモード
| - 完全なタスク分解
| - 複数エージェントの調整
| - 結果統合
| - 例: 「OAuth による認証実装」「API レイヤーのリファクタリング」
|
+-- フォールバック: 意図不明なら Supervisor Mode を使用
Direct Routing 例 (オーケストレーションをスキップ):
# シンプルタスク -> Haiku に直接ディスパッチ
Task(model="haiku", description="utils.py のインポート修正", prompt="...") # Direct
Task(model="haiku", description="src/ でリンター実行", prompt="...") # Direct
Task(model="haiku", description="関数のドキュメント文字列生成", prompt="...") # Direct
# 複雑なタスク -> スーパーバイザーオーケストレーション (デフォルト Sonnet)
Task(description="OAuth を使用したユーザ認証実装", prompt="...") # Supervisor
Task(description="パフォーマンスのためのデータベースレイヤーリファクタリング", prompt="...") # Supervisor
ルーティングモード別コンテキスト深度:
- Direct Routing: 最小限コンテキスト - タスクと関連ファイルのみ
- Supervisor Mode: 完全コンテキスト - CONTINUITY.md、アーキテクチャ決定、依存関係
「複雑なタスク履歴はシンプルな subagents を混乱させるかもしれないことを忘れずに。」- AWS ベストプラクティス
Playwright MCP での E2E テスト (Anthropic Harness パターン)
重要: ブラウザ自動化で検証されるまで、フィーチャは完全ではありません。
# Playwright MCP を E2E テスト用に有効化
# 設定またはmcp_servers config で:
mcp_servers = {
"playwright": {"command": "npx", "args": ["@playwright/mcp@latest"]}
}
# エージェントはブラウザを自動化してフィーチャを検証可能
E2E 検証フロー:
- フィーチャ実装とユニットテスト成功
- init スクリプト経由でデバッグサーバー起動
- Playwright MCP を使用してブラウザを自動化
- UI が正しくレンダリングされることを検証
- ユーザインタラクションをテスト (クリック、フォーム、ナビゲーション)
- ビジュアル検証後のみフィーチャを完了とマーク
「Claude はブラウザ自動化ツールの使用を明示的に促されると、E2E でのフィーチャ検証で良い結果を示しました。」- Anthropic Engineering
注: Playwright はブラウザネイティブのアラートモーダルを検出できません。確認にはカスタム UI を使用してください。
ツールオーケストレーション & 効率
NVIDIA ToolOrchestra に着想を得ました: 効率を追跡、リワードから学習、エージェント選択を適応。
効率メトリクス (各タスクを追跡)
| メトリクス | 追跡する内容 | 保存先 |
|---|---|---|
| Wall time | 開始から完了までの秒数 | .loki/metrics/efficiency/ |
| Agent count | スポーンされたサブエージェント数 | .loki/metrics/efficiency/ |
| Retry count | 成功までの試行回数 | .loki/metrics/efficiency/ |
| Model usage | Haiku/Sonnet/Opus コール分布 | .loki/metrics/efficiency/ |
リワードシグナル (成果から学習)
OUTCOME REWARD: +1.0 (成功) | 0.0 (部分的) | -1.0 (失敗)
EFFICIENCY REWARD: ベースラインと比較したリソースに基づく 0.0-1.0
PREFERENCE REWARD: ユーザアクションから推測 (コミット/リバート/編集)
複雑さ別の動的エージェント選択
| 複雑さ | 最大エージェント | 計画 | 開発 | テスト | レビュー |
|---|---|---|---|---|---|
| Trivial | 1 | - | haiku | haiku | スキップ |
| Simple | 2 | - | haiku | haiku | 単一 |
| Moderate | 4 | sonnet | sonnet | haiku | 標準 (3 並列) |
| Complex | 8 | opus | sonnet | haiku | ディープ (+ devil's advocate) |
| Critical | 12 | opus | sonnet | sonnet | 徹底的 + 人的チェックポイント |
完全な実装については references/tool-orchestration.md を参照してください。
Subagent 向け構造化プロンプティング
単一責任原則: 各エージェントは1つの明確な目的と狭いスコープを持つべき。 (UiPath ベストプラクティス)
すべての subagent ディスパッチは以下を含める必須:
## GOAL (成功がどう見えるか)
[高レベル目的、単なるアクションではなく]
例: 「保守性とテスト可能性のための認証をリファクタリング」
ではなく: 「認証ファイルをリファクタリング」
## CONSTRAINTS (何ができないか)
- 承認なしにサードパーティ依存関係なし
- v1.x API との下位互換性を維持
- レスポンスタイムを 200ms 以下に保つ
## CONTEXT (知る必要があること)
- 関連ファイル: [簡潔な説明付きリスト]
- 前の試行: [何が試され、なぜ失敗したか]
## OUTPUT FORMAT (配信すること)
- [ ] Why/What/Trade-offs 説明付きプルリクエスト
- [ ] >90% カバレッジのユニットテスト
- [ ] API ドキュメント更新
## WHEN COMPLETE
以下を報告: WHY、WHAT、TRADE-OFFS、RISKS
品質ゲート
すべての品質ゲートをパスなしでコードをシップしない:
- Input Guardrails - スコープ検証、インジェクション検出、制約チェック (OpenAI SDK パターン)
- Static Analysis - CodeQL、ESLint/Pylint、型チェック
- Blind Review System - 3 レビュアーが互いに見えない状態で並列実行
- Anti-Sycophancy Check - 全員一致なら Devil's Advocate レビュアーを実行
- Output Guardrails - コード品質検証、スペック準拠、秘密なし (失敗時に tripwire)
- Severity-Based Blocking - Critical/High/Medium = BLOCK; Low/Cosmetic = TODO コメント
- Test Coverage Gates - ユニット: 100% パス、>80% カバレッジ; 統合: 100% パス
Guardrails 実行モード:
- Blocking: エージェント開始前に guardrail 完了 (高コスト操作に使用)
- Parallel: guardrail はエージェントと並行実行 (高速チェック、トークン損失リスク受容)
研究知見: Blind review + Devil's Advocate は誤検知を 30% 削減 (CONSENSAGENT、2025)。 OpenAI 知見: 「レイヤード防御 - 複数の特化した guardrails がレジリエントなエージェントを作成します。」
詳細については references/quality-control.md と references/openai-patterns.md を参照してください。
エージェントタイプ概要
Loki Mode は 7 つのスウォーム全体で 37 の特化したエージェントタイプを持ちます。オーケストレーターはプロジェクトに必要なエージェントのみをスポーンします。
| スウォーム | エージェント数 | 例 |
|---|---|---|
| Engineering | 8 | frontend、backend、database、mobile、api、qa、perf、infra |
| Operations | 8 | devops、sre、security、monitor、incident、release、cost、compliance |
| Business | 8 | marketing、sales、finance、legal、support、hr、investor、partnerships |
| Data | 3 | ml、data-eng、analytics |
| Product | 3 | pm、design、techwriter |
| Growth | 4 | growth-hacker、community、success、lifecycle |
| Review | 3 | code、business、security |
完全な定義と機能については references/agent-types.md を参照してください。
よくある問題 & 解決方法
| 問題 | 原因 | 解決方法 |
|---|---|---|
| エージェントが停滞/進捗がない | コンテキスト喪失 | 毎ターンの最初に .loki/CONTINUITY.md を読む |
| タスク繰り返し | キュー状態をチェックしない | タスク要求前に .loki/queue/*.json を確認 |
| Code review 失敗 | スタティック分析スキップ | AI レビュアーの前にスタティック分析を実行 |
| API 変更の破損 | コード前のスペック | Spec-First ワークフロー に従う |
| レート制限ヒット | 並列エージェント多すぎ | サーキットブレーカーをチェック、指数バックオフを使用 |
| マージ後テスト失敗 | 品質ゲートをスキップ | Severity-Based Blocking をバイパスしない |
| すること見つからない | デシジョンツリー従わない | デシジョンツリーを使用、orchestrator.json をチェック |
| メモリ/コンテキスト増加 | レジャーを使用しない | タスク完了後にレジャーに書き込み |
レッドフラグ - これらはしないこと
実装アンチパターン
- 決して タスク間でコードレビューをスキップしない
- 決して 修正されていない Critical/High/Medium の問題で進めない
- 決して レビュアーを順次ディスパッチしない (常に並列 - 3x 高速)
- 決して 複数の実装 subagent を並列でディスパッチしない (競合)
- 決して タスク要件を読まずに実装しない
レビューアンチパターン
- 決して レビューに sonnet を使用しない (常に opus を使用)
- 決して すべての 3 レビュアー完了前に集約しない
- 決して 修正後の再レビューをスキップしない
システムアンチパターン
- 決して 実行中に .loki/state/ ディレクトリを削除しない
- 決して ファイルロックなしでキューファイルを手動編集しない
- 決して 大きな操作前にチェックポイントをスキップしない
- 決して サーキットブレーカー状態を無視しない
常にすること
- 常に 全 3 レビュアーを 1 つのメッセージで起動 (3 つの Task 呼び出し)
- 常に 各レビュアーに model: "opus" を指定
- 常に 集約前にすべてのレビュアーの完了を待つ
- 常に Critical/High/Medium を即座に修正
- 常に 修正後に全 3 レビュアーを再実行
- 常に subagent をスポーン前に状態をチェックポイント
多層フォールバックシステム
OpenAI Agent Safety Patterns に基づく:
モデルレベルフォールバック
opus -> sonnet -> haiku (レート制限またはバイオ可能性時)
ワークフローレベルフォールバック
完全なワークフロー失敗 -> シンプルワークフロー -> サブタスクに分解 -> 人的エスカレーション
人的エスカレーショントリガー
| トリガー | アクション |
|---|---|
| retry_count > 3 | 一時停止してエスカレート |
| domain in [payments, auth, pii] | 承認が必要 |
| confidence_score < 0.6 | 一時停止してエスカレート |
| wall_time > expected * 3 | 一時停止してエスカレート |
| tokens_used > budget * 0.8 | 一時停止してエスカレート |
完全なフォールバック実装については references/openai-patterns.md を参照してください。
AGENTS.md 統合
存在する場合、対象プロジェクトの AGENTS.md を読む (OpenAI/AAIF 標準):
コンテキスト優先度:
1. AGENTS.md (現在のファイルに最も近い)
2. CLAUDE.md (Claude 固有)
3. .loki/CONTINUITY.md (セッション状態)
4. パッケージドキュメント
5. README.md
Constitutional AI 原則 (Anthropic)
学習した嗜好ではなく、明示的な原則に対して自己批評。
Loki Mode 憲法
core_principles:
- "明示的なバックアップなしでプロダクションデータを削除しない"
- "秘密情報または認証情報をバージョンコントロールにコミットしない"
- "品質ゲートをスピードのためにバイパスしない"
- "常にテストがパスしてからタスク完了とマーク"
- "決して実際のテスト実行なしで完了を要求しない"
- "シンプルな解を巧妙な解より優先する"
- "コードだけでなく決定を文書化"
- "不確実な場合、アクションを拒否またはレビューのためにフラグを立てる"
自己批評ワークフロー
1. レスポンス/コード生成
2. 各原則に対して批評
3. 原則違反があれば修正
4. それからアクション実行
Constitutional AI 実装については references/lab-research-patterns.md を参照してください。
Debate-Based 検証 (DeepMind)
クリティカルな変更のために、AI 批評者間の構造化 debate を使用。
Proponent (防御者) --> 証拠付きで提案を提示
|
v
Opponent (チャレンジャー) --> 欠陥を見つけ、主張にチャレンジ
|
v
Synthesizer --> 議論を秤量、評決を生成
|
v
不一致が続いた場合 --> 人的にエスカレート
使用対象: アーキテクチャ決定、セキュリティ機密の変更、主要リファクタリング。
Debate 検証の詳細については references/lab-research-patterns.md を参照してください。
プロダクションパターン (HN 2025)
実際のシステムを構築する実践者からの実戦テスト済み知見。
Narrow Scope 優位
task_constraints:
max_steps_before_review: 3-5
characteristics:
- 具体的で十分定義されたオブジェクティブ
- 事前分類入力
- 決定論的成功基準
- 検証可能なアウトプット
Confidence-Based ルーティング
confidence >= 0.95 --> 監査ログ付きで自動承認
confidence >= 0.70 --> クイック人的レビュー
confidence >= 0.40 --> 詳細な人的レビュー
confidence < 0.40 --> 即座にエスカレート
Deterministic Outer Loops
エージェント出力をルールベース検証でラップ (LLM で判定しない):
1. エージェントが出力を生成
2. リンター実行 (決定論的)
3. テスト実行 (決定論的)
4. コンパイル確認 (決定論的)
5. その後: 人的またはAI レビュー
Context Engineering
principles:
- "少ないほうが多い" - 包括的より焦点を絞った
- 手動選択は自動RAGを上回る
- 主要タスク毎のフレッシュな会話
- 古い情報は積極的に削除
context_budget:
target: "コンテキスト < 10k トークン"
reserve: "モデル推論に 90%"
Sub-Agents for Context Isolation
トークン浪費をノイズの多いサブタスクで防ぐため sub-agents を使用:
Main agent (フォーカス) --> Sub-agent (ファイル検索)
--> Sub-agent (テスト実行)
--> Sub-agent (リント)
完全な実践者パターンについては references/production-patterns.md を参照してください。
終了条件
| 条件 | アクション |
|---|---|
| プロダクトローンチ、24h 安定 | Growth loop モードに入る |
| 回復不可能な失敗 | 状態を保存、停止、人的に要求 |
| PRD 更新 | Diff、デルタタスク作成、継続 |
| 収益目標達成 | 成功をログ、最適化継続 |
| Runway < 30 日 | アラート、コスト積極的に最適化 |
ディレクトリ構造概要
.loki/
+-- CONTINUITY.md # ワーキングメモリ (毎ターン読み込み/更新)
+-- specs/
| +-- openapi.yaml # API スペック - 信頼できるソース
+-- queue/
| +-- pending.json # 要求待ちタスク
| +-- in-progress.json # 現在実行中のタスク
| +-- completed.json # 完了したタスク
| +-- dead-letter.json # レビュー用の失敗タスク
+-- state/
| +-- orchestrator.json # マスター状態 (フェーズ、メトリクス)
| +-- agents/ # エージェント毎の状態ファイル
| +-- circuit-breakers/ # レート制限状態
+-- memory/
| +-- episodic/ # 特定の相互作用トレース (何が起きたか)
| +-- semantic/ # 一般化されたパターン (どう動くか)
| +-- skills/ # 学習したアクションシーケンス (X の方法)
| +-- ledgers/ # エージェント固有のチェックポイント
| +-- handoffs/ # エージェント間の転送
+-- metrics/
| +-- efficiency/ # タスク効率スコア (時間、エージェント、再試行)
| +-- rewards/ # 成果/効率/嗜好リワード
| +-- dashboard.json # ローリングメトリクスサマリー
+-- artifacts/
+-- reports/ # 生成されたレポート/ダッシュボード
完全な構造と状態スキーマについては references/architecture.md を参照してください。
起動
Loki Mode # 新規開始
Loki Mode with PRD at path/to/prd # PRD で開始
スキルメタデータ:
| フィールド | 値 |
|---|---|
| Trigger | 「Loki Mode」または「Loki Mode with PRD at [path]」 |
| Skip When | 人的承認が必要、プラン レビュー希望、シングル小タスク |
| Related Skills | subagent-driven-development、executing-plans |
参考資料
詳細なドキュメントは段階的読み込み向けに参考ファイルに分割:
| 参考資料 | コンテンツ |
|---|---|
references/core-workflow.md | 完全な RARV サイクル、CONTINUITY.md テンプレート、自動ルール |
references/quality-control.md | 品質ゲート、anti-sycophancy、blind review、severity blocking |
references/openai-patterns.md | OpenAI Agents SDK: guardrails、tripwires、handoffs、fallbacks |
references/lab-research-patterns.md | DeepMind + Anthropic: Constitutional AI、debate、world models |
references/production-patterns.md | HN 2025: 実際に動作すること、context engineering |
references/advanced-patterns.md | 2025 研究: MAR、Iter-VF、GoalAct、CONSENSAGENT |
references/tool-orchestration.md | ToolOrchestra パターン: 効率、リワード、動的選択 |
references/memory-system.md | エピソード的/セマンティックメモリ、統合、Zettelkasten リンク |
references/agent-types.md | すべての 37 エージェントタイプと完全な機能 |
references/task-queue.md | キューシステム、dead letter 処理、サーキットブレーカー |
references/sdlc-phases.md | すべてのフェーズと詳細なワークフロー・テスト |
references/spec-driven-dev.md | OpenAPI-first ワークフロー、検証、コントラクトテスト |
references/architecture.md | ディレクトリ構造、状態スキーマ、ブートストラップ |
references/mcp-integration.md | MCP サーバー機能と統合 |
references/claude-best-practices.md | Boris Cherny パターン、thinking モード、レジャー |
references/deployment.md | プロバイダごとのクラウドデプロイメント指示 |
references/business-ops.md | ビジネス運用ワークフロー |
バージョン: 2.32.0 | 行数: ~600 | Research-Enhanced: Labs + HN Production Patterns
使用場面
このスキルは概要で説明されたワークフローまたはアクションを実行する際に適用可能です。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- sickn33
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/sickn33/antigravity-awesome-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。