Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

loki-mode

Name: loki-mode
Author: sickn33

PRD（製品要件定義）から本番環境への全工程をゼロヒューマン介入で自動実行するスキルです。OpenAI SDK・DeepMind・Anthropic・AWS Bedrock・Agent SDKなど最新の研究成果（2025年版）を組み込んだリサーチ強化型エージェントとして動作します。バージョン2.35.0対応。

description の原文を見る

Version 2.35.0 | PRD to Production | Zero Human Intervention > Research-enhanced: OpenAI SDK, DeepMind, Anthropic, AWS Bedrock, Agent SDK, HN Production (2025)

SKILL.md 本文

Loki Mode - マルチエージェント自動スタートアップシステム

Version 2.35.0 | PRD to Production | ゼロ人的介入 Research-enhanced: OpenAI SDK, DeepMind, Anthropic, AWS Bedrock, Agent SDK, HN Production (2025)

クイックリファレンス

重要な最初のステップ (毎ターン)

読む .loki/CONTINUITY.md - ワーキングメモリ + 「ミステイク & 学び」
取得する .loki/memory/ から関連メモリ (エピソード的パターン、アンチパターン)
確認する .loki/state/orchestrator.json - 現在のフェーズ/メトリクス
レビューする .loki/queue/pending.json - 次のタスク
従う RARV サイクル: REASON、ACT、REFLECT、VERIFY (自分の仕事をテストしてください!)
最適化する Opus=プランニング、Sonnet=開発、Haiku=ユニットテスト/モニタリング - 並列で10+の Haiku エージェント
追跡する 効率メトリクス: トークン、時間、タスクあたりのエージェント数
統合する タスク後: エピソード的メモリを更新、パターンをセマンティックメモリに抽出

キーファイル (優先度順)

ファイル	目的	更新タイミング
`.loki/CONTINUITY.md`	ワーキングメモリ - 今何をしているか?	毎ターン
`.loki/memory/semantic/`	一般化されたパターン & アンチパターン	タスク完了後
`.loki/memory/episodic/`	特定の相互作用トレース	各アクション後
`.loki/metrics/efficiency/`	タスク効率スコア & リワード	各タスク後
`.loki/specs/openapi.yaml`	API スペック - 信頼できるソース	アーキテクチャ変更時
`CLAUDE.md`	プロジェクトコンテキスト - アーキ & パターン	大きな変更時
`.loki/queue/*.json`	タスク状態	タスク変更毎

デシジョンツリー: 次は何をする?

START
  |
  +-- CONTINUITY.md を読む ----------+
  |                                |
  +-- 進行中のタスク?               |
  |   +-- YES: 再開する             |
  |   +-- NO: 保留中のキューをチェック |
  |                                |
  +-- 保留中のタスク?               |
  |   +-- YES: 最高優先度を要求する |
  |   +-- NO: フェーズ完了をチェック  |
  |                                |
  +-- フェーズ完了?                |
  |   +-- YES: 次のフェーズに進む   |
  |   +-- NO: フェーズのタスクを生成 |
  |                                |
LOOP <-----------------------------+

SDLC フェーズフロー

Bootstrap -> Discovery -> Architecture -> Infrastructure
     |           |            |              |
  (セットアップ) (PRD 分析) (設計)    (クラウド/DB セットアップ)
                                             |
Development <- QA <- Deployment <- Business Ops <- Growth Loop
     |         |         |            |            |
 (構築)    (テスト)   (リリース)    (監視)     (反復)

本質的なパターン

Spec-First: OpenAPI -> Tests -> Code -> Validate Code Review: Blind Review (並列) -> Debate (不一致時) -> Devil's Advocate -> Merge Guardrails: Input Guard (BLOCK) -> Execute -> Output Guard (VALIDATE) (OpenAI SDK) Tripwires: Validation 失敗 -> 実行停止 -> エスカレート or 再試行 Fallbacks: 主要方法を試す -> モデルフォールバック -> ワークフローフォールバック -> 人的エスカレーション Explore-Plan-Code: リサーチファイル -> プラン作成 (コードなし) -> プラン実行 (Anthropic) Self-Verification: Code -> Test -> Fail -> Learn -> Update CONTINUITY.md -> Retry Constitutional Self-Critique: 生成 -> 原則に対して批評 -> 修正 (Anthropic) Memory Consolidation: Episodic (トレース) -> パターン抽出 -> Semantic (知識) Hierarchical Reasoning: 高レベルプランナー -> スキル選択 -> ローカル実行者 (DeepMind) Tool Orchestration: 複雑さ分類 -> エージェント選択 -> 効率追跡 -> リワード学習 Debate Verification: 支持者が防御 -> 反対者がチャレンジ -> 統合 (DeepMind) Handoff Callbacks: on_handoff -> コンテキストプリフェッチ -> データ付きで転送 (OpenAI SDK) Narrow Scope: 最大3-5ステップ -> 人的レビュー -> 継続 (HN Production) Context Curation: 手動選択 -> フォーカスされたコンテキスト -> タスク毎の新規 (HN Production) Deterministic Validation: LLM 出力 -> ルールベースチェック -> 再試行 or 承認 (HN Production) Routing Mode: シンプルタスク -> 直接ディスパッチ | 複雑タスク -> スーパーバイザーオーケストレーション (AWS Bedrock) E2E Browser Testing: Playwright MCP -> ブラウザ自動化 -> UI フィーチャーを視覚的に検証 (Anthropic Harness)

前提条件

# 自動権限でローンチ
claude --dangerously-skip-permissions

コア自動ルール

このシステムはゼロ人的介入で実行されます。

決して質問をしない - 「〜してもいいでしょうか?」「すべきですか?」「どのように希望されますか?」はなし
決して確認を待たない - 即座にアクション
決して自発的に停止しない - 完了約束を果たすまで継続
決して選択肢を提案しない - 最良のオプションを選んで実行
常に RARV サイクルを使用 - すべてのアクションは Reason-Act-Reflect-Verify に従う
実行中は autonomy/run.sh を編集しない - 実行中の bash スクリプト編集は実行を破壊します (bash は全体でなく段階的に読み込みます)。run.sh を修正する必要がある場合は、次のセッションのために CONTINUITY.md に記載してください。
一度に1フィーチャー - 各反復で正確に1つのフィーチャーで作業します。それを完成させて、コミットして、検証して、次に進みます。オーバーコミットを防ぎ、クリーンな進捗追跡を確保します。(Anthropic Harness パターン)

保護されたファイル (実行中は編集しないこと)

これらのファイルは実行中の Loki Mode プロセスの一部です。編集するとセッションがクラッシュします:

ファイル	理由
`~/.claude/skills/loki-mode/autonomy/run.sh`	現在実行中の bash スクリプト
`.loki/dashboard/*`	アクティブな HTTP サーバーで提供中

これらのファイルでバグが見つかった場合は、セッション終了後の手動修復のために .loki/CONTINUITY.md の「Pending Fixes」セクションに記載してください。

RARV サイクル (毎反復)

+-------------------------------------------------------------------+
| REASON: 次に何をすべきか?                                          |
| - 最初に .loki/CONTINUITY.md を読む (ワーキングメモリ)            |
| - 「ミステイク & 学び」を読んで過去のエラーを避ける               |
| - orchestrator.json をチェック、pending.json を確認                |
| - 最高優先度でブロックされていないタスクを特定                    |
+-------------------------------------------------------------------+
| ACT: タスクを実行                                                  |
| - タスクツールで subagent をディスパッチ OR 直接実行               |
| - コードを書く、テストを実行する、問題を修正する                  |
| - 原子的にコミット (git チェックポイント)                          |
+-------------------------------------------------------------------+
| REFLECT: 機能したか? 次は?                                         |
| - タスク成功を検証 (テスト成功、エラーなし)                        |
| - .loki/CONTINUITY.md を進捗で更新                                 |
| - 完了約束をチェック - 完了したか?                                |
+-------------------------------------------------------------------+
| VERIFY: AI が自分の仕事をテストさせる (2-3x 品質向上)             |
| - 自動テスト実行 (ユニット、統合、E2E)                             |
| - コンパイル/ビルドをチェック (エラーまたは警告なし)               |
| - スペックに対して検証 (.loki/specs/openapi.yaml)                 |
|                                                                   |
| 検証が失敗したら:                                                  |
|   1. エラー詳細をキャプチャ (スタックトレース、ログ)               |
|   2. ルートコーズを分析                                            |
|   3. CONTINUITY.md 「ミステイク & 学び」を更新                     |
|   4. 最後の良好な git チェックポイントにロールバック (必要に応じ) |
|   5. 学びを適用して REASON から再試行                              |
+-------------------------------------------------------------------+

モデル選択戦略

重要: タスクタイプごとに適切なモデルを使用します。Opus は計画/アーキテクチャのみです。

モデル	用途	例
Opus 4.5	計画のみ - アーキテクチャ & ハイレベル決定	システム設計、アーキテクチャ決定、計画、セキュリティ監査
Sonnet 4.5	開発 - 実装 & 機能テスト	フィーチャ実装、API エンドポイント、バグ修正、統合/E2E テスト
Haiku 4.5	オペレーション - シンプルタスク & 監視	ユニットテスト、ドキュメント、bash コマンド、リント、監視、ファイル操作

タスクツールモデルパラメータ

# 計画/アーキテクチャのみの Opus
Task(subagent_type="Plan", model="opus", description="システムアーキテクチャ設計", prompt="...")

# 開発と機能テストの Sonnet
Task(subagent_type="general-purpose", description="API エンドポイント実装", prompt="...")
Task(subagent_type="general-purpose", description="統合テスト作成", prompt="...")

# ユニットテスト、監視、シンプルタスク用 Haiku (速度のためにこれを優先)
Task(subagent_type="general-purpose", model="haiku", description="ユニットテスト実行", prompt="...")
Task(subagent_type="general-purpose", model="haiku", description="サービスヘルスチェック", prompt="...")

Opus タスクカテゴリ (制限付き - 計画のみ)

システムアーキテクチャ設計
ハイレベル計画と戦略
セキュリティ監査と脅威モデリング
主要リファクタリング決定
テクノロジー選定

Sonnet タスクカテゴリ (開発)

フィーチャ実装
API エンドポイント開発
バグ修正 (非自明)
統合テストと E2E テスト
コードリファクタリング
データベースマイグレーション

Haiku タスクカテゴリ (オペレーション - 広範に使用)

ユニットテスト作成/実行
ドキュメント生成
bash コマンド実行 (npm install、git オペレーション)
シンプルなバグ修正 (タイプミス、インポート、フォーマット)
ファイル操作、リント、スタティック分析
監視、ヘルスチェック、ログ分析
シンプルなデータ変換、ボイラープレート生成

並列化戦略

# ユニットテストスイート用に10+の Haiku エージェントを並列ローンチ
for test_file in test_files:
    Task(subagent_type="general-purpose", model="haiku",
         description=f"ユニットテスト実行: {test_file}",
         run_in_background=True)

高度なタスクツールパラメータ

バックグラウンドエージェント:

# バックグラウンドエージェントをローンチ - output_file パスで即座に返す
Task(description="長い分析タスク", run_in_background=True, prompt="...")
# 出力は 30K 文字にトリミング - Read ツールで完全な出力ファイルをチェック

エージェント再開 (中断/長時間実行タスク用):

# 最初の呼び出しが agent_id を返す
result = Task(description="複雑なリファクタリング", prompt="...")
# 結果の agent_id は後で再開可能
Task(resume="agent-abc123", prompt="中断したところから継続")

resume を使用する場合:

コンテキストウィンドウ制限に達したタスク中途
レート制限回復
同じタスク上のマルチセッション作業
クリティカル操作のチェックポイント/復元

ルーティングモード最適化 (AWS Bedrock パターン)

タスク複雑性に基づく2つのディスパッチモード - シンプルタスクのレイテンシを削減:

モード	使用場面	動作
Direct Routing	シンプルな単一ドメインタスク	スペシャリストエージェントに直接ルート、オーケストレーションをスキップ
Supervisor Mode	複雑な複数ステップタスク	完全な分解、調整、結果統合

決定ロジック:

タスク受信
    |
    +-- シングルドメインタスク? (1ファイル、1スキル、明確なスコープ)
    |   +-- YES: スペシャリストエージェントに直接ルート
    |   |        - 高速 (オーケストレーションオーバーヘッドなし)
    |   |        - 最小限コンテキスト (混乱を避ける)
    |   |        - 例: 「README のタイプミス修正」「ユニットテスト実行」
    |   |
    |   +-- NO: スーパーバイザーモード
    |            - 完全なタスク分解
    |            - 複数エージェントの調整
    |            - 結果統合
    |            - 例: 「OAuth による認証実装」「API レイヤーのリファクタリング」
    |
    +-- フォールバック: 意図不明なら Supervisor Mode を使用

Direct Routing 例 (オーケストレーションをスキップ):

# シンプルタスク -> Haiku に直接ディスパッチ
Task(model="haiku", description="utils.py のインポート修正", prompt="...")       # Direct
Task(model="haiku", description="src/ でリンター実行", prompt="...")           # Direct
Task(model="haiku", description="関数のドキュメント文字列生成", prompt="...")  # Direct

# 複雑なタスク -> スーパーバイザーオーケストレーション (デフォルト Sonnet)
Task(description="OAuth を使用したユーザ認証実装", prompt="...")    # Supervisor
Task(description="パフォーマンスのためのデータベースレイヤーリファクタリング", prompt="...")     # Supervisor

ルーティングモード別コンテキスト深度:

Direct Routing: 最小限コンテキスト - タスクと関連ファイルのみ
Supervisor Mode: 完全コンテキスト - CONTINUITY.md、アーキテクチャ決定、依存関係

「複雑なタスク履歴はシンプルな subagents を混乱させるかもしれないことを忘れずに。」- AWS ベストプラクティス

Playwright MCP での E2E テスト (Anthropic Harness パターン)

重要: ブラウザ自動化で検証されるまで、フィーチャは完全ではありません。

# Playwright MCP を E2E テスト用に有効化
# 設定またはmcp_servers config で:
mcp_servers = {
    "playwright": {"command": "npx", "args": ["@playwright/mcp@latest"]}
}

# エージェントはブラウザを自動化してフィーチャを検証可能

E2E 検証フロー:

フィーチャ実装とユニットテスト成功
init スクリプト経由でデバッグサーバー起動
Playwright MCP を使用してブラウザを自動化
UI が正しくレンダリングされることを検証
ユーザインタラクションをテスト (クリック、フォーム、ナビゲーション)
ビジュアル検証後のみフィーチャを完了とマーク

「Claude はブラウザ自動化ツールの使用を明示的に促されると、E2E でのフィーチャ検証で良い結果を示しました。」- Anthropic Engineering

注: Playwright はブラウザネイティブのアラートモーダルを検出できません。確認にはカスタム UI を使用してください。

ツールオーケストレーション & 効率

NVIDIA ToolOrchestra に着想を得ました: 効率を追跡、リワードから学習、エージェント選択を適応。

効率メトリクス (各タスクを追跡)

メトリクス	追跡する内容	保存先
Wall time	開始から完了までの秒数	`.loki/metrics/efficiency/`
Agent count	スポーンされたサブエージェント数	`.loki/metrics/efficiency/`
Retry count	成功までの試行回数	`.loki/metrics/efficiency/`
Model usage	Haiku/Sonnet/Opus コール分布	`.loki/metrics/efficiency/`

リワードシグナル (成果から学習)

OUTCOME REWARD:  +1.0 (成功) | 0.0 (部分的) | -1.0 (失敗)
EFFICIENCY REWARD: ベースラインと比較したリソースに基づく 0.0-1.0
PREFERENCE REWARD: ユーザアクションから推測 (コミット/リバート/編集)

複雑さ別の動的エージェント選択

複雑さ	最大エージェント	計画	開発	テスト	レビュー
Trivial	1	-	haiku	haiku	スキップ
Simple	2	-	haiku	haiku	単一
Moderate	4	sonnet	sonnet	haiku	標準 (3 並列)
Complex	8	opus	sonnet	haiku	ディープ (+ devil's advocate)
Critical	12	opus	sonnet	sonnet	徹底的 + 人的チェックポイント

完全な実装については references/tool-orchestration.md を参照してください。

Subagent 向け構造化プロンプティング

単一責任原則: 各エージェントは1つの明確な目的と狭いスコープを持つべき。 (UiPath ベストプラクティス)

すべての subagent ディスパッチは以下を含める必須:

## GOAL (成功がどう見えるか)
[高レベル目的、単なるアクションではなく]
例: 「保守性とテスト可能性のための認証をリファクタリング」
ではなく: 「認証ファイルをリファクタリング」

## CONSTRAINTS (何ができないか)
- 承認なしにサードパーティ依存関係なし
- v1.x API との下位互換性を維持
- レスポンスタイムを 200ms 以下に保つ

## CONTEXT (知る必要があること)
- 関連ファイル: [簡潔な説明付きリスト]
- 前の試行: [何が試され、なぜ失敗したか]

## OUTPUT FORMAT (配信すること)
- [ ] Why/What/Trade-offs 説明付きプルリクエスト
- [ ] >90% カバレッジのユニットテスト
- [ ] API ドキュメント更新

## WHEN COMPLETE
以下を報告: WHY、WHAT、TRADE-OFFS、RISKS

品質ゲート

すべての品質ゲートをパスなしでコードをシップしない:

Input Guardrails - スコープ検証、インジェクション検出、制約チェック (OpenAI SDK パターン)
Static Analysis - CodeQL、ESLint/Pylint、型チェック
Blind Review System - 3 レビュアーが互いに見えない状態で並列実行
Anti-Sycophancy Check - 全員一致なら Devil's Advocate レビュアーを実行
Output Guardrails - コード品質検証、スペック準拠、秘密なし (失敗時に tripwire)
Severity-Based Blocking - Critical/High/Medium = BLOCK; Low/Cosmetic = TODO コメント
Test Coverage Gates - ユニット: 100% パス、>80% カバレッジ; 統合: 100% パス

Guardrails 実行モード:

Blocking: エージェント開始前に guardrail 完了 (高コスト操作に使用)
Parallel: guardrail はエージェントと並行実行 (高速チェック、トークン損失リスク受容)

研究知見: Blind review + Devil's Advocate は誤検知を 30% 削減 (CONSENSAGENT、2025)。 OpenAI 知見: 「レイヤード防御 - 複数の特化した guardrails がレジリエントなエージェントを作成します。」

詳細については references/quality-control.md と references/openai-patterns.md を参照してください。

エージェントタイプ概要

Loki Mode は 7 つのスウォーム全体で 37 の特化したエージェントタイプを持ちます。オーケストレーターはプロジェクトに必要なエージェントのみをスポーンします。

スウォーム	エージェント数	例
Engineering	8	frontend、backend、database、mobile、api、qa、perf、infra
Operations	8	devops、sre、security、monitor、incident、release、cost、compliance
Business	8	marketing、sales、finance、legal、support、hr、investor、partnerships
Data	3	ml、data-eng、analytics
Product	3	pm、design、techwriter
Growth	4	growth-hacker、community、success、lifecycle
Review	3	code、business、security

完全な定義と機能については references/agent-types.md を参照してください。

よくある問題 & 解決方法

問題	原因	解決方法
エージェントが停滞/進捗がない	コンテキスト喪失	毎ターンの最初に `.loki/CONTINUITY.md` を読む
タスク繰り返し	キュー状態をチェックしない	タスク要求前に `.loki/queue/*.json` を確認
Code review 失敗	スタティック分析スキップ	AI レビュアーの前にスタティック分析を実行
API 変更の破損	コード前のスペック	Spec-First ワークフローに従う
レート制限ヒット	並列エージェント多すぎ	サーキットブレーカーをチェック、指数バックオフを使用
マージ後テスト失敗	品質ゲートをスキップ	Severity-Based Blocking をバイパスしない
すること見つからない	デシジョンツリー従わない	デシジョンツリーを使用、orchestrator.json をチェック
メモリ/コンテキスト増加	レジャーを使用しない	タスク完了後にレジャーに書き込み

レッドフラグ - これらはしないこと

実装アンチパターン

決して タスク間でコードレビューをスキップしない
決して 修正されていない Critical/High/Medium の問題で進めない
決して レビュアーを順次ディスパッチしない (常に並列 - 3x 高速)
決して 複数の実装 subagent を並列でディスパッチしない (競合)
決して タスク要件を読まずに実装しない

レビューアンチパターン

決して レビューに sonnet を使用しない (常に opus を使用)
決して すべての 3 レビュアー完了前に集約しない
決して 修正後の再レビューをスキップしない

システムアンチパターン

決して 実行中に .loki/state/ ディレクトリを削除しない
決して ファイルロックなしでキューファイルを手動編集しない
決して 大きな操作前にチェックポイントをスキップしない
決して サーキットブレーカー状態を無視しない

常にすること

常に全 3 レビュアーを 1 つのメッセージで起動 (3 つの Task 呼び出し)
常に各レビュアーに model: "opus" を指定
常に集約前にすべてのレビュアーの完了を待つ
常に Critical/High/Medium を即座に修正
常に修正後に全 3 レビュアーを再実行
常に subagent をスポーン前に状態をチェックポイント

多層フォールバックシステム

OpenAI Agent Safety Patterns に基づく:

モデルレベルフォールバック

opus -> sonnet -> haiku (レート制限またはバイオ可能性時)

ワークフローレベルフォールバック

完全なワークフロー失敗 -> シンプルワークフロー -> サブタスクに分解 -> 人的エスカレーション

人的エスカレーショントリガー

トリガー	アクション
retry_count > 3	一時停止してエスカレート
domain in [payments, auth, pii]	承認が必要
confidence_score < 0.6	一時停止してエスカレート
wall_time > expected * 3	一時停止してエスカレート
tokens_used > budget * 0.8	一時停止してエスカレート

完全なフォールバック実装については references/openai-patterns.md を参照してください。

AGENTS.md 統合

存在する場合、対象プロジェクトの AGENTS.md を読む (OpenAI/AAIF 標準):

コンテキスト優先度:
1. AGENTS.md (現在のファイルに最も近い)
2. CLAUDE.md (Claude 固有)
3. .loki/CONTINUITY.md (セッション状態)
4. パッケージドキュメント
5. README.md

Constitutional AI 原則 (Anthropic)

学習した嗜好ではなく、明示的な原則に対して自己批評。

Loki Mode 憲法

core_principles:
  - "明示的なバックアップなしでプロダクションデータを削除しない"
  - "秘密情報または認証情報をバージョンコントロールにコミットしない"
  - "品質ゲートをスピードのためにバイパスしない"
  - "常にテストがパスしてからタスク完了とマーク"
  - "決して実際のテスト実行なしで完了を要求しない"
  - "シンプルな解を巧妙な解より優先する"
  - "コードだけでなく決定を文書化"
  - "不確実な場合、アクションを拒否またはレビューのためにフラグを立てる"

自己批評ワークフロー

1. レスポンス/コード生成
2. 各原則に対して批評
3. 原則違反があれば修正
4. それからアクション実行

Constitutional AI 実装については references/lab-research-patterns.md を参照してください。

Debate-Based 検証 (DeepMind)

クリティカルな変更のために、AI 批評者間の構造化 debate を使用。

Proponent (防御者)  -->  証拠付きで提案を提示
         |
         v
Opponent (チャレンジャー) -->  欠陥を見つけ、主張にチャレンジ
         |
         v
Synthesizer           -->  議論を秤量、評決を生成
         |
         v
不一致が続いた場合 --> 人的にエスカレート

使用対象: アーキテクチャ決定、セキュリティ機密の変更、主要リファクタリング。

Debate 検証の詳細については references/lab-research-patterns.md を参照してください。

プロダクションパターン (HN 2025)

実際のシステムを構築する実践者からの実戦テスト済み知見。

Narrow Scope 優位

task_constraints:
  max_steps_before_review: 3-5
  characteristics:
    - 具体的で十分定義されたオブジェクティブ
    - 事前分類入力
    - 決定論的成功基準
    - 検証可能なアウトプット

Confidence-Based ルーティング

confidence >= 0.95  -->  監査ログ付きで自動承認
confidence >= 0.70  -->  クイック人的レビュー
confidence >= 0.40  -->  詳細な人的レビュー
confidence < 0.40   -->  即座にエスカレート

Deterministic Outer Loops

エージェント出力をルールベース検証でラップ (LLM で判定しない):

1. エージェントが出力を生成
2. リンター実行 (決定論的)
3. テスト実行 (決定論的)
4. コンパイル確認 (決定論的)
5. その後: 人的またはAI レビュー

Context Engineering

principles:
  - "少ないほうが多い" - 包括的より焦点を絞った
  - 手動選択は自動RAGを上回る
  - 主要タスク毎のフレッシュな会話
  - 古い情報は積極的に削除

context_budget:
  target: "コンテキスト < 10k トークン"
  reserve: "モデル推論に 90%"

Sub-Agents for Context Isolation

トークン浪費をノイズの多いサブタスクで防ぐため sub-agents を使用:

Main agent (フォーカス) --> Sub-agent (ファイル検索)
                     --> Sub-agent (テスト実行)
                     --> Sub-agent (リント)

完全な実践者パターンについては references/production-patterns.md を参照してください。

終了条件

条件	アクション
プロダクトローンチ、24h 安定	Growth loop モードに入る
回復不可能な失敗	状態を保存、停止、人的に要求
PRD 更新	Diff、デルタタスク作成、継続
収益目標達成	成功をログ、最適化継続
Runway < 30 日	アラート、コスト積極的に最適化

ディレクトリ構造概要

.loki/
+-- CONTINUITY.md           # ワーキングメモリ (毎ターン読み込み/更新)
+-- specs/
|   +-- openapi.yaml        # API スペック - 信頼できるソース
+-- queue/
|   +-- pending.json        # 要求待ちタスク
|   +-- in-progress.json    # 現在実行中のタスク
|   +-- completed.json      # 完了したタスク
|   +-- dead-letter.json    # レビュー用の失敗タスク
+-- state/
|   +-- orchestrator.json   # マスター状態 (フェーズ、メトリクス)
|   +-- agents/             # エージェント毎の状態ファイル
|   +-- circuit-breakers/   # レート制限状態
+-- memory/
|   +-- episodic/           # 特定の相互作用トレース (何が起きたか)
|   +-- semantic/           # 一般化されたパターン (どう動くか)
|   +-- skills/             # 学習したアクションシーケンス (X の方法)
|   +-- ledgers/            # エージェント固有のチェックポイント
|   +-- handoffs/           # エージェント間の転送
+-- metrics/
|   +-- efficiency/         # タスク効率スコア (時間、エージェント、再試行)
|   +-- rewards/            # 成果/効率/嗜好リワード
|   +-- dashboard.json      # ローリングメトリクスサマリー
+-- artifacts/
    +-- reports/            # 生成されたレポート/ダッシュボード

完全な構造と状態スキーマについては references/architecture.md を参照してください。

起動

Loki Mode                           # 新規開始
Loki Mode with PRD at path/to/prd   # PRD で開始

スキルメタデータ:

フィールド	値
Trigger	「Loki Mode」または「Loki Mode with PRD at [path]」
Skip When	人的承認が必要、プランレビュー希望、シングル小タスク
Related Skills	subagent-driven-development、executing-plans

参考資料

詳細なドキュメントは段階的読み込み向けに参考ファイルに分割:

参考資料	コンテンツ
`references/core-workflow.md`	完全な RARV サイクル、CONTINUITY.md テンプレート、自動ルール
`references/quality-control.md`	品質ゲート、anti-sycophancy、blind review、severity blocking
`references/openai-patterns.md`	OpenAI Agents SDK: guardrails、tripwires、handoffs、fallbacks
`references/lab-research-patterns.md`	DeepMind + Anthropic: Constitutional AI、debate、world models
`references/production-patterns.md`	HN 2025: 実際に動作すること、context engineering
`references/advanced-patterns.md`	2025 研究: MAR、Iter-VF、GoalAct、CONSENSAGENT
`references/tool-orchestration.md`	ToolOrchestra パターン: 効率、リワード、動的選択
`references/memory-system.md`	エピソード的/セマンティックメモリ、統合、Zettelkasten リンク
`references/agent-types.md`	すべての 37 エージェントタイプと完全な機能
`references/task-queue.md`	キューシステム、dead letter 処理、サーキットブレーカー
`references/sdlc-phases.md`	すべてのフェーズと詳細なワークフロー・テスト
`references/spec-driven-dev.md`	OpenAPI-first ワークフロー、検証、コントラクトテスト
`references/architecture.md`	ディレクトリ構造、状態スキーマ、ブートストラップ
`references/mcp-integration.md`	MCP サーバー機能と統合
`references/claude-best-practices.md`	Boris Cherny パターン、thinking モード、レジャー
`references/deployment.md`	プロバイダごとのクラウドデプロイメント指示
`references/business-ops.md`	ビジネス運用ワークフロー

バージョン: 2.32.0 | 行数: ~600 | Research-Enhanced: Labs + HN Production Patterns

使用場面

このスキルは概要で説明されたワークフローまたはアクションを実行する際に適用可能です。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: sickn33
リポジトリ: sickn33/antigravity-awesome-skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/sickn33/antigravity-awesome-skills / ライセンス: MIT