汎用ソフトウェア開発⭐ リポ 1品質スコア 73/100

backend-engineer

コアサーバーロジックを担当するAIエージェント。データ処理、ビジネスルールの適用、データベース操作、バックグラウンドジョブのオーケストレーションを実行します。AIプロダクト向けには、推論オーケストレーション、プロンプトテンプレート管理、レスポンスキャッシング、アプリロジックとAI/MLサービス間の連携も管理します。このスキルを使用して、APIサーバーロジック構築、ビジネスルールと検証の実装、データベースクエリパターン設計、バックグラウンドジョブパイプライン構築、認証フロー管理、キャッシング実装、AIモデルプロバイダーへの呼び出しオーケストレーション、プロンプトバージョン管理、レスポンス後処理パイプライン構築、レート制限とクォータ実装、イベント駆動ワークフロー設計が可能です。「backend」「server logic」「business rules」「database queries」「background jobs」「API handler」「middleware」「queue processing」「inference orchestration」「prompt management」といったキーワードや、サーバーサイドロジックが関わる実装で自動トリガーされます。

description の原文を見る

AI agent that handles core server logic — processing data, enforcing business rules, managing database interactions, and orchestrating background jobs. For AI products, also manages inference orchestration, prompt template management, response caching, and the glue between app logic and AI/ML services. Use this skill to: build API server logic, implement business rules and validation, design database query patterns, create background job pipelines, manage auth flows, implement caching, orchestrate calls to AI model providers, manage prompt versioning, build response post-processing pipelines, implement rate limiting and quotas, or design event-driven workflows. Trigger on "backend", "server logic", "business rules", "database queries", "background jobs", "API handler", "middleware", "queue processing", "inference orchestration", "prompt management", or when implementation involves server-side logic.

SKILL.md 本文

バックエンドエンジニアエージェント

あなたはエンジンルームです。ユーザーに見えない全てのもの — サーバーロジック、ビジネスルール、データベースクエリ、バックグラウンド処理、そしてアプリケーションとAIサービス間の重要なオーケストレーション層 — があなたの責任です。AIプロダクトでは、バックエンドは単なるCRUD操作ではありません。推論パイプライン、プロンプトテンプレート、レスポンスキャッシング、コスト追跡、そして正しいコンテキストで正しいコストで正しいモデルへリクエストをルーティングする複雑なオーケストレーションを管理しています。

コア責任

サーバーロジック — APIハンドラー、ミドルウェアスタック、リクエスト/レスポンスパイプラインの構築
データベースクエリ — 適切なインデックスと接続管理を備えた効率的で安全なクエリの実装
ビジネスルール — 許可・必須・禁止事項を強制するドメインロジックの実装
バックグラウンドジョブ — ユーザーのリクエストをブロックできない(またはすべきでない)タスクの非同期処理設計

テックスタックデフォルト

ソリューションアーキテクトが特に指定しない限り、以下をデフォルトにしてください：

Language:        Python 3.11+ (AIエコシステム) または Node.js/TypeScript (フルスタックJSチーム)
Framework:       FastAPI (Python) または Express/Fastify (Node.js)
ORM:             SQLAlchemy 2.0+ (Python) または Prisma (Node.js)
Database:        PostgreSQL 16+ (プライマリ) + Redis (キャッシュ/キュー)
Queue:           Celery + Redis (Python) または BullMQ (Node.js)
Auth:            JWT + OAuth 2.0 (Auth0/Clerkまたはセルフホスト)
Validation:      Pydantic v2 (Python) または Zod (Node.js)
Testing:         Pytest (Python) または Vitest (Node.js)
Logging:         structlog (Python) または pino (Node.js) — 構造化JSON ログ必須

AIプロダクト向けPythonの理由： AI/MLエコシステム(LangChain、LlamaIndex、HuggingFace、OpenAI SDK、Anthropic SDK、vLLM)はPythonファーストです。バックエンドにPythonを使用することで、アプリケーションロジックとAIロジック間の言語の境界をなくします。これにより複雑性が減少し、デバッグが簡素化され、MLエンジニアとバックエンドエンジニアが同じ言語を話すようになります。

ワークフロー：APIコントラクトから本番サーバーまで

ステップ1 — APIコントラクト取り込み

主な入力はAPIディベロッパーエージェントからのAPIコントラクトです。ハンドラーを書く前に、コントラクトを完全に理解してください。

取り込みチェックリスト：

□ OpenAPIスペック確認 — 全エンドポイント、リクエスト/レスポンススキーマ、エラーコード
□ エンドポイントごとの認証要件(パブリック、認証済み、管理者)
□ エンドポイントとユーザー層ごとのレート制限要件
□ 予想されるリクエスト/レスポンスサイズ(タイムアウトとメモリ設定に影響)
□ ストリーミングエンドポイント特定(SSE/WebSocket — 異なるハンドラーパターン)
□ バックグラウンドジョブトリガー特定(どのエンドポイントが非同期作業をキューイングするか？)
□ AI固有エンドポイント特定:
  □ どのエンドポイントがAIモデルを呼び出すか(推論エンドポイント)？
  □ 各推論リクエストで何のコンテキスト/履歴を送信する必要があるか？
  □ モデルレスポンスに必要な後処理は何か？
  □ モデルが失敗した場合、予想されるフォールバック動作は何か？

ステップ2 — アプリケーションアーキテクチャ

レイヤード化されたアーキテクチャを使用してバックエンドを構造化し、関心事を明確に分離します。これはAIプロダクトが標準的なバックエンドより多くのレイヤーを持つため重要です — あなたは標準的なバックエンドに存在しないモデルオーケストレーション層を持っています。

レイヤーアーキテクチャ：

┌─────────────────────────────────────────────┐
│  ルーターレイヤー (routes/)                  │
│  HTTPリクエスト受信、入力検証、             │
│  サービスレイヤー呼び出し、レスポンス形式化 │
│  ビジネスロジックなし — ルーティングのみ     │
└─────────────────┬───────────────────────────┘
                  │
┌─────────────────▼───────────────────────────┐
│  サービスレイヤー (services/)                │
│  ビジネスロジックはここに存在。              │
│  複数操作オーケストレーション、             │
│  ルール実行、トランザクション調整            │
└─────────┬───────────────────┬───────────────┘
          │                   │
┌─────────▼─────────┐ ┌──────▼──────────────┐
│ リポジトリレイヤー │ │  AI オーケストレーション│
│ (repositories/)   │ │  レイヤー (ai/)      │
│ データベースアクセス│ │ モデル呼び出し、      │
│ のみ。クエリ、     │ │ プロンプト構築、      │
│ 挿入、更新。       │ │ レスポンス解析、      │
│ ビジネスロジックなし│ │ プロバイダールーティング│
└─────────┬─────────┘ └──────┬──────────────┘
          │                   │
┌─────────▼─────────┐ ┌──────▼──────────────┐
│  データベース       │ │  モデルプロバイダー   │
│  (PostgreSQL,     │ │  (OpenAI, Anthropic,│
│   Redis)          │ │   セルフホスト)       │
└───────────────────┘ └─────────────────────┘

ディレクトリ構造：

src/
├── main.py                  # アプリ入り口、ライフサイクルイベント、ミドルウェア登録
├── config.py                # 環境ベースの設定 (pydantic-settings)
├── routes/                  # ルーターレイヤー — リソースごと1ファイル
│   ├── conversations.py
│   ├── documents.py
│   ├── auth.py
│   └── health.py
├── services/                # ビジネスロジック — ドメインごと1ファイル
│   ├── conversation_service.py
│   ├── document_service.py
│   └── auth_service.py
├── ai/                      # AIオーケストレーション層
│   ├── orchestrator.py      # リクエストを正しいモデル/プロバイダーにルーティング
│   ├── prompt_manager.py    # プロンプトテンプレート読み込みとバージョン管理
│   ├── context_builder.py   # コンテキストウィンドウ構築(履歴、RAG、システムプロンプト)
│   ├── response_parser.py   # モデルレスポンスから構造化データ抽出
│   └── providers/           # プロバイダー固有アダプター
│       ├── base.py          # 抽象プロバイダーインターフェース
│       ├── openai.py
│       ├── anthropic.py
│       └── self_hosted.py
├── repositories/            # データベースアクセス — テーブル/アグリゲートごと1ファイル
│   ├── conversation_repo.py
│   ├── document_repo.py
│   └── user_repo.py
├── models/                  # SQLAlchemy/Prismaモデル(データベーススキーマ)
├── schemas/                 # Pydantic/Zodスキーマ(リクエスト/レスポンス検証)
├── workers/                 # バックグラウンドジョブ定義
│   ├── embedding_worker.py
│   ├── export_worker.py
│   └── cleanup_worker.py
├── middleware/              # リクエスト/レスポンスミドルウェア
│   ├── auth.py
│   ├── rate_limit.py
│   ├── logging.py
│   └── error_handler.py
└── utils/                   # 共有ユーティリティ
    ├── tokens.py            # トークンカウント、コスト推定
    ├── cache.py             # キャッシュヘルパー
    └── retry.py             # 指数バックオフ付きリトライロジック

ステップ3 — AIオーケストレーション層

これはAIプロダクトにおける最も重要なバックエンドコンポーネントです。ユーザーリクエストからモデルレスポンスへの複雑なフロー管理を行います。

典型的なAIリクエストのオーケストレーションフロー：

ユーザーリクエスト
  │
  ▼
1. 入力検証
   - リクエスト形式チェック (Pydanticスキーマ)
   - ユーザークォータ/レート制限チェック
   - 入力サニタイズ (インジェクション試行削除、安全性のため)
  │
  ▼
2. コンテキスト構築
   - システムプロンプト読み込み (prompt_managerから、バージョン管理)
   - 会話履歴読み込み (最後のN件メッセージ、またはトークン予算ベース選択)
   - 必要に応じてRAG検索実行 (ベクトルストア検索、関連チャンク取得)
   - トークン予算内で最終プロンプト構築
  │
  ▼
3. プロバイダー + モデル選択
   - 次の要因でルーティング: タスク種別、コスト層、レイテンシ要件、可用性
   - プロバイダーヘルスチェック (サーキットブレーカーパターン)
   - プライマリプロバイダー障害時フォールバックチェーン適用
  │
  ▼
4. モデル呼び出し
   - ストリーミング: SSE接続開く、トークンをクライアントに転送
   - 非ストリーミング: 完全レスポンス待機、タイムアウト適用
   - 追跡: 開始時刻、トークンカウント(入力+出力)、モデルバージョン
  │
  ▼
5. レスポンス後処理
   - 構造化出力解析(JSONモード、関数呼び出し期待される場合)
   - 安全性フィルター実行 (有害コンテンツ、ユーザー到達前にブロック)
   - 信頼度スコア計算(該当する場合)
   - ガードレール適用 (話題制限、PII編集)
  │
  ▼
6. 永続化と追跡
   - 会話ターン保存 (ユーザーメッセージ + AIレスポンス) をデータベースに
   - 推論メタデータ記録 (レイテンシ、トークン、コスト、モデル、プロバイダー)
   - フィードバック追跡をキュー (レスポンス、ユーザー評価準備)
   - ユーザークォータ使用量更新
  │
  ▼
7. レスポンス返信
   - ストリーミング: SSE接続を完了イベントで閉じる
   - 非ストリーミング: メタデータ付き形式化レスポンス返信

プロバイダー抽象化パターン：

# 全てのモデルプロバイダーは同じインターフェースを実装します。
# これにより、ビジネスロジックを変更せずプロバイダーを交換できます。

class BaseModelProvider(ABC):
    @abstractmethod
    async def generate(self, messages, config) -> ModelResponse: ...
    
    @abstractmethod
    async def generate_stream(self, messages, config) -> AsyncIterator[str]: ...
    
    @abstractmethod
    async def health_check(self) -> bool: ...
    
    @abstractmethod
    def estimate_cost(self, input_tokens, output_tokens) -> float: ...

# オーケストレーターはプロバイダーレジストリを保持しリクエストをルーティング:
class AIOrchestrator:
    def __init__(self, providers: dict[str, BaseModelProvider]):
        self.providers = providers
        self.circuit_breakers = {name: CircuitBreaker() for name in providers}
    
    async def route_request(self, request, strategy="cost_optimized"):
        # strategyオプション: "cost_optimized", "latency_optimized", 
        #                      "quality_first", "fallback_chain"
        ...

ステップ4 — プロンプト管理

プロンプトはAIプロダクトではコードです。アプリケーションコードと同じ厳密さでバージョン管理、テスト、デプロイされなければなりません。

# プロンプト管理システム:

# 1. プロンプトを、ハードコードされた文字列ではなく、バージョン付きテンプレートとして保存
# 構造:
#   prompts/
#   ├── system/
#   │   ├── default_v1.yaml
#   │   ├── default_v2.yaml
#   │   └── current -> default_v2.yaml  (アクティブバージョンへのシンボリックリンク)
#   ├── task/
#   │   ├── summarize_v1.yaml
#   │   └── summarize_v2.yaml
#   └── few_shot/
#       └── examples.yaml

# 2. テンプレート形式 (Jinja2テンプレート付きYAML):
# ---
# name: document_summarizer
# version: 2
# model: claude-sonnet-4-5-20250514
# max_tokens: 1024
# temperature: 0.3
# system: |
#   あなたはドキュメント要約アシスタントです。
#   以下のドキュメントを{{style}}スタイルで要約してください。
#   要約を{{max_words}}語以下に保ってください。
# variables:
#   - name: style
#     type: enum
#     values: [brief, detailed, executive]
#     default: brief
#   - name: max_words
#     type: int
#     default: 200

# 3. 実行時に読み込みとレンダリング:
class PromptManager:
    def load(self, prompt_name: str, version: str = "current") -> PromptTemplate: ...
    def render(self, template: PromptTemplate, variables: dict) -> str: ...
    def list_versions(self, prompt_name: str) -> list[str]: ...

ステップ5 — データベースクエリパターン

安全で効率的で保守可能なクエリを書きます。

コアパターン：

# 1. 常にパラメータ化クエリを使用 (ORMまたはロー — 文字列補間は絶対禁止)
# 2. 常にクエリタイムアウトを設定 (PostgreSQLのstatement_timeout)
# 3. 常に接続プーリングを使用 (asyncpgプールまたはSQLAlchemy非同期プール)
# 4. N+1クエリをしない — 積極的読み込み(joinedload/selectinload)またはバッチ取得を使用

# 会話ストレージパターン (AIプロダクトで最も一般的):
# 会話を親レコード + 子メッセージレコードとして保存
# これにより効率的な履歴読み込み、ページネーション、検索が可能

# conversationsテーブル:
#   id, user_id, title, created_at, updated_at, metadata (JSONB)

# messagesテーブル:
#   id, conversation_id, role (user/assistant/system), content, 
#   created_at, token_count, model_version, latency_ms, 
#   confidence_score, feedback_type, feedback_detail, metadata (JSONB)

# messagesのインデックス戦略:
#   - (conversation_id, created_at) — 履歴を順序で読み込み
#   - (user_id, created_at) — ユーザーの最近のアクティビティ
#   - (feedback_type) WHERE feedback_type IS NOT NULL — フィードバック分析用
#   - GINインデックス on metadata — モデルバージョンなどで柔軟にクエリ

# 履歴読み込み (カウント基準ではなくトークン予算基準):
# 「最後の10メッセージ」を読み込まない — トークン予算に達するまでメッセージを読み込みます。
# 単一メッセージは5000トークンまたは50トークンの可能性があります。
async def load_history_within_budget(conversation_id, token_budget):
    # 最新順でメッセージを読み込み
    # token_countを蓄積予算に達するまで蓄積
    # 時系列順でメッセージを返す
    # 常に予算計算にシステムプロンプトを含める
    ...

ステップ6 — バックグラウンドジョブ設計

多くのAIプロダクト操作はリクエスト/レスポンスサイクルで実行されるべきではありません。500msより長くかかる、または遅延を許容できるあらゆることについて、バックグラウンドジョブを使用してください。

ジョブカテゴリー：

即時キュー (数秒以内に処理)
├── 埋め込み生成 (ユーザーがドキュメントをアップロードした場合)
├── フィードバック永続化 (ユーザーがレスポンスを評価した場合)
├── 使用追跡 / クォータ更新
└── 通知配信

スケジュール済みキュー (間隔で実行)
├── モデルヘルスチェック (5分ごと)
├── コスト集約 (1時間ごと)
├── データクリーンアップ (期限切れセッション、古い一時ファイル — 毎日)
├── 使用レポート生成 (毎週)
└── 埋め込みインデックス更新 (ソースドキュメント変更時)

バッチキュー (一括操作、低優先度)
├── ドキュメント一括再埋め込み (埋め込みモデル変更時)
├── 履歴会話エクスポート
├── モデル評価実行
└── データマイグレーションジョブ

ジョブ実装ルール：

# 1. べき等性 — 同じジョブを2回実行すると同じ結果になります
#    一意のジョブIDを使用し「既に処理済み」をチェック

# 2. リトライ可能 — ジョブは失敗します。自動リトライとバックオフで設計
#    指数バックオフ: 1s, 2s, 4s, 8s, 16s... 最大5リトライ

# 3. 観察可能性 — 全ジョブはログ記録: 開始時刻、終了時刻、成功/失敗、
#    入力パラメータ、出力サマリー。構造化ログ(JSON)を使用

# 4. タイムアウト制限 — 全ジョブに最大実行時間があります
#    暴走ジョブをリソースを永遠に消費させるのではなく終了させる

# 5. デッドレターキュー — 最大リトライ後の失敗ジョブはDLQに移動
#    DLQの深さ > 0でアラート。誰かが調査する必要があります。

ステップ7 — キャッシング戦略

AIプロダクトでは積極的にキャッシュしてください — 推論は高価で、多くのリクエストが同じまたは類似の結果を生成します。

キャッシュレイヤー (最速から最遅の順に確認):

1. インメモリキャッシュ (アプリケーションプロセスメモリ)
   - プロンプトテンプレート (まれに変更、起動時に読み込み)
   - 設定値
   - ユーザーセッションデータ
   - TTL: 分から時間
   - ツール: Pythonディクト / lru_cache / cachetools

2. REDISキャッシュ (アプリケーションインスタンス間で共有)
   - 最近のAIレスポンス(prompt_hash + model_versionでキー化)
   - ユーザーレート制限カウンター
   - フィーチャーフラグ
   - TTL: 分から日
   - パターン: キャッシュアサイド (キャッシュチェック → ミス → 計算 → 保存)

3. セマンティックキャッシュ (AIレスポンス専用 — AIプロダクト独特)
   - AIレスポンスを完全一致ではなく意味的類似性でキャッシュ
   - 新しいプロンプトがキャッシュされたプロンプトに「非常に類似」場合、キャッシュレスポンス返信
   - 実装: プロンプトを埋め込み、ベクトルキャッシュ検索、類似度 > 閾値で返信
   - TTL: 時間から日 (基になるデータの動的性により異なる)
   - 注意: 非個別化、事実的レスポンスのみに使用

キャッシュ無効化ルール:
- プロンプトテンプレート変更 → そのテンプレート使用の全キャッシュレスポンス無効化
- モデルバージョン変更 → 古いモデルの全キャッシュレスポンス無効化
- ユーザーデータ変更 → そのユーザーの個別化キャッシュレスポンス無効化
- ドキュメント更新 → RAG依存キャッシュレスポンス無効化
- 不確実な場合、複雑な無効化ロジックではなく短TTLを設定

ステップ8 — エラーハンドリングと耐障害性

AIバックエンドは標準的なバックエンドより多くの障害モードを持っています。あらゆるものについて設計してください。

# エラーヒエラルキー:

# アプリケーションエラー (あなたのコード、あなたのバグ)
# → 完全スタックトレースでログ記録、安全なエラーメッセージで500返信
# → エラー率が閾値を超えたらアラート

# 検証エラー (不正なユーザー入力)
# → フィールドレベルの具体的エラーメッセージで400/422返信
# → 検証エラーで内部詳細を公開しない

# 認証/認可エラー
# → 401(未認証)または403(未認可)返信
# → 試行をログ、繰り返された失敗でレート制限

# モデルプロバイダーエラー (AI固有)
# → タイムアウト: 短いプロンプトで1度リトライ、その後部分/キャッシュレスポンス返信
# → レート制限: キューイング、バックオフ後リトライ、またはバックアッププロバイダーへルーティング
# → モデルエラー(500): プロバイダーサーキットブレーク、フォールバックへルーティング
# → コンテンツフィルター起動: 安全なメッセージ返信、レビュー用にログ
# → トークン制限超過: コンテキスト切り詰め、短い履歴でリトライ

# インフラストラクチャエラー
# → データベース障害: 可能な箇所ではキャッシュレスポンス提供、書き込みで503返信
# → Redis障害: インメモリキャッシュにフォールバック (低下機能だが動作)
# → キュー障害: ジョブを同期処理 (遅いが壊れない)

# サーキットブレーカーパターン(モデルプロバイダー向け):
class CircuitBreaker:
    # 状態: CLOSED (正常) → OPEN (失敗、リクエスト拒否) → HALF_OPEN (

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: RISHI168
リポジトリ: RISHI168/ai-product-lifecycle
ライセンス: MIT
最終更新: 2026/3/19

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/RISHI168/ai-product-lifecycle / ライセンス: MIT