azure-aigateway
Azure API ManagementをAIゲートウェイとして設定し、AIモデル・MCPツール・エージェントを管理します。セマンティックキャッシュ、トークン制限、コンテンツセーフティ、負荷分散、AIモデルガバナンス、MCPレート制限、ジェイルブレイク検出、Azure OpenAIバックエンドの追加、AI Foundryモデルの追加、AIゲートウェイのテスト、LLMポリシー設定、トークンメトリクス、AIコスト管理、APIのMCP変換、OpenAPIのゲートウェイへのインポートなどの用途で活用できます。
description の原文を見る
Configure Azure API Management as an AI Gateway for AI models, MCP tools, and agents. WHEN: semantic caching, token limit, content safety, load balancing, AI model governance, MCP rate limiting, jailbreak detection, add Azure OpenAI backend, add AI Foundry model, test AI gateway, LLM policies, configure AI backend, token metrics, AI cost control, convert API to MCP, import OpenAPI to gateway.
SKILL.md 本文
Azure AI Gateway
Azure API Management (APIM) を AI Gateway として設定し、AI モデル、MCP ツール、およびエージェントのガバナンスを行います。
APIM をデプロイするには、azure-prepare スキルを使用してください。APIM デプロイメントガイドを参照してください。
このスキルを使用する時期
| カテゴリ | トリガー |
|---|---|
| モデルガバナンス | 「セマンティックキャッシング」、「トークン制限」、「AI の負荷分散」、「トークン使用量の追跡」 |
| ツールガバナンス | 「MCP のレート制限」、「ツールの保護」、「ツールの設定」、「API を MCP に変換」 |
| エージェントガバナンス | 「コンテンツセーフティ」、「ジェイルブレイク検出」、「有害なコンテンツのフィルタリング」 |
| 設定 | 「Azure OpenAI バックエンド を追加」、「モデルを設定」、「AI Foundry モデルを追加」 |
| テスト | 「AI Gateway をテスト」、「Gateway 経由で OpenAI を呼び出す」 |
クイックリファレンス
| ポリシー | 目的 | 詳細 |
|---|---|---|
azure-openai-token-limit | コスト管理 | モデルポリシー |
azure-openai-semantic-cache-lookup/store | 60-80% のコスト削減 | モデルポリシー |
azure-openai-emit-token-metric | 可視化 | モデルポリシー |
llm-content-safety | セーフティとコンプライアンス | エージェントポリシー |
rate-limit-by-key | MCP/ツール保護 | ツールポリシー |
Gateway の詳細を取得
# Gateway URL を取得
az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv
# バックエンド (AI モデル) をリスト表示
az apim backend list --service-name <apim-name> --resource-group <rg> \
--query "[].{id:name, url:url}" -o table
# サブスクリプションキーを取得
az apim subscription keys list \
--service-name <apim-name> --resource-group <rg> --subscription-id <sub-id>
AI エンドポイントをテスト
GATEWAY_URL=$(az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv)
curl -X POST "${GATEWAY_URL}/openai/deployments/<deployment>/chat/completions?api-version=2024-02-01" \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <key>" \
-d '{"messages": [{"role": "user", "content": "Hello"}], "max_tokens": 100}'
よくあるタスク
AI バックエンドを追加
詳細な手順は references/patterns.md を参照してください。
# AI リソースを検出
az cognitiveservices account list --query "[?kind=='OpenAI']" -o table
# バックエンドを作成
az apim backend create --service-name <apim> --resource-group <rg> \
--backend-id openai-backend --protocol http --url "https://<aoai>.openai.azure.com/openai"
# アクセス権を付与 (マネージド ID)
az role assignment create --assignee <apim-principal-id> \
--role "Cognitive Services User" --scope <aoai-resource-id>
AI ガバナンスポリシーを適用
<inbound> 内の推奨ポリシー順序:
- 認証 - バックエンドへのマネージド ID 認証
- セマンティックキャッシュルックアップ - AI 呼び出し前にキャッシュを確認
- トークン制限 - コスト管理
- コンテンツセーフティ - 有害なコンテンツをフィルタリング
- バックエンド選択 - 負荷分散
- メトリクス - トークン使用量追跡
完全な例は references/policies.md を参照してください。
トラブルシューティング
| 問題 | 解決策 |
|---|---|
| トークン制限 429 エラー | tokens-per-minute を増やすか負荷分散を追加 |
| キャッシュヒット なし | score-threshold を 0.7 に低下 |
| コンテンツの誤検知 | カテゴリのしきい値を増加 (5-6) |
| バックエンド認証 401 エラー | APIM に「Cognitive Services User」ロールを付与 |
詳細は references/troubleshooting.md を参照してください。
リファレンス
詳細ポリシー- 完全なポリシー例設定パターン- ステップバイステップのパターントラブルシューティング- よくある問題- AI-Gateway Samples
- GenAI Gateway ドキュメント
SDK クイックリファレンス
- Content Safety:
Python|TypeScript - API Management:
Python|.NET
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- microsoft
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/microsoft/azure-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。