airunway-aks-setup
AKSクラスター上にAI Runwayを構築し、モデルを稼働させるまでの一連のセットアップを自動化します。クラスターの検証、コントローラーのインストール、GPUの評価、プロバイダー設定、初回デプロイまでをカバーします。「AI Runwayをセットアップしたい」「AKSクラスターにモデルをデプロイしたい」「AKS上でLLMやvLLMを動かしたい」といった場面でご利用ください。
description の原文を見る
Set up AI Runway on AKS — from bare cluster to running model. Covers cluster verification, controller install, GPU assessment, provider setup, and first deployment. WHEN: \"setup AI Runway\", \"onboard AKS cluster\", \"install AI Runway\", \"airunway setup\", \"deploy model to AKS\", \"GPU inference on AKS\", \"KAITO setup on AKS\", \"run LLM on AKS\", \"vLLM on AKS\", \"set up model serving on AKS\", \"AI Runway controller\".
SKILL.md 本文
AI Runway AKS セットアップ
このスキルは、ベアメタルの Kubernetes クラスタから実行中の AI モデルデプロイメントまで、ユーザーを段階的に進めます。ユーザーが skip-to-step N で特定のフェーズから再開する場合を除き、各ステップを順序通りに実行してください。
コスト意識: GPU ノードプールは大きなコンピュート料金が発生します (A100-80GB は 1 時間あたり $3~5 以上)。GPU リソースをプロビジョニングする前に、ユーザーがコスト上の影響を理解していることを確認してください。
前提条件
このスキルは、AKS クラスタが既に存在していることを想定しています。ユーザーがクラスタを持っていない場合は、まず azure-kubernetes スキルにハンドオフして (GPU ノードプールを使用してプロビジョニング。CPU のみの推論が許容される場合を除く)、その後ここに戻ります。
クイックリファレンス
| プロパティ | 値 |
|---|---|
| 最適な用途 | AKS 上の AI Runway のエンドツーエンドオンボーディング |
| CLI ツール | kubectl, make, curl |
| MCP ツール | なし |
| 関連スキル | azure-kubernetes (クラスタセットアップ)、azure-diagnostics (トラブルシューティング) |
このスキルをいつ使用するか
ユーザーが以下を望む場合に、このスキルを使用してください:
- 既存の AKS クラスタ上で、ゼロから AI Runway をセットアップする
- AI Runway コントローラーと CRD をインストールする
- モデルデプロイメント用の GPU ハードウェア互換性を評価する
- 推論プロバイダー (KAITO、Dynamo、KubeRay) を選択してインストールする
- 最初の AI モデルを AI Runway 経由で AKS にデプロイする
- 部分的に完了した AI Runway セットアップを特定のステップから再開する
MCP ツール
このスキルは MCP ツールを使用しません。すべてのクラスタ操作は kubectl と make 経由で直接実行されます。
ルール
- ステップを順序通りに実行してください。各ステップに到達したら、そのステップのリファレンスを読み込んでください
- 各ステップでクラスタ状態を報告してください:✓ 健全、✗ 不足/失敗
- インストールまたはデプロイメント動作の前に、ユーザーの確認を求めてください
- ステップが既に完了している場合は、ステータスを報告して次のステップに進んでください
- ユーザーが
skip-to-step Nを指定した場合、ステップ N から開始してください。先行するステップは完了していると仮定してください
ステップ
| # | ステップ | リファレンス |
|---|---|---|
| 1 | クラスタ検証 — コンテキスト確認、ノードインベントリ、GPU 検出 | step-1-verify.md |
| 2 | コントローラーインストール — CRD + コントローラーデプロイメント | step-2-controller.md |
| 3 | GPU 評価 — GPU モデル検出、dtype/attention 制約のフラグ | step-3-gpu.md |
| 4 | プロバイダーセットアップ — 推論プロバイダーの推奨とインストール | step-4-provider.md |
| 5 | 初回デプロイメント — モデルを選択、デプロイ、Ready を検証 | step-5-deploy.md |
| 6 | サマリー — 概要、スモークテスト、次のステップ | step-6-summary.md |
エラー処理
| エラー/症状 | 考えられる原因 | 対策 |
|---|---|---|
| kubeconfig コンテキストなし | クラスタに接続されていない | az aks get-credentials または同等のコマンドを実行 |
| コントローラーが CrashLoopBackOff | 設定または RBAC の問題 | kubectl logs -n airunway-system -l control-plane=controller-manager --previous |
| プロバイダーが Ready ではない | イメージプルまたは RBAC の問題 | プロバイダーポッドの kubectl logs <pod-name> -n <namespace> を確認 |
| ModelDeployment が Pending のままである | GPU スケジューリング失敗またはプロバイダーが Ready でない | kubectl describe modeldeployment <name> -n <namespace> イベントを確認 |
推論時の bfloat16 エラー | T4 または V100 が bfloat16 をサポートしていない | serving args に --dtype float16 を追加 |
完全なエラー処理とロールバック手順については、troubleshooting.md を参照してください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- microsoft
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/microsoft/azure-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。