Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

airunway-aks-setup

Name: airunway-aks-setup
Author: microsoft

AKSクラスター上にAI Runwayを構築し、モデルを稼働させるまでの一連のセットアップを自動化します。クラスターの検証、コントローラーのインストール、GPUの評価、プロバイダー設定、初回デプロイまでをカバーします。「AI Runwayをセットアップしたい」「AKSクラスターにモデルをデプロイしたい」「AKS上でLLMやvLLMを動かしたい」といった場面でご利用ください。

description の原文を見る

Set up AI Runway on AKS — from bare cluster to running model. Covers cluster verification, controller install, GPU assessment, provider setup, and first deployment. WHEN: \"setup AI Runway\", \"onboard AKS cluster\", \"install AI Runway\", \"airunway setup\", \"deploy model to AKS\", \"GPU inference on AKS\", \"KAITO setup on AKS\", \"run LLM on AKS\", \"vLLM on AKS\", \"set up model serving on AKS\", \"AI Runway controller\".

SKILL.md 本文

AI Runway AKS セットアップ

このスキルは、ベアメタルの Kubernetes クラスタから実行中の AI モデルデプロイメントまで、ユーザーを段階的に進めます。ユーザーが skip-to-step N で特定のフェーズから再開する場合を除き、各ステップを順序通りに実行してください。

コスト意識: GPU ノードプールは大きなコンピュート料金が発生します (A100-80GB は 1 時間あたり $3～5 以上)。GPU リソースをプロビジョニングする前に、ユーザーがコスト上の影響を理解していることを確認してください。

前提条件

このスキルは、AKS クラスタが既に存在していることを想定しています。ユーザーがクラスタを持っていない場合は、まず azure-kubernetes スキルにハンドオフして (GPU ノードプールを使用してプロビジョニング。CPU のみの推論が許容される場合を除く)、その後ここに戻ります。

クイックリファレンス

プロパティ	値
最適な用途	AKS 上の AI Runway のエンドツーエンドオンボーディング
CLI ツール	`kubectl`, `make`, `curl`
MCP ツール	なし
関連スキル	`azure-kubernetes` (クラスタセットアップ)、`azure-diagnostics` (トラブルシューティング)

このスキルをいつ使用するか

ユーザーが以下を望む場合に、このスキルを使用してください：

既存の AKS クラスタ上で、ゼロから AI Runway をセットアップする
AI Runway コントローラーと CRD をインストールする
モデルデプロイメント用の GPU ハードウェア互換性を評価する
推論プロバイダー (KAITO、Dynamo、KubeRay) を選択してインストールする
最初の AI モデルを AI Runway 経由で AKS にデプロイする
部分的に完了した AI Runway セットアップを特定のステップから再開する

MCP ツール

このスキルは MCP ツールを使用しません。すべてのクラスタ操作は kubectl と make 経由で直接実行されます。

ルール

ステップを順序通りに実行してください。各ステップに到達したら、そのステップのリファレンスを読み込んでください
各ステップでクラスタ状態を報告してください：✓ 健全、✗ 不足/失敗
インストールまたはデプロイメント動作の前に、ユーザーの確認を求めてください
ステップが既に完了している場合は、ステータスを報告して次のステップに進んでください
ユーザーが skip-to-step N を指定した場合、ステップ N から開始してください。先行するステップは完了していると仮定してください

ステップ

#	ステップ	リファレンス
1	クラスタ検証 — コンテキスト確認、ノードインベントリ、GPU 検出	`step-1-verify.md`
2	コントローラーインストール — CRD + コントローラーデプロイメント	`step-2-controller.md`
3	GPU 評価 — GPU モデル検出、dtype/attention 制約のフラグ	`step-3-gpu.md`
4	プロバイダーセットアップ — 推論プロバイダーの推奨とインストール	`step-4-provider.md`
5	初回デプロイメント — モデルを選択、デプロイ、Ready を検証	`step-5-deploy.md`
6	サマリー — 概要、スモークテスト、次のステップ	`step-6-summary.md`

エラー処理

エラー/症状	考えられる原因	対策
kubeconfig コンテキストなし	クラスタに接続されていない	`az aks get-credentials` または同等のコマンドを実行
コントローラーが CrashLoopBackOff	設定または RBAC の問題	`kubectl logs -n airunway-system -l control-plane=controller-manager --previous`
プロバイダーが Ready ではない	イメージプルまたは RBAC の問題	プロバイダーポッドの `kubectl logs <pod-name> -n <namespace>` を確認
ModelDeployment が Pending のままである	GPU スケジューリング失敗またはプロバイダーが Ready でない	`kubectl describe modeldeployment <name> -n <namespace>` イベントを確認
推論時の `bfloat16` エラー	T4 または V100 が bfloat16 をサポートしていない	serving args に `--dtype float16` を追加

完全なエラー処理とロールバック手順については、troubleshooting.md を参照してください。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: microsoft
リポジトリ: microsoft/azure-skills
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/microsoft/azure-skills / ライセンス: MIT

airunway-aks-setup

SKILL.md 本文

AI Runway AKS セットアップ

前提条件

クイックリファレンス

このスキルをいつ使用するか

MCP ツール

ルール

ステップ

エラー処理

詳細情報

関連スキル

agent-browser

anyskill

engram

skyvern

pinchbench

openui