azure-ai
Azure AIサービス(Search・Speech・OpenAI・Document Intelligence)に関するタスクを支援するスキルです。検索・ベクター検索・ハイブリッド検索・セマンティック検索・音声テキスト変換・テキスト音声変換・文字起こし・OCRなど、幅広いAI機能の実装や活用時に使用します。
description の原文を見る
Use for Azure AI: Search, Speech, OpenAI, Document Intelligence. Helps with search, vector/hybrid search, speech-to-text, text-to-speech, transcription, OCR. WHEN: AI Search, query search, vector search, hybrid search, semantic search, speech-to-text, text-to-speech, transcribe, OCR, convert text to speech.
SKILL.md 本文
Azure AI Services
Services
| Service | Use When | MCP Tools | CLI |
|---|---|---|---|
| AI Search | 全文検索、ベクトル検索、ハイブリッド検索 | azure__search | az search |
| Speech | 音声テキスト変換、テキスト音声変換 | azure__speech | - |
| OpenAI | GPT モデル、埋め込み、DALL-E | - | az cognitiveservices |
| Document Intelligence | フォーム抽出、OCR | - | - |
MCP Server (推奨)
Azure MCP が有効な場合:
AI Search
azure__searchコマンドsearch_index_list- 検索インデックスを一覧表示azure__searchコマンドsearch_index_get- インデックスの詳細を取得azure__searchコマンドsearch_query- 検索インデックスをクエリ実行
Speech
azure__speechコマンドspeech_transcribe- 音声をテキストに変換azure__speechコマンドspeech_synthesize- テキストを音声に変換
Azure MCP が有効でない場合: /azure:setup を実行するか、/mcp で有効にしてください。
AI Search の機能
| 機能 | 説明 |
|---|---|
| 全文検索 | 言語解析、語幹抽出 |
| ベクトル検索 | 埋め込みによるセマンティック類似性 |
| ハイブリッド検索 | キーワード + ベクトル検索の組み合わせ |
| AI エンリッチメント | エンティティ抽出、OCR、感情分析 |
Speech の機能
| 機能 | 説明 |
|---|---|
| 音声テキスト変換 | リアルタイムおよびバッチ転記 |
| テキスト音声変換 | ニューラルボイス、SSML サポート |
| スピーカー識別 | 誰がいつ話したかを識別 |
| カスタムモデル | ドメイン固有の語彙 |
SDK クイックリファレンス
これらのサービスへのプログラムによるアクセスについては、要約された SDK ガイドを参照してください:
- AI Search:
Python|TypeScript|.NET - OpenAI:
.NET - Vision:
Python|Java - Transcription:
Python - Translation:
Python|TypeScript - Document Intelligence:
.NET|TypeScript - Content Safety:
Python|TypeScript|Java
サービスの詳細
特定のサービスの詳細ドキュメント:
- AI Search インデックス作成とクエリ -> Azure AI Search ドキュメント
- 音声転記のパターン -> Azure AI Speech ドキュメント
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- microsoft
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/microsoft/azure-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。