Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

scribe

Zoom AI Services Scribeの参照スキルです。アップロード済みまたは保存済みメディアの処理、Build-platform JWT認証、高速モードの文字起こし、バッチジョブ、または文字起こしパイプラインの設計を伴う文字起こしワークフローへのルーティング後に使用します。

description の原文を見る

Reference skill for Zoom AI Services Scribe. Use after routing to a transcription workflow when handling uploaded or stored media, Build-platform JWT auth, fast mode transcription, batch jobs, or transcript pipeline design.

SKILL.md 本文

Zoom AI Services Scribe

Zoom AI Services Scribe の背景リファレンス:

  • 同期的な単一ファイル転写 (POST /aiservices/scribe/transcribe)
  • 非同期バッチジョブ (/aiservices/scribe/jobs*)
  • ブラウザマイク疑似ストリーミング(短いファイルのアップロード繰り返し)
  • Webhook駆動型バッチステータス更新
  • Build-platform JWT生成と認証情報管理

公式ドキュメント:

ルーティングガイドライン

  • ユーザーがアップロードまたは保存されたメディアをテキストに転写する必要がある場合、まずここにルーティングします。
  • ユーザーがライブミーティングメディアでファイルベースのアップロード/バッチジョブなしに必要な場合、../rtms/SKILL.md にルーティングします。
  • ユーザーがAI Services パス用の Zoom REST API インベントリが必要な場合、../rest-api/SKILL.md をチェーンします。
  • ユーザーが Webhook 署名パターンまたは汎用 HMAC レシーバーの堅牢化が必要な場合、オプションで ../webhooks/SKILL.md をチェーンします。

クイックリンク

  1. concepts/auth-and-processing-modes.md
  2. scenarios/high-level-scenarios.md
  3. examples/fast-mode-node.md
  4. examples/batch-webhook-pipeline.md
  5. references/api-reference.md
  6. references/environment-variables.md
  7. references/samples-validation.md
  8. references/versioning-and-drift.md
  9. troubleshooting/common-drift-and-breaks.md
  10. RUNBOOK.md

コア ワークフロー

  1. Build-platform 認証情報を取得し、HS256 JWT を生成します。
  2. 短い単一ファイルの場合はフォーストモード、保存済みアーカイブまたは大規模なセットの場合はバッチモードを選択します。
  3. 転写リクエストを送信します。
  4. バッチジョブの場合、ジョブ/ファイルステータスをポーリングするか、Webhook通知を受け取ります。
  5. トランスクリプト JSON を保持して後処理します。

ホスト型フォーストモード ガイドライン

  • 正式なフォーストモード API の制限は 100 MB および 2 時間 ですが、ホスト型ブラウザフローはそれでも上流レスポンスが返される前にタイムアウトする可能性があります。
  • 現在デプロイされたサンプルの観察:
    • ~17.2 MB MP4 は約 26秒 で完了
    • ~38.6 MB MP4 は約 26-37秒 で完了
    • ~59.2 MB MP4 はバックエンドで約 32-34秒 で完了
    • 一部の ~59.2 MB ブラウザリクエストは、バックエンドログで後に 200 が表示されたのに対し、フロントエンドでは 504 として表示されました
  • フロントエンド 504 とバックエンド 200 を、転写失敗の自動判定ではなくブラウザ/エッジタイムアウトレースとして扱います。
  • ホスト型 UI の場合、上流レスポンス全体でブラウザを開いておくのではなく、フォーストモードの非同期リクエスト/ポーリングラッパーを選択します。
  • より大きい、または予測不可能なメディアの場合、ファイルが正式なフォーストモードサイズ制限内にある場合でも、バッチモードを選択します。

ブラウザマイク パターン

  • scribe はドキュメント化された実時間ストリーミング API サーフェスを公開していません。
  • ブラウザマイク体験が必要な場合は、疑似ストリーミングを使用します:
    1. マイクオーディオを短いチャンクでキャプチャします
    2. 非同期フォーストモードラッパーを通じて各チャンクをアップロードします
    3. 完了をポーリングします
    4. チャンクトランスクリプトを順番に追加します
  • 推奨される開始ケイデンス:
    • チャンクサイズ: 5 秒
    • 許容範囲: 5-10 秒
    • フライト中のチャンクリクエスト: 2-3
  • これは増分トランスクリプト更新のための実用的な UI パターンであり、rtms の代替ではありません。
  • これはフォールバックデモパターンとして扱い、推奨される本番アーキテクチャではありません。
  • 繰り返しアップロードオーバーヘッド、チャンク境界ドリフト、ブラウザコーデック/コンテナ可変性、トランスクリプト結合の複雑さが追加されます。
  • ユーザーが実際のライブストリーム取り込み、低遅延連続メディア、またはサーバープッシュメディアトランスポートを求める場合は、代わりに ../rtms/SKILL.md にルーティングします。

エンドポイント サーフェス

モードメソッドパス用途
フォーストPOST/aiservices/scribe/transcribe単一ファイルの同期転写
バッチPOST/aiservices/scribe/jobs非同期バッチジョブを送信
バッチGET/aiservices/scribe/jobsジョブを一覧表示
バッチGET/aiservices/scribe/jobs/{jobId}ジョブサマリー/状態を検査
バッチDELETE/aiservices/scribe/jobs/{jobId}キューイング中/処理中のジョブをキャンセル
バッチGET/aiservices/scribe/jobs/{jobId}/filesファイルごとの結果を検査

高度なシナリオ

  • ユーザーが録音をアップロードした後のオンデマンドクリップ転写。
  • 保存済み S3 コールアーカイブのバッチ転写。
  • トランスクリプトをデータベース/検索インデックスに書き込む Webhook駆動型 ETL パイプライン。
  • Zoom管理レコーディングを独自のストレージにエクスポートした後の再転写。
  • タイムスタンプ、チャネル分離、スピーカーヒントを必要とするオフラインコンプライアンスまたは QA ワークフロー。

チェーニング

  • 保存済み Zoom レコーディング -> ../rest-api/SKILL.md + scribe
  • Webhook 検証の堅牢化 -> ../webhooks/SKILL.md
  • リアルタイムライブトランスクリプト/メディア -> ../rtms/SKILL.md
  • クロスプロダクトルーティング -> ../general/SKILL.md

運用

  • RUNBOOK.md - 5分間のプリフライトとデバッグチェックリスト。

ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
anthropics
リポジトリ
anthropics/knowledge-work-plugins
ライセンス
Apache-2.0
最終更新
不明

Source: https://github.com/anthropics/knowledge-work-plugins / ライセンス: Apache-2.0

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: anthropics · anthropics/knowledge-work-plugins · ライセンス: Apache-2.0