Agent Skills by ALSEL
Anthropic Claude音声・動画・メディア⭐ リポ 1品質スコア 58/100

deepgram-core-workflow-b

Deepgramを使ったリアルタイムストリーミング文字起こしを実装できます。 ライブ文字起こし、音声インターフェース、リアルタイムオーディオ処理アプリケーションの構築時に活用できます。「deepgramストリーミング」「リアルタイム文字起こし」「ライブ文字起こし」「websocket文字起こし」「音声ストリーミング」といったフレーズでトリガーされます。

description の原文を見る

Implement real-time streaming transcription with Deepgram. Use when building live transcription, voice interfaces, or real-time audio processing applications. Trigger with phrases like "deepgram streaming", "real-time transcription", "live transcription", "websocket transcription", "voice streaming".

SKILL.md 本文

注意: このスキルのライセンスは ライセンス未確認 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。

Deepgram Core Workflow B: リアルタイムストリーミング

概要

Deepgram の WebSocket API を使用してリアルタイムストリーミング文字起こしを実装し、ライブオーディオ処理を行います。

前提条件

  • deepgram-install-auth セットアップの完了
  • WebSocket パターンの理解
  • オーディオ入力ソース(マイクロフォンまたはストリーム)

手順

ステップ 1: WebSocket 接続の設定

Deepgram でライブ文字起こし接続を初期化します。

ステップ 2: ストリームオプションの設定

暫定結果、エンドポイント、言語オプションを設定します。

ステップ 3: イベントの処理

トランスクリプトイベントと接続ライフサイクルのハンドラを実装します。

ステップ 4: オーディオデータのストリーミング

WebSocket 接続にオーディオチャンクを送信します。

出力

  • ライブ文字起こし WebSocket クライアント
  • リアルタイム結果用のイベントハンドラ
  • オーディオストリーミングパイプライン
  • グレースフルな接続管理

エラーハンドリング

エラー原因解決方法

...

詳細情報

作者
Brmbobo
リポジトリ
Brmbobo/Web2podcast
ライセンス
不明
最終更新
2026/1/26

Source: https://github.com/Brmbobo/Web2podcast / ライセンス: 未指定

本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: Brmbobo · Brmbobo/Web2podcast · ライセンス: ライセンス未確認