Agent Skills by ALSEL
OpenAI音声・動画・メディア⭐ リポ 18,898品質スコア 85/100

transcribe

音声ファイルをテキストに変換できます。話者識別機能やスピーカー情報の活用にも対応しており、ユーザーが音声・動画からの文字起こし、録音からのテキスト抽出、インタビューや会議での話者ラベリングをリクエストする際に利用します。

description の原文を見る

Transcribe audio files to text with optional diarization and known-speaker hints. Use when a user asks to transcribe speech from audio/video, extract text from recordings, or label speakers in interviews or meetings.

SKILL.md 本文

注意: このスキルのライセンスは ライセンス未確認 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。

オーディオトランスクライブ

OpenAIを使用してオーディオをトランスクライブします。リクエストに応じてオプションのスピーカーダイアライゼーション機能をサポートします。決定的で反復可能な実行のため、付属のCLIの使用を推奨します。

ワークフロー

  1. 入力を収集します:オーディオファイルパス、目的の応答形式(text/json/diarized_json)、オプションの言語ヒント、および既知のスピーカーリファレンス。
  2. OPENAI_API_KEY が設定されていることを確認します。設定されていない場合は、ユーザーにローカルで設定するよう指示してください(キーの貼り付けをリクエストしないでください)。
  3. 付属の transcribe_diarize.py CLIを適切なデフォルト設定(高速テキストトランスクリプション)で実行します。
  4. 出力を検証します:トランスクリプション品質、スピーカーラベル、セグメント境界。必要に応じて1つの対象を絞った変更で反復します。
  5. このリポジトリで作業する場合、出力を output/transcribe/ に保存します。

決定ルール

  • 高速トランスクリプションのため、--response-format text を使用して gpt-4o-mini-transcribe をデフォルトにします。

...

詳細情報

作者
openai
リポジトリ
openai/skills
ライセンス
不明
最終更新
2026/5/12

Source: https://github.com/openai/skills / ライセンス: 未指定

本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: openai · openai/skills · ライセンス: ライセンス未確認