OpenAI音声・動画・メディア⭐ リポ 18,898品質スコア 85/100
transcribe
音声ファイルをテキストに変換できます。話者識別機能やスピーカー情報の活用にも対応しており、ユーザーが音声・動画からの文字起こし、録音からのテキスト抽出、インタビューや会議での話者ラベリングをリクエストする際に利用します。
description の原文を見る
Transcribe audio files to text with optional diarization and known-speaker hints. Use when a user asks to transcribe speech from audio/video, extract text from recordings, or label speakers in interviews or meetings.
SKILL.md 本文
注意: このスキルのライセンスは ライセンス未確認 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。
オーディオトランスクライブ
OpenAIを使用してオーディオをトランスクライブします。リクエストに応じてオプションのスピーカーダイアライゼーション機能をサポートします。決定的で反復可能な実行のため、付属のCLIの使用を推奨します。
ワークフロー
- 入力を収集します:オーディオファイルパス、目的の応答形式(text/json/diarized_json)、オプションの言語ヒント、および既知のスピーカーリファレンス。
OPENAI_API_KEYが設定されていることを確認します。設定されていない場合は、ユーザーにローカルで設定するよう指示してください(キーの貼り付けをリクエストしないでください)。- 付属の
transcribe_diarize.pyCLIを適切なデフォルト設定(高速テキストトランスクリプション)で実行します。 - 出力を検証します:トランスクリプション品質、スピーカーラベル、セグメント境界。必要に応じて1つの対象を絞った変更で反復します。
- このリポジトリで作業する場合、出力を
output/transcribe/に保存します。
決定ルール
- 高速トランスクリプションのため、
--response-format textを使用してgpt-4o-mini-transcribeをデフォルトにします。
...
詳細情報
- 作者
- openai
- リポジトリ
- openai/skills
- ライセンス
- 不明
- 最終更新
- 2026/5/12
Source: https://github.com/openai/skills / ライセンス: 未指定