OpenAI音声・動画・メディア⭐ リポ 18,898品質スコア 90/100
speech
ユーザーが音声生成、ナレーション、アクセシビリティ対応の読み上げ、音声プロンプト、またはOpenAI Audio APIによるバッチ音声生成をリクエストした場合に使用します。組み込みボイスを備えたバンドルCLI(`scripts/text_to_speech.py`)を実行でき、ライブ呼び出しには`OPENAI_API_KEY`が必要です。カスタムボイスの作成には対応していません。
description の原文を見る
Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.
SKILL.md 本文
注意: このスキルのライセンスは ライセンス未確認 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。
音声生成スキル
現在のプロジェクトの音声オーディオを生成します(ナレーション、製品デモボイスオーバー、IVRプロンプト、アクセシビリティ読み上げ)。デフォルトは gpt-4o-mini-tts-2025-12-15 と組み込みボイスで、決定論的で再現可能な実行のためにバンドルされたCLIを優先します。
使用時期
- テキストから単一の音声クリップを生成する
- 複数のプロンプトをバッチ生成する(多くの行、多くのファイル)
判断ツリー(単一 vs バッチ)
- ユーザーが複数の行・プロンプトを提供するか、多くの出力を望む場合 -> バッチ
- それ以外 -> 単一
ワークフロー
- 意図を決定:単一 vs バッチ(上記の判断ツリーを参照)。
- 入力を事前に収集:正確なテキスト(そのまま)、希望するボイス、配信スタイル、フォーマット、制約。
- バッチの場合:
tmp/の下に一時的な JSONL を作成(1行ごとに1ジョブ)、1回実行してから JSONL を削除します。 - 指示を短いラベル付きスペックに拡張(入力テキストは書き直さない)。
- バンドルされたCLI(
scripts/text_to_speech.py)を適切なデフォルト値で実行します(references/cli.mdを参照)。 - 重要なク
...
詳細情報
- 作者
- openai
- リポジトリ
- openai/skills
- ライセンス
- 不明
- 最終更新
- 2026/5/12
Source: https://github.com/openai/skills / ライセンス: 未指定