Agent Skills by ALSEL
OpenAI音声・動画・メディア⭐ リポ 18,898品質スコア 90/100

speech

ユーザーが音声生成、ナレーション、アクセシビリティ対応の読み上げ、音声プロンプト、またはOpenAI Audio APIによるバッチ音声生成をリクエストした場合に使用します。組み込みボイスを備えたバンドルCLI(`scripts/text_to_speech.py`)を実行でき、ライブ呼び出しには`OPENAI_API_KEY`が必要です。カスタムボイスの作成には対応していません。

description の原文を見る

Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.

SKILL.md 本文

注意: このスキルのライセンスは ライセンス未確認 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。

音声生成スキル

現在のプロジェクトの音声オーディオを生成します(ナレーション、製品デモボイスオーバー、IVRプロンプト、アクセシビリティ読み上げ)。デフォルトは gpt-4o-mini-tts-2025-12-15 と組み込みボイスで、決定論的で再現可能な実行のためにバンドルされたCLIを優先します。

使用時期

  • テキストから単一の音声クリップを生成する
  • 複数のプロンプトをバッチ生成する(多くの行、多くのファイル)

判断ツリー(単一 vs バッチ)

  • ユーザーが複数の行・プロンプトを提供するか、多くの出力を望む場合 -> バッチ
  • それ以外 -> 単一

ワークフロー

  1. 意図を決定:単一 vs バッチ(上記の判断ツリーを参照)。
  2. 入力を事前に収集:正確なテキスト(そのまま)、希望するボイス、配信スタイル、フォーマット、制約。
  3. バッチの場合:tmp/ の下に一時的な JSONL を作成(1行ごとに1ジョブ)、1回実行してから JSONL を削除します。
  4. 指示を短いラベル付きスペックに拡張(入力テキストは書き直さない)。
  5. バンドルされたCLI(scripts/text_to_speech.py)を適切なデフォルト値で実行します(references/cli.md を参照)。
  6. 重要なク

...

詳細情報

作者
openai
リポジトリ
openai/skills
ライセンス
不明
最終更新
2026/5/12

Source: https://github.com/openai/skills / ライセンス: 未指定

本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: openai · openai/skills · ライセンス: ライセンス未確認