OpenAI音声・動画・メディア⭐ リポ 18,898品質スコア 90/100

speech

Name: speech
Author: openai

ユーザーが音声生成、ナレーション、アクセシビリティ対応の読み上げ、音声プロンプト、またはOpenAI Audio APIによるバッチ音声生成をリクエストした場合に使用します。組み込みボイスを備えたバンドルCLI（`scripts/text_to_speech.py`）を実行でき、ライブ呼び出しには`OPENAI_API_KEY`が必要です。カスタムボイスの作成には対応していません。

description の原文を見る

Use when the user asks for text-to-speech narration or voiceover, accessibility reads, audio prompts, or batch speech generation via the OpenAI Audio API; run the bundled CLI (`scripts/text_to_speech.py`) with built-in voices and require `OPENAI_API_KEY` for live calls. Custom voice creation is out of scope.

SKILL.md 本文

注意: このスキルのライセンスは unknown です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。

音声生成スキル

現在のプロジェクトの音声オーディオを生成します（ナレーション、製品デモボイスオーバー、IVRプロンプト、アクセシビリティ読み上げ）。デフォルトは gpt-4o-mini-tts-2025-12-15 と組み込みボイスで、決定論的で再現可能な実行のためにバンドルされたCLIを優先します。

使用時期

テキストから単一の音声クリップを生成する
複数のプロンプトをバッチ生成する（多くの行、多くのファイル）

判断ツリー（単一 vs バッチ）

ユーザーが複数の行・プロンプトを提供するか、多くの出力を望む場合 -> バッチ
それ以外 -> 単一

ワークフロー

意図を決定：単一 vs バッチ（上記の判断ツリーを参照）。
入力を事前に収集：正確なテキスト（そのまま）、希望するボイス、配信スタイル、フォーマット、制約。
バッチの場合：tmp/ の下に一時的な JSONL を作成（1行ごとに1ジョブ）、1回実行してから JSONL を削除します。
指示を短いラベル付きスペックに拡張（入力テキストは書き直さない）。
バンドルされたCLI（scripts/text_to_speech.py）を適切なデフォルト値で実行します（references/cli.md を参照）。
重要なク

...

全文を GitHub の原本で見る →リポジトリ

詳細情報

作者: openai
リポジトリ: openai/skills
ライセンス: unknown
最終更新: 2026/5/12

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/openai/skills / ライセンス: unknown

関連スキル

汎用音声・動画・メディア⭐ リポ 1,982

listenhub

あらゆることを説明できます。アイデアをポッドキャスト、解説動画、または音声ナレーションに変換します。ユーザーが「ポッドキャストを作りたい」「解説動画を作成したい」「これを読み上げてほしい」「画像を生成したい」、または知識を音声・映像形式で共有したいときに使用します。トピックの説明、YouTubeリンク、記事URL、プレーンテキスト、画像プロンプトに対応しています。

by LeoYeAI

汎用音声・動画・メディア⭐ リポ 1,982

best-youtube-video-editor

ClawHub上の「best-youtube-video-editor」スキルは、YouTube クリエイターのコンテンツ制作を革新します。タイムラインや複雑なソフトウェアを必要とせず、会話形式のAI駆動型ビデオ編集が可能です。無音部分のカット、チャプターマーカーの追加、字幕の挿入、ペーシングの調整、エクスポートの最適化——すべてが自然言語の指示で実現します。初回使用時には NemoVideo API を通じて認証情報を自動設定するため、有効化後数秒で編集を開始できます。YouTuber、教育関係者、ポッドキャスター、ブランドチャネル向けに開発され、品質を損なわず高速な納期対応が必要な方に最適です。mp4、mov、avi、webm、mkv 形式に対応しています。

by LeoYeAI

汎用音声・動画・メディア⭐ リポ 27,990

video

ユーザーがAIツールやプログラマティックフレームワークを使用してビデオコンテンツを作成、生成、または制作したい場合に使用します。また、ユーザーが「ビデオ制作」「AIビデオ」「Remotion」「Hyperframes」「HeyGen」「Synthesia」「Veo」「Runway」「Kling」「Pika」「ビデオ生成」「AIアバター」「トーキングヘッドビデオ」「プログラマティックビデオ」「ビデオテンプレート」「解説ビデオ」「プロダクトデモビデオ」「ビデオパイプライン」または「ビデオを作ってほしい」と言及している場合にも使用します。ビデオ作成、生成、制作のワークフロー全般に対応できます。ビデオコンテンツの戦略や投稿内容については「social-content」を、有料ビデオ広告クリエイティブについては「ad-creative」をご参照ください。

by coreyhaines31

汎用音声・動画・メディア⭐ リポ 317

clipify

ビデオから最も面白い瞬間を検出し、スタンドアロンクリップとしてカットできます。オプションで16:9から9:16へのリフォーマット（フェイスパンまたはスプリットスクリーン）に対応し、Opus風の単語ごとのキャプションを焼き込みます。ユーザーが「clipify」「このビデオからクリップをカットして」「これからショーツを作って」「面白い瞬間を見つけて」「9:16にリフレーミングして」「縦型クリップ」と言及したり、ビデオファイルパスを貼り付けてSNS対応のクリップを求める場合に使用します。

by louisedesadeleer

汎用音声・動画・メディア⭐ リポ 2,743

depth-estimation

Depth Anything v2を使用したリアルタイム深度マップのプライバシー変換（CoreML + PyTorch対応）このスキルは、Depth Anything v2モデルを活用して、画像やビデオから取得した深度情報をリアルタイムで処理し、プライバシーを保護しながら変換します。CoreMLとPyTorchの両方に対応しており、エッジデバイスでの高速処理とクラウド環境での柔軟な運用が可能です。顔認識データのぼかしや背景の匿名化など、プライバシー関連の処理を効率的に実行できます。

by SharpAI

汎用音声・動画・メディア⭐ リポ 34,281

cli-anything-musescore

楽譜記譜用のCLI — トランスポーズ、PDF/音声/MIDI形式でのエクスポート、パート抽出、楽器管理に対応

by HKUDS