podcast
トピック、URL、またはテキストからポッドキャストを作成します。「podcast」「discuss」「debate」「dialogue」「make a podcast about」などのキーワードで起動し、指定したテーマについての音声コンテンツを生成します。
description の原文を見る
| Create podcasts from topics, URLs, or text. Triggers on: "做播客", "podcast", "播客", "录一期节目", "chat about", "discuss", "debate", "dialogue", "make a podcast about".
SKILL.md 本文
使用場面
- ユーザーがあらゆるトピックについてポッドキャストエピソードを作成したい
- ユーザーが URL またはテキストを提供し、それをポッドキャストディスカッションに変換したい
- ユーザーが「debate」「dialogue」「discussion」形式をリクエストしている
- ユーザーが「podcast」「播客」または「录一期节目」と言っている
使用しないでください
- ユーザーがテキスト読み上げを希望している場合(
/speechを使用) - ユーザーがビジュアル付きの説明動画を希望している場合(
/explainerを使用) - ユーザーが画像生成を希望している場合(
/image-genを使用) - ユーザーが URL からのオーディオ生成なしにコンテンツを抽出したいだけの場合(
/content-parserを使用)
目的
1~2 人の AI スピーカーがトピックについて議論するポッドキャストエピソードを生成します。クイック概要、深掘り分析、デベート形式に対応しています。入力はトピック説明、URL、またはテキストです。出力は完全なオーディオエピソードと字幕です。
厳守制約
shared/cli-authentication.mdに従い、常に CLI 認証を確認する- コマンド実行とエラー処理については
shared/cli-patterns.mdに従う - API 呼び出しにスピーカー ID をハードコードしない。フォールバックのみ
shared/speaker-selection.mdの組み込みデフォルトを使用し、ユーザーが音声を変更したい場合はスピーカー API から取得する - CLI コマンドやパラメータを作り上げない
- インタラクションの前に
shared/config-pattern.mdに従い設定を読む - スピーカー選択については
shared/speaker-selection.mdに従う(テキストテーブル+自由入力) ~/Downloads/または.listenhub/にファイルを保存しない。アーティファクトは現在の作業ディレクトリに、親切なトピックベースの名前で保存する(shared/config-pattern.md§ Artifact Naming 参照)
ステップ -1: CLI 認証チェック
shared/cli-authentication.md § Auth Check に従う。CLI がインストールされていない、またはユーザーがログインしていない場合は、自動インストールおよび自動ログインを行う。ユーザーにコマンドを手動で実行させないでください。
ステップ 0: 設定セットアップ
shared/config-pattern.md ステップ 0(Zero-Question Boot)に従う。
ファイルが存在しない場合 — デフォルトで静かに作成して続行:
mkdir -p ".listenhub/podcast"
echo '{"outputMode":"inline","language":null,"defaultMode":"quick","defaultSpeakers":{}}' > ".listenhub/podcast/config.json"
CONFIG_PATH=".listenhub/podcast/config.json"
CONFIG=$(cat "$CONFIG_PATH")
設定質問を尋ねないでください。 インタラクションフローに直接進みます。
ファイルが存在する場合 — 静かに設定を読んで続行:
CONFIG_PATH=".listenhub/podcast/config.json"
[ ! -f "$CONFIG_PATH" ] && CONFIG_PATH="$HOME/.listenhub/podcast/config.json"
CONFIG=$(cat "$CONFIG_PATH")
セットアップフロー(ユーザー主導の再設定のみ)
ユーザーが明示的に再設定をリクエストした場合のみ実行します。現在の設定を表示:
当前配置 (podcast):
输出方式:{inline / download / both}
语言偏好:{zh / en / 未设置}
默认模式:{quick / deep / debate / 未设置}
默认主播:{speakerName(s) / 使用内置默认}
次に、これらの質問を順番に尋ねて保存します:
-
outputMode:
shared/output-mode.md§ Setup Flow Question に従う。 -
Language(オプション):「默认语言?」
- 「中文 (zh)」
- 「English (en)」
- 「每次手动选择」→
nullに保つ
-
Mode(オプション):「默认播客模式?」
- 「Quick — 简短概述」
- 「Deep — 深度分析」
- 「Debate — 辩论对话」
- 「每次手动选择」→
nullに保つ
回答を収集した後、すぐに保存:
NEW_CONFIG=$(echo "$CONFIG" | jq --arg m "$OUTPUT_MODE" '. + {"outputMode": $m}')
# ユーザーが選択した場合は言語を保存(「每次手动选择」ではない)
if [ "$LANGUAGE" != "null" ]; then
NEW_CONFIG=$(echo "$NEW_CONFIG" | jq --arg lang "$LANGUAGE" '. + {"language": $lang}')
fi
# ユーザーが選択した場合はモードを保存
if [ "$MODE" != "null" ]; then
NEW_CONFIG=$(echo "$NEW_CONFIG" | jq --arg mode "$MODE" '. + {"defaultMode": $mode}')
fi
echo "$NEW_CONFIG" > "$CONFIG_PATH"
CONFIG=$(cat "$CONFIG_PATH")
インタラクションフロー
ステップ 1: トピック+参考資料
AskUserQuestion を使用して、トピックとオプションの参考資料を 1 つの質問で一緒に尋ねるか、または自由形式のプロンプトで:
ポッドキャストに変換したいトピックは何ですか?参考資料(URL またはテキスト)がある場合は、ここに含めてください。
受け入れる内容:トピック説明、URL、貼り付けられたテキスト、または任意の組み合わせ。
有効な入力の例:
- 「AI developments in 2026」
- 「https://example.com/article — discuss this」
- 「The pros and cons of remote work. Reference: https://study.com/remote-work-2026」
ステップ 2: モード
デフォルト:「quick」 — 以下の場合を除き、この質問をスキップ:
config.defaultModeが別の値に設定されている場合 → その値を静かに使用- ユーザーがステップ 1 でモードキーワードを明示的に言及した場合(例「deep dive」「debate」「in depth」) → 意図からモードを推測
ユーザーの意図が曖昧で、デフォルトが設定されていない場合のみ、この質問を尋ねます。ほとんどの場合、「quick」を使用してください。
ステップ 3: 言語
デフォルト:ユーザーのインタラクション言語に合わせます。 ステップ 1 でユーザーが使用した言語から検出:
- ユーザーが中国語で記述した場合 →
zh - ユーザーが英語で記述した場合 →
en config.languageが設定されている場合 → その値を使用
この質問を尋ねないでください。 常に静かに推測します。確認の概要に表示して、ユーザーが必要に応じてオーバーライドできるようにします。
ステップ 4: スピーカー数
デフォルト:2 人のスピーカー(対話) — 最も一般的で魅力的な形式。
この質問をスキップします。デベートモードは 2 人のスピーカーが必要です。クイック/ディープの場合も、デフォルトで 2 人のスピーカーを使用します。
ユーザーがモノローグまたはソロ形式を明示的にリクエストした場合のみ、1 人のスピーカーを使用します。
ステップ 5: スピーカー選択
shared/speaker-selection.md に従う:
config.defaultSpeakers.{language}が設定されている場合 → 保存されたスピーカーを静かに使用- 設定されていない場合 →
shared/speaker-selection.mdから組み込みデフォルトを使用(質問なし) - 確認の概要にスピーカーを表示 — ユーザーが必要に応じて音声を変更できます
- ユーザーが明示的に音声を変更するよう要求した場合のみ、完全なスピーカーリストを表示
2 スピーカーモード(対話/デベート)の場合:言語用の Primary + Secondary デフォルトを使用します。
ステップ 6: 確認&生成
すべての選択肢をまとめます:
Ready to generate podcast:
Topic: {topic}
Mode: {mode}
Language: {language}
Speakers: {speaker name(s)}
References: {yes/no + brief description}
Proceed?
API コマンドを呼び出す前に明示的な確認を待ちます。ユーザーは確認する前にここで任意のパラメータを調整できます。
ワークフロー
生成
-
提出(バックグラウンド):
run_in_background: trueおよびtimeout: 360000で CLI コマンドを実行:listenhub podcast create \ --query "{topic}" \ --source-url "{url}" \ --source-text "{text}" \ --mode {quick|deep|debate} \ --lang {en|zh|ja} \ --speaker "{name}" \ --speaker "{name2}" \ --jsonフラグノート:
--query— 議論するトピックまたは質問--source-url— 繰り返し可能、URL 参照ごとに 1 つ--source-text— 繰り返し可能、テキストブロック参照ごとに 1 つ--mode—quick、deep、debateのいずれか--lang— 言語コード--speaker— 繰り返し可能(最大 2 つ);スピーカー表示名を使用--speaker-id—--speakerの代替;名前の代わりにスピーカー ID を使用- ユーザーが参考資料を提供しなかった場合は
--source-url/--source-textを省略
CLI は内部的にポーリングを処理し、生成完了時に最終結果を返します。
-
ユーザーに、タスクが提出されたことと、完了時に通知されることを伝えます。
-
完了の通知を受けたら、結果を提示:
CLI JSON 出力を解析して、フィールド
audioUrl、subtitlesUrl、audioDuration、creditsを抽出します。設定から
OUTPUT_MODEを読みます。shared/output-mode.mdの動作に従います。inlineまたはboth:audioUrlをクリック可能なリンクとして表示します。提示:
播客已生成! 在线收听:{audioUrl} 字幕:{subtitlesUrl}(如有) 时长:{audioDuration / 1000}s 消耗积分:{credits}downloadまたはboth:ファイルもダウンロードします。shared/config-pattern.md§ Artifact Naming に従うトピックスラッグを生成します。SLUG="{topic-slug}" # e.g. "ai-developments" NAME="${SLUG}-podcast.mp3" # デデュープ:ファイルが存在する場合、-2、-3 など を追加 BASE="${NAME%.*}"; EXT="${NAME##*.}"; i=2 while [ -e "$NAME" ]; do NAME="${BASE}-${i}.${EXT}"; i=$((i+1)); done curl -sS -o "$NAME" "{audioUrl}"提示:
已保存到当前目录: {NAME} -
リクエストに応じて字幕を表示またはダウンロード URL を提供することを申し出ます
成功した生成後
このセッションで作成された選択肢で設定を更新:
NEW_CONFIG=$(echo "$CONFIG" | jq \
--arg lang "{language}" \
--arg mode "{mode}" \
--argjson speakers '{"{language}": ["{speakerId}"]}' \
'. + {"language": $lang, "defaultMode": $mode, "defaultSpeakers": (.defaultSpeakers + $speakers)}')
echo "$NEW_CONFIG" > "$CONFIG_PATH"
API リファレンス
- スピーカーリスト:
shared/cli-speakers.md - スピーカー選択ガイド:
shared/speaker-selection.md - CLI パターン:
shared/cli-patterns.md - CLI 認証:
shared/cli-authentication.md - 設定パターン:
shared/config-pattern.md
相互運用性
- 呼び出す:スピーカー API(スピーカー選択用)
- 呼び出される:content-planner(Phase 3)
例
ユーザー:「Make a podcast about the latest AI developments」
エージェントワークフロー:
- 検出:ポッドキャストリクエスト、トピック = 「latest AI developments」、参考資料なし
- 推測:mode = 「quick」(デフォルト)、language = 「en」(ユーザーが英語で記述)、2 スピーカー(デフォルト)
- 確認サマリーを表示 → ユーザーが確認
listenhub podcast create \
--query "The latest AI developments" \
--mode deep \
--lang en \
--speaker "Mars" \
--speaker "Mia" \
--json
CLI が結果を返すのを待ってから、タイトルとリスンリンク付きで提示します。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- marswaveai
- リポジトリ
- marswaveai/skills
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/marswaveai/skills / ライセンス: MIT
関連スキル
listenhub
あらゆることを説明できます。アイデアをポッドキャスト、解説動画、または音声ナレーションに変換します。 ユーザーが「ポッドキャストを作りたい」「解説動画を作成したい」「これを読み上げてほしい」「画像を生成したい」、または知識を音声・映像形式で共有したいときに使用します。トピックの説明、YouTubeリンク、記事URL、プレーンテキスト、画像プロンプトに対応しています。
best-youtube-video-editor
ClawHub上の「best-youtube-video-editor」スキルは、YouTube クリエイターのコンテンツ制作を革新します。タイムラインや複雑なソフトウェアを必要とせず、会話形式のAI駆動型ビデオ編集が可能です。無音部分のカット、チャプターマーカーの追加、字幕の挿入、ペーシングの調整、エクスポートの最適化——すべてが自然言語の指示で実現します。初回使用時には NemoVideo API を通じて認証情報を自動設定するため、有効化後数秒で編集を開始できます。YouTuber、教育関係者、ポッドキャスター、ブランドチャネル向けに開発され、品質を損なわず高速な納期対応が必要な方に最適です。mp4、mov、avi、webm、mkv 形式に対応しています。
video
ユーザーがAIツールやプログラマティックフレームワークを使用してビデオコンテンツを作成、生成、または制作したい場合に使用します。また、ユーザーが「ビデオ制作」「AIビデオ」「Remotion」「Hyperframes」「HeyGen」「Synthesia」「Veo」「Runway」「Kling」「Pika」「ビデオ生成」「AIアバター」「トーキングヘッドビデオ」「プログラマティックビデオ」「ビデオテンプレート」「解説ビデオ」「プロダクトデモビデオ」「ビデオパイプライン」または「ビデオを作ってほしい」と言及している場合にも使用します。ビデオ作成、生成、制作のワークフロー全般に対応できます。ビデオコンテンツの戦略や投稿内容については「social-content」を、有料ビデオ広告クリエイティブについては「ad-creative」をご参照ください。
clipify
ビデオから最も面白い瞬間を検出し、スタンドアロンクリップとしてカットできます。オプションで16:9から9:16へのリフォーマット(フェイスパンまたはスプリットスクリーン)に対応し、Opus風の単語ごとのキャプションを焼き込みます。ユーザーが「clipify」「このビデオからクリップをカットして」「これからショーツを作って」「面白い瞬間を見つけて」「9:16にリフレーミングして」「縦型クリップ」と言及したり、ビデオファイルパスを貼り付けてSNS対応のクリップを求める場合に使用します。
speech
ユーザーが音声生成、ナレーション、アクセシビリティ対応の読み上げ、音声プロンプト、またはOpenAI Audio APIによるバッチ音声生成をリクエストした場合に使用します。組み込みボイスを備えたバンドルCLI(`scripts/text_to_speech.py`)を実行でき、ライブ呼び出しには`OPENAI_API_KEY`が必要です。カスタムボイスの作成には対応していません。
depth-estimation
Depth Anything v2を使用したリアルタイム深度マップのプライバシー変換(CoreML + PyTorch対応) このスキルは、Depth Anything v2モデルを活用して、画像やビデオから取得した深度情報をリアルタイムで処理し、プライバシーを保護しながら変換します。CoreMLとPyTorchの両方に対応しており、エッジデバイスでの高速処理とクラウド環境での柔軟な運用が可能です。顔認識データのぼかしや背景の匿名化など、プライバシー関連の処理を効率的に実行できます。