Agent Skills by ALSEL
Anthropic Claude音声・動画・メディア⭐ リポ 0品質スコア 50/100

podcast

トピック、URL、またはテキストからポッドキャストを作成します。「podcast」「discuss」「debate」「dialogue」「make a podcast about」などのキーワードで起動し、指定したテーマについての音声コンテンツを生成します。

description の原文を見る

| Create podcasts from topics, URLs, or text. Triggers on: "做播客", "podcast", "播客", "录一期节目", "chat about", "discuss", "debate", "dialogue", "make a podcast about".

SKILL.md 本文

使用場面

  • ユーザーがあらゆるトピックについてポッドキャストエピソードを作成したい
  • ユーザーが URL またはテキストを提供し、それをポッドキャストディスカッションに変換したい
  • ユーザーが「debate」「dialogue」「discussion」形式をリクエストしている
  • ユーザーが「podcast」「播客」または「录一期节目」と言っている

使用しないでください

  • ユーザーがテキスト読み上げを希望している場合(/speech を使用)
  • ユーザーがビジュアル付きの説明動画を希望している場合(/explainer を使用)
  • ユーザーが画像生成を希望している場合(/image-gen を使用)
  • ユーザーが URL からのオーディオ生成なしにコンテンツを抽出したいだけの場合(/content-parser を使用)

目的

1~2 人の AI スピーカーがトピックについて議論するポッドキャストエピソードを生成します。クイック概要、深掘り分析、デベート形式に対応しています。入力はトピック説明、URL、またはテキストです。出力は完全なオーディオエピソードと字幕です。

厳守制約

  • shared/cli-authentication.md に従い、常に CLI 認証を確認する
  • コマンド実行とエラー処理については shared/cli-patterns.md に従う
  • API 呼び出しにスピーカー ID をハードコードしない。フォールバックのみ shared/speaker-selection.md の組み込みデフォルトを使用し、ユーザーが音声を変更したい場合はスピーカー API から取得する
  • CLI コマンドやパラメータを作り上げない
  • インタラクションの前に shared/config-pattern.md に従い設定を読む
  • スピーカー選択については shared/speaker-selection.md に従う(テキストテーブル+自由入力)
  • ~/Downloads/ または .listenhub/ にファイルを保存しない。アーティファクトは現在の作業ディレクトリに、親切なトピックベースの名前で保存する(shared/config-pattern.md § Artifact Naming 参照)
<HARD-GATE> 複数選択ステップのすべてについて AskUserQuestion ツールを使用してください。プレーンテキストとしてオプションを表示しないでください。一度に 1 つの質問を尋ねます。次のステップに進む前にユーザーの回答を待ちます。すべてのパラメータが収集された後、選択肢をまとめ、ユーザーに確認を求めます。ユーザーが明示的に確認するまで、生成 API を呼び出さないでください。 </HARD-GATE>

ステップ -1: CLI 認証チェック

shared/cli-authentication.md § Auth Check に従う。CLI がインストールされていない、またはユーザーがログインしていない場合は、自動インストールおよび自動ログインを行う。ユーザーにコマンドを手動で実行させないでください。

ステップ 0: 設定セットアップ

shared/config-pattern.md ステップ 0(Zero-Question Boot)に従う。

ファイルが存在しない場合 — デフォルトで静かに作成して続行:

mkdir -p ".listenhub/podcast"
echo '{"outputMode":"inline","language":null,"defaultMode":"quick","defaultSpeakers":{}}' > ".listenhub/podcast/config.json"
CONFIG_PATH=".listenhub/podcast/config.json"
CONFIG=$(cat "$CONFIG_PATH")

設定質問を尋ねないでください。 インタラクションフローに直接進みます。

ファイルが存在する場合 — 静かに設定を読んで続行:

CONFIG_PATH=".listenhub/podcast/config.json"
[ ! -f "$CONFIG_PATH" ] && CONFIG_PATH="$HOME/.listenhub/podcast/config.json"
CONFIG=$(cat "$CONFIG_PATH")

セットアップフロー(ユーザー主導の再設定のみ)

ユーザーが明示的に再設定をリクエストした場合のみ実行します。現在の設定を表示:

当前配置 (podcast):
  输出方式:{inline / download / both}
  语言偏好:{zh / en / 未设置}
  默认模式:{quick / deep / debate / 未设置}
  默认主播:{speakerName(s) / 使用内置默认}

次に、これらの質問を順番に尋ねて保存します:

  1. outputMode: shared/output-mode.md § Setup Flow Question に従う。

  2. Language(オプション):「默认语言?」

    • 「中文 (zh)」
    • 「English (en)」
    • 「每次手动选择」→ null に保つ
  3. Mode(オプション):「默认播客模式?」

    • 「Quick — 简短概述」
    • 「Deep — 深度分析」
    • 「Debate — 辩论对话」
    • 「每次手动选择」→ null に保つ

回答を収集した後、すぐに保存:

NEW_CONFIG=$(echo "$CONFIG" | jq --arg m "$OUTPUT_MODE" '. + {"outputMode": $m}')
# ユーザーが選択した場合は言語を保存(「每次手动选择」ではない)
if [ "$LANGUAGE" != "null" ]; then
  NEW_CONFIG=$(echo "$NEW_CONFIG" | jq --arg lang "$LANGUAGE" '. + {"language": $lang}')
fi
# ユーザーが選択した場合はモードを保存
if [ "$MODE" != "null" ]; then
  NEW_CONFIG=$(echo "$NEW_CONFIG" | jq --arg mode "$MODE" '. + {"defaultMode": $mode}')
fi
echo "$NEW_CONFIG" > "$CONFIG_PATH"
CONFIG=$(cat "$CONFIG_PATH")

インタラクションフロー

ステップ 1: トピック+参考資料

AskUserQuestion を使用して、トピックとオプションの参考資料を 1 つの質問で一緒に尋ねるか、または自由形式のプロンプトで:

ポッドキャストに変換したいトピックは何ですか?参考資料(URL またはテキスト)がある場合は、ここに含めてください。

受け入れる内容:トピック説明、URL、貼り付けられたテキスト、または任意の組み合わせ。

有効な入力の例:

ステップ 2: モード

デフォルト:「quick」 — 以下の場合を除き、この質問をスキップ:

  • config.defaultMode が別の値に設定されている場合 → その値を静かに使用
  • ユーザーがステップ 1 でモードキーワードを明示的に言及した場合(例「deep dive」「debate」「in depth」) → 意図からモードを推測

ユーザーの意図が曖昧で、デフォルトが設定されていない場合のみ、この質問を尋ねます。ほとんどの場合、「quick」を使用してください。

ステップ 3: 言語

デフォルト:ユーザーのインタラクション言語に合わせます。 ステップ 1 でユーザーが使用した言語から検出:

  • ユーザーが中国語で記述した場合 → zh
  • ユーザーが英語で記述した場合 → en
  • config.language が設定されている場合 → その値を使用

この質問を尋ねないでください。 常に静かに推測します。確認の概要に表示して、ユーザーが必要に応じてオーバーライドできるようにします。

ステップ 4: スピーカー数

デフォルト:2 人のスピーカー(対話) — 最も一般的で魅力的な形式。

この質問をスキップします。デベートモードは 2 人のスピーカーが必要です。クイック/ディープの場合も、デフォルトで 2 人のスピーカーを使用します。

ユーザーがモノローグまたはソロ形式を明示的にリクエストした場合のみ、1 人のスピーカーを使用します。

ステップ 5: スピーカー選択

shared/speaker-selection.md に従う:

  • config.defaultSpeakers.{language} が設定されている場合 → 保存されたスピーカーを静かに使用
  • 設定されていない場合 → shared/speaker-selection.md から組み込みデフォルトを使用(質問なし)
  • 確認の概要にスピーカーを表示 — ユーザーが必要に応じて音声を変更できます
  • ユーザーが明示的に音声を変更するよう要求した場合のみ、完全なスピーカーリストを表示

2 スピーカーモード(対話/デベート)の場合:言語用の Primary + Secondary デフォルトを使用します。

ステップ 6: 確認&生成

すべての選択肢をまとめます:

Ready to generate podcast:

  Topic: {topic}
  Mode: {mode}
  Language: {language}
  Speakers: {speaker name(s)}
  References: {yes/no + brief description}

  Proceed?

API コマンドを呼び出す前に明示的な確認を待ちます。ユーザーは確認する前にここで任意のパラメータを調整できます。

ワークフロー

生成

  1. 提出(バックグラウンド): run_in_background: true および timeout: 360000 で CLI コマンドを実行:

    listenhub podcast create \
      --query "{topic}" \
      --source-url "{url}" \
      --source-text "{text}" \
      --mode {quick|deep|debate} \
      --lang {en|zh|ja} \
      --speaker "{name}" \
      --speaker "{name2}" \
      --json
    

    フラグノート:

    • --query — 議論するトピックまたは質問
    • --source-url — 繰り返し可能、URL 参照ごとに 1 つ
    • --source-text — 繰り返し可能、テキストブロック参照ごとに 1 つ
    • --modequickdeepdebate のいずれか
    • --lang — 言語コード
    • --speaker — 繰り返し可能(最大 2 つ);スピーカー表示名を使用
    • --speaker-id--speaker の代替;名前の代わりにスピーカー ID を使用
    • ユーザーが参考資料を提供しなかった場合は --source-url / --source-text を省略

    CLI は内部的にポーリングを処理し、生成完了時に最終結果を返します。

  2. ユーザーに、タスクが提出されたことと、完了時に通知されることを伝えます。

  3. 完了の通知を受けたら、結果を提示

    CLI JSON 出力を解析して、フィールド audioUrlsubtitlesUrlaudioDurationcredits を抽出します。

    設定から OUTPUT_MODE を読みます。shared/output-mode.md の動作に従います。

    inline または bothaudioUrl をクリック可能なリンクとして表示します。

    提示:

    播客已生成!
    
    在线收听:{audioUrl}
    字幕:{subtitlesUrl}(如有)
    时长:{audioDuration / 1000}s
    消耗积分:{credits}
    

    download または both:ファイルもダウンロードします。shared/config-pattern.md § Artifact Naming に従うトピックスラッグを生成します。

    SLUG="{topic-slug}"  # e.g. "ai-developments"
    NAME="${SLUG}-podcast.mp3"
    # デデュープ:ファイルが存在する場合、-2、-3 など を追加
    BASE="${NAME%.*}"; EXT="${NAME##*.}"; i=2
    while [ -e "$NAME" ]; do NAME="${BASE}-${i}.${EXT}"; i=$((i+1)); done
    curl -sS -o "$NAME" "{audioUrl}"
    

    提示:

    已保存到当前目录:
      {NAME}
    
  4. リクエストに応じて字幕を表示またはダウンロード URL を提供することを申し出ます

成功した生成後

このセッションで作成された選択肢で設定を更新:

NEW_CONFIG=$(echo "$CONFIG" | jq \
  --arg lang "{language}" \
  --arg mode "{mode}" \
  --argjson speakers '{"{language}": ["{speakerId}"]}' \
  '. + {"language": $lang, "defaultMode": $mode, "defaultSpeakers": (.defaultSpeakers + $speakers)}')
echo "$NEW_CONFIG" > "$CONFIG_PATH"

API リファレンス

  • スピーカーリスト:shared/cli-speakers.md
  • スピーカー選択ガイド:shared/speaker-selection.md
  • CLI パターン:shared/cli-patterns.md
  • CLI 認証:shared/cli-authentication.md
  • 設定パターン:shared/config-pattern.md

相互運用性

  • 呼び出す:スピーカー API(スピーカー選択用)
  • 呼び出される:content-planner(Phase 3)

ユーザー:「Make a podcast about the latest AI developments」

エージェントワークフロー

  1. 検出:ポッドキャストリクエスト、トピック = 「latest AI developments」、参考資料なし
  2. 推測:mode = 「quick」(デフォルト)、language = 「en」(ユーザーが英語で記述)、2 スピーカー(デフォルト)
  3. 確認サマリーを表示 → ユーザーが確認
listenhub podcast create \
  --query "The latest AI developments" \
  --mode deep \
  --lang en \
  --speaker "Mars" \
  --speaker "Mia" \
  --json

CLI が結果を返すのを待ってから、タイトルとリスンリンク付きで提示します。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
marswaveai
リポジトリ
marswaveai/skills
ライセンス
MIT
最終更新
不明

Source: https://github.com/marswaveai/skills / ライセンス: MIT

関連スキル

汎用音声・動画・メディア⭐ リポ 1,982

listenhub

あらゆることを説明できます。アイデアをポッドキャスト、解説動画、または音声ナレーションに変換します。 ユーザーが「ポッドキャストを作りたい」「解説動画を作成したい」「これを読み上げてほしい」「画像を生成したい」、または知識を音声・映像形式で共有したいときに使用します。トピックの説明、YouTubeリンク、記事URL、プレーンテキスト、画像プロンプトに対応しています。

by LeoYeAI
汎用音声・動画・メディア⭐ リポ 1,982

best-youtube-video-editor

ClawHub上の「best-youtube-video-editor」スキルは、YouTube クリエイターのコンテンツ制作を革新します。タイムラインや複雑なソフトウェアを必要とせず、会話形式のAI駆動型ビデオ編集が可能です。無音部分のカット、チャプターマーカーの追加、字幕の挿入、ペーシングの調整、エクスポートの最適化——すべてが自然言語の指示で実現します。初回使用時には NemoVideo API を通じて認証情報を自動設定するため、有効化後数秒で編集を開始できます。YouTuber、教育関係者、ポッドキャスター、ブランドチャネル向けに開発され、品質を損なわず高速な納期対応が必要な方に最適です。mp4、mov、avi、webm、mkv 形式に対応しています。

by LeoYeAI
汎用音声・動画・メディア⭐ リポ 27,990

video

ユーザーがAIツールやプログラマティックフレームワークを使用してビデオコンテンツを作成、生成、または制作したい場合に使用します。また、ユーザーが「ビデオ制作」「AIビデオ」「Remotion」「Hyperframes」「HeyGen」「Synthesia」「Veo」「Runway」「Kling」「Pika」「ビデオ生成」「AIアバター」「トーキングヘッドビデオ」「プログラマティックビデオ」「ビデオテンプレート」「解説ビデオ」「プロダクトデモビデオ」「ビデオパイプライン」または「ビデオを作ってほしい」と言及している場合にも使用します。ビデオ作成、生成、制作のワークフロー全般に対応できます。ビデオコンテンツの戦略や投稿内容については「social-content」を、有料ビデオ広告クリエイティブについては「ad-creative」をご参照ください。

by coreyhaines31
汎用音声・動画・メディア⭐ リポ 317

clipify

ビデオから最も面白い瞬間を検出し、スタンドアロンクリップとしてカットできます。オプションで16:9から9:16へのリフォーマット(フェイスパンまたはスプリットスクリーン)に対応し、Opus風の単語ごとのキャプションを焼き込みます。ユーザーが「clipify」「このビデオからクリップをカットして」「これからショーツを作って」「面白い瞬間を見つけて」「9:16にリフレーミングして」「縦型クリップ」と言及したり、ビデオファイルパスを貼り付けてSNS対応のクリップを求める場合に使用します。

by louisedesadeleer
OpenAI音声・動画・メディア⭐ リポ 18,898

speech

ユーザーが音声生成、ナレーション、アクセシビリティ対応の読み上げ、音声プロンプト、またはOpenAI Audio APIによるバッチ音声生成をリクエストした場合に使用します。組み込みボイスを備えたバンドルCLI(`scripts/text_to_speech.py`)を実行でき、ライブ呼び出しには`OPENAI_API_KEY`が必要です。カスタムボイスの作成には対応していません。

by openai
汎用音声・動画・メディア⭐ リポ 2,743

depth-estimation

Depth Anything v2を使用したリアルタイム深度マップのプライバシー変換(CoreML + PyTorch対応) このスキルは、Depth Anything v2モデルを活用して、画像やビデオから取得した深度情報をリアルタイムで処理し、プライバシーを保護しながら変換します。CoreMLとPyTorchの両方に対応しており、エッジデバイスでの高速処理とクラウド環境での柔軟な運用が可能です。顔認識データのぼかしや背景の匿名化など、プライバシー関連の処理を効率的に実行できます。

by SharpAI
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: marswaveai · marswaveai/skills · ライセンス: MIT