summarize
URLやポッドキャスト、ローカルファイルのテキストやトランスクリプトを要約・抽出できます。YouTubeなどの動画ファイルの文字起こしが必要な場合にも対応します。
description の原文を見る
Summarize or extract text/transcripts from URLs, podcasts, and local files (great fallback for “transcribe this YouTube/video”).
SKILL.md 本文
Summarize
URL、ローカルファイル、YouTube リンクを要約するための高速 CLI ツール。
使用するタイミング(トリガーフレーズ)
ユーザーが以下のいずれかを尋ねた場合は、すぐにこのスキルを使用してください:
- 「summarize.sh を使ってほしい」
- 「このリンク/ビデオについて教えてほしい」
- 「この URL/記事を要約してほしい」
- 「この YouTube/ビデオを文字起こししてほしい」(ベストエフォート方式の文字起こし抽出。
yt-dlpは不要)
クイックスタート
summarize "https://example.com" --model google/gemini-3-flash-preview
summarize "/path/to/file.pdf" --model google/gemini-3-flash-preview
summarize "https://youtu.be/dQw4w9WgXcQ" --youtube auto
YouTube:要約 vs 文字起こし
ベストエフォート方式の文字起こし(URL のみ):
summarize "https://youtu.be/dQw4w9WgXcQ" --youtube auto --extract-only
ユーザーが文字起こしをリクエストしたが、内容が膨大な場合は、まず簡潔な要約を返し、どのセクション/時間範囲を詳しく知りたいのか尋ねてください。
モデル + API キー
選択したプロバイダーの API キーを設定してください:
- OpenAI:
OPENAI_API_KEY - Anthropic:
ANTHROPIC_API_KEY - xAI:
XAI_API_KEY - Google:
GEMINI_API_KEY(別名:GOOGLE_GENERATIVE_AI_API_KEY、GOOGLE_API_KEY)
キーが設定されていない場合、デフォルトモデルは google/gemini-3-flash-preview です。
便利なフラグ
--length short|medium|long|xl|xxl|<chars>--max-output-tokens <count>--extract-only(URL のみ)--json(機械可読形式)--firecrawl auto|off|always(フォールバック抽出)--youtube auto(APIFY_API_TOKENが設定されている場合は Apify フォールバック)
設定
オプションの設定ファイル:~/.summarize/config.json
{ "model": "openai/gpt-5.2" }
オプションのサービス:
FIRECRAWL_API_KEY(ブロックされたサイト向け)APIFY_API_TOKEN(YouTube フォールバック向け)
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- EthanAlgoX
- リポジトリ
- EthanAlgoX/MarketBot
- ライセンス
- MIT
- 最終更新
- 2026/3/29
Source: https://github.com/EthanAlgoX/MarketBot / ライセンス: MIT
関連スキル
listenhub
あらゆることを説明できます。アイデアをポッドキャスト、解説動画、または音声ナレーションに変換します。 ユーザーが「ポッドキャストを作りたい」「解説動画を作成したい」「これを読み上げてほしい」「画像を生成したい」、または知識を音声・映像形式で共有したいときに使用します。トピックの説明、YouTubeリンク、記事URL、プレーンテキスト、画像プロンプトに対応しています。
best-youtube-video-editor
ClawHub上の「best-youtube-video-editor」スキルは、YouTube クリエイターのコンテンツ制作を革新します。タイムラインや複雑なソフトウェアを必要とせず、会話形式のAI駆動型ビデオ編集が可能です。無音部分のカット、チャプターマーカーの追加、字幕の挿入、ペーシングの調整、エクスポートの最適化——すべてが自然言語の指示で実現します。初回使用時には NemoVideo API を通じて認証情報を自動設定するため、有効化後数秒で編集を開始できます。YouTuber、教育関係者、ポッドキャスター、ブランドチャネル向けに開発され、品質を損なわず高速な納期対応が必要な方に最適です。mp4、mov、avi、webm、mkv 形式に対応しています。
video
ユーザーがAIツールやプログラマティックフレームワークを使用してビデオコンテンツを作成、生成、または制作したい場合に使用します。また、ユーザーが「ビデオ制作」「AIビデオ」「Remotion」「Hyperframes」「HeyGen」「Synthesia」「Veo」「Runway」「Kling」「Pika」「ビデオ生成」「AIアバター」「トーキングヘッドビデオ」「プログラマティックビデオ」「ビデオテンプレート」「解説ビデオ」「プロダクトデモビデオ」「ビデオパイプライン」または「ビデオを作ってほしい」と言及している場合にも使用します。ビデオ作成、生成、制作のワークフロー全般に対応できます。ビデオコンテンツの戦略や投稿内容については「social-content」を、有料ビデオ広告クリエイティブについては「ad-creative」をご参照ください。
clipify
ビデオから最も面白い瞬間を検出し、スタンドアロンクリップとしてカットできます。オプションで16:9から9:16へのリフォーマット(フェイスパンまたはスプリットスクリーン)に対応し、Opus風の単語ごとのキャプションを焼き込みます。ユーザーが「clipify」「このビデオからクリップをカットして」「これからショーツを作って」「面白い瞬間を見つけて」「9:16にリフレーミングして」「縦型クリップ」と言及したり、ビデオファイルパスを貼り付けてSNS対応のクリップを求める場合に使用します。
speech
ユーザーが音声生成、ナレーション、アクセシビリティ対応の読み上げ、音声プロンプト、またはOpenAI Audio APIによるバッチ音声生成をリクエストした場合に使用します。組み込みボイスを備えたバンドルCLI(`scripts/text_to_speech.py`)を実行でき、ライブ呼び出しには`OPENAI_API_KEY`が必要です。カスタムボイスの作成には対応していません。
depth-estimation
Depth Anything v2を使用したリアルタイム深度マップのプライバシー変換(CoreML + PyTorch対応) このスキルは、Depth Anything v2モデルを活用して、画像やビデオから取得した深度情報をリアルタイムで処理し、プライバシーを保護しながら変換します。CoreMLとPyTorchの両方に対応しており、エッジデバイスでの高速処理とクラウド環境での柔軟な運用が可能です。顔認識データのぼかしや背景の匿名化など、プライバシー関連の処理を効率的に実行できます。