sag
ElevenLabsの音声合成をmacOSの`say`コマンドのような操作感で利用できるスキルです。テキストを自然な音声に変換したいときに使用します。
description の原文を見る
ElevenLabs text-to-speech with mac-style say UX.
SKILL.md 本文
sag
sag を使用して ElevenLabs TTS でローカル再生を行います。
APIキー(必須)
ELEVENLABS_API_KEY(推奨)SAG_API_KEYも CLI でサポート
クイックスタート
sag "Hello there"sag speak -v "Roger" "Hello"sag voicessag prompting(モデル固有のヒント)
モデルについて
- デフォルト:
eleven_v3(表現力豊か) - 安定版:
eleven_multilingual_v2 - 高速:
eleven_flash_v2_5
発音とデリバリールール
- 最初の修正:スペルを修正(例:"key-note")、ハイフンを追加、大文字小文字を調整します。
- 数字/単位/URL:
--normalize autoを使用(名前に悪影響を与える場合はoff)。 - 言語バイアス:
--lang en|de|fr|...で正規化をガイドします。 - v3:SSML
<break>はサポートされていません。[pause]、[short pause]、[long pause]を使用してください。 - v2/v2.5:SSML
<break time="1.5s" />がサポートされています。<phoneme>はsagでは公開されていません。
v3 オーディオタグ(行頭に配置)
[whispers]、[shouts]、[sings][laughs]、[starts laughing]、[sighs]、[exhales][sarcastic]、[curious]、[excited]、[crying]、[mischievously]- 例:
sag "[whispers] keep this quiet. [short pause] ok?"
ボイスデフォルト
ELEVENLABS_VOICE_IDまたはSAG_VOICE_ID
長時間の出力の前にボイスとスピーカーを確認してください。
チャットボイスレスポンス
ユーザーが「ボイス」レスポンス(例:"crazy scientist voice"、"explain in voice")をリクエストした場合、オーディオを生成して送信します:
# Generate audio file
sag -v Clawd -o /tmp/voice-reply.mp3 "Your message here"
# Then include in reply:
# MEDIA:/tmp/voice-reply.mp3
ボイスキャラクターのヒント:
- 狂ったような科学者:
[excited]タグを使用し、劇的な一時停止[short pause]を入れ、強度を変える - 落ち着いた感じ:
[whispers]を使用するか、ペースをゆっくりにする - ドラマチック:
[sings]または[shouts]を控えめに使用する
Clawd のデフォルトボイス:lj2rcrvANS3gaWWnczSX(または単に -v Clawd)
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- steipete
- リポジトリ
- steipete/clawdis
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/steipete/clawdis / ライセンス: MIT
関連スキル
nano-banana-2
inference.sh CLIを通じてGoogle Gemini 3.1 Flash Image Preview(Nano Banana 2)で画像を生成します。テキストから画像を生成する機能、画像編集、最大14枚の複数画像入力、Google Searchグラウンディング機能に対応しています。トリガーワード:「nano banana 2」「nanobanana 2」「gemini 3.1 flash image」「gemini 3 1 flash image preview」「google image generation」
octocode-slides
洗練されたマルチファイル形式のHTMLプレゼンテーションを生成します。6段階のフロー(概要 → リサーチ → アウトライン → デザイン → 実装 → レビュー)で構成されています。各スライドは独立したHTMLファイルとなり、iframeで読み込まれます。「スライドを作成してほしい」「プレゼンテーションを作ってほしい」「HTMLスライドを生成してほしい」「デックを構築してほしい」といった依頼や、ノート・ドキュメント・コードを洗練されたプレゼンテーションに変換する際に使用できます。
gpt-image2-ppt
OpenAIのgpt-image-2を使用して、視覚的に優れたPPTスライドを生成します。Spatial Glass、Tech Blue、Editorial Monoなど10種類のキュレーション済みスタイルに対応し、ユーザーが提供したPPTXファイルを模倣するテンプレートクローンモードも搭載しています。HTMLビューアと16:9形式のPPTXファイルを出力します。プレゼンテーション、スライド、ピッチデック、投資家向けPPT、雑誌風PPTの作成依頼などで活用してください。
nano-banana
Nano Banana PRO(Gemini 3 Pro Image)およびNano Banana(Gemini 2.5 Flash Image)を使用したAI画像生成機能です。以下の場合に活用できます:(1)テキストプロンプトからの画像生成、(2)既存画像の編集、(3)インフォグラフィックス、ロゴ、商品写真、ステッカーなどのプロフェッショナルなビジュアルアセット制作、(4)複数画像での人物キャラクターの一貫性保持、(5)正確なテキスト描画を含む画像生成、(6)AI生成ビジュアルが必要なあらゆるタスク。「画像を生成」「画像を作成」「写真を作る」「ロゴをデザイン」「インフォグラフィックスを作成」「AI画像」「nano banana」またはその他の画像生成リクエストをトリガーとして機能します。
oiloil-ui-ux-guide
モダンでクリーンなUI/UXガイダンス・レビュースキルです。新機能や既存システム(Webアプリ)に対して、実行可能なUI/UX改善提案、デザイン原則、デザインレビューチェックリストが必要な場合に活用できます。CRAP(コントラスト・反復・配置・近接)をベースに、タスクファーストなUX、情報設計、フィードバック・システムステータス、一貫性、affordances、エラー防止・復旧、認知負荷を重視します。モダンミニマルスタイル(クリーン・余白・タイポグラフィ主導)を強制し、不要なテキストを削減、アイコンとしての絵文字を禁止し、統一されたアイコンセットから直感的で洗練されたアイコンを推奨します。
axiom-hig-ref
Apple Human Interface Guidelines リファレンス — 色(セマンティックカラー、カスタムカラー、パターン)、背景(マテリアル階層、ダイナミック背景)、タイポグラフィ(標準スタイル、カスタムフォント、Dynamic Type)、SF Symbols(レンダリングモード、色、多言語対応)、ダークモード、アクセシビリティ、プラットフォーム固有の考慮事項を網羅したガイドラインです。